1.画像データセットに多様性を追加するOpen Images Extendedまとめ
・偏っている画像データセットから影響を受けずに画像分類を行うコンペが終了
・コンペは終了したが画像データセットに多様性を補完するOpen Images Extendedの収集もスタート
・スマホで撮った写真や自分が権利を持つデータセットを寄贈する事で貢献する事が可能
2.Open Images Extendedとは?
以下、ai.googleblog.comより「Adding Diversity to Images with Open Images Extended」の意訳です。元記事は2018年12月7日、 Anurag BatraさんとParker Barnesさんによる投稿です。記事内で言及しているコンペは「偏っている画像データセットから影響を受けずに画像分類を行うコンペの開催」で紹介したコンペです。2020年2月追記:Open Imagesの最新は現在V6です。
先日、私達はNeurIPS 2018 Competition Trackの一部でInclusive Images Kaggleコンペティションを実施しました。このコンペは学習データに存在する地理的な歪み(例えば結婚式に白いウェディングドレスを着るのは欧米の慣習であり、民族衣装を着る地域も存在するが現在の人工知能は民族衣装を着た人を見ても結婚式と認識できない)の影響を調査し、機械学習モデルのパフォーマンスを向上し、より包括的なモデルを開発するイノベーションを促進することを目標としていました。コンペは終結しましたが、より多様なデータセットを構築するための広範な動きは始まったばかりです。
本日、GoogleのOpen Imagesデータセットの新しい分派であるOpen Images Extendedを発表します。これは、グローバルな多様性をよりよく表現する追加の画像や注釈を含み、画像データセットの補完的なコレクションになる事を意図しています。私たちが追加した最初の画像データセットはクラウドソースによる拡張で、世界中のクラウドソーシングアプリケーションユーザーから寄贈された478,000以上の画像が含まれています。
クラウドソーシングによって実現したOpen Images Extended
Open Imagesに多大な地理的多様性をもたらすために、クラウドソーシングアプリケーションユーザーの世界的なコミュニティが、研究者や開発者にOpen Images Extendedデータセットの一部として写真を提供できるようにしました。これらの画像の大部分はインドからのものですが、中東、アフリカ、中南米からの写真も含まれます。
含まれる画像は、家庭用品、植物や動物、食物、様々な職業の人々(プライバシーを保護するために全ての顔はぼやけています)などの主要カテゴリに焦点を当てています。データセットの構成に関する詳細情報は、下部のリンクにあります。
インドやシンガポールの写真はCrowdsourceアプリユーザが貢献してくれました。
貴方もやってみませんか?
これは長い旅路のはじめの一歩です。包括的な機械学習製品を開発するためには、トレーニングデータは様々な次元でグローバルな多様性を表現できている必要があります。そのため、私達は、あなた自身の故郷と地域社会の画像を提供し、グローバルコミュニティの一員としてOpen Images Extendedデータセットの拡大を支援する活動に貴方をご招待します。クラウドソーシングAndroidアプリをダウンロードしてあなたのスマートフォンで撮影した画像を投稿するか、貴方が権利を持っている画像データ集をopen-imagesデータセットに追加する事に興味をお持ちの場合はGoogleまでご連絡ください。
謝辞
この度のOpen Images Extendedの公開は、以下の皆さん、及びリストに載せられなかった沢山の皆さんのご尽力によって成し遂げられました。(以下は、ラストネームのアルファベット順です)James Atwood, Pallavi Baljekar, Peggy Chi, Tulsee Doshi, Tom Duerig, Vittorio Ferrari, Akshay Gaur, Victor Gomes, Yoni Halpern, Gursheesh Kaur, Mahima Pushkarna, Jigyasa Saxena, D. Sculley, Richa Singh, Rachelle Summers.
3.画像データセットに多様性を追加するOpen Images Extended関連リンク
1)ai.googleblog.com
Adding Diversity to Images with Open Images Extended
2)ai.google
Open Images Extended – Crowdsourced(PDF)
コメント