偏っている画像データセットから影響を受けずに画像分類を行うコンペの開催

１．偏っている画像データセットから影響を受けずに画像分類を行うコンペの開催まとめ

・データセットの収集先地域が偏っていても偏りのない分類を行えるかを競うコンペが開催
・ウェディングドレスとタキシードの写真で学習して民族衣装の結婚式を認識するハードなコンペ
・報酬は賞金$25,000とNIPSへの交通費、そしておそらくは輝けるキャリアの出発点

２．Inclusive Images Competition（包括的イメージコンペティション）とは？

以下、ai.googleblog.comよりIntroducing the Inclusive Images Competitionの意訳です。コンペ終了後に掲載された画像データセットに多様性を補完する事を目的とするOpen Images Extendedの収集に関する記事はこちら。

ImageNet、Open Images、Conceptual Captionsなどのオープンで大規模な画像データセットのリリースは、コンピュータビジョン分野の驚異的な進歩に繋がりました。これらのデータセットは、機械学習の有用なモデルを開発するために必要かつ重要な部分ですが、データを収集した方法の影響で地理的に偏っていることが判明しています。

データセットに含まれているデータは機械学習モデルの学習に影響を与えます。故に収集元が地理的に偏っている学習データを用いて学習したモデルは、収集先に含まれなかった地域の画像をうまく取り扱う事ができません。

例えば、以下の画像は、Open Imagesデータセットで訓練された標準的な画像分類人工知能の出力ですが、世界各地の結婚式の画像に関連するラベルを適切に分類できていません。

全て結婚式の写真（Googlerからの寄贈です）で、Open Imagesデータセットで訓練された画像分類人工知能によってラベル付けされています。人工知能が出力した単語は各画像の下に記載されます。一番右端の写真は「person(人)」、「people(人々)」とのみ認識されており「Wedding(結婚式)」として認識されていません

Googleは偏りのないデータセットの作成にも注力していますが、機械学習が不完全なデータセットを用いて学習しても、より堅牢に包括的な分類を出力する方法についても研究を進めていきたいと考えています。これは最先端の機械学習の限界を打ち破らなければ達成できない重要な研究上の課題です。

適切なソリューションは、一部のデータソースに偏りがある（つまり完全に包括的でない）場合でも、それを使って学習した機械学習モデルが包括的な出力をする事を助けるでしょう。

私達はこの取り組みを支援し、包括的な機械学習モデルの開発のさらなる進展を促すために、Kaggleでインクルーシブイメージコンテスト(包括的画像コンペ)を開催する事を嬉しく思います。

Neural Information Processing Systems Competition Trackのコンファレンスと共同開発したこのコンペでは、北アメリカとヨーロッパから主に収集された、大規模でマルチラベル(前述の結婚画像のように一画像に複数の説明文がついている事)で公共利用可能な画像分類データセットであるOpen Imagesを使用して人工知能をトレーニングさせ、Open Imagesと異なる地域から主にデータを収集したデータセットを用いて人工知能の性能が評価されます。

このコンペで使用するデータの3つの地理的分布。コンペ参加者は、主に北米および西ヨーロッパから収集された画像分類のためのデータセットであるOpen Imagesで自分が作成した人工知能を訓練します。モデルは、チャレンジステージ1で最初に評価され、最後にチャレンジステージ2で評価されます。それぞれ異なった地域から画像データが収集されています。このようにして、コンペに参加する人工知能モデルはトレーニングデータを超えて包括的に動作する能力をストレステストされます。

私達はCrowdsourceプロジェクトを利用してモデルを評価するための2つのデータセットを作成しました。Crowdsourceで世界中のボランティアに周囲の写真を寄稿してくれるように頼んだのです。Googleのグローバルコミュニティから寄付を得て作成されたこれらのデータセットが、今回のコンペのチャレンジングなストレステストに役立つことを願っています。また、コンペ後に、より包括的なデータを含めた大規模な画像データセットを公開し、より包括的な人工知能の開発を促進したいと考えています。

インクルーシブイメージコンペは9月5日に正式に利用可能なトレーニングデータと第1ステージのチャレンジデータセットで開始されました。結果の提出期限は11月5日（月）、テストセットは11月6日（火）にリリースされます。詳細とタイムラインについては、インクルーシブイメージコンテストのウェブサイトをご覧ください。

コンペの結果は、2018年のNIPSで発表され、トップランクの競技者には、会議に出席するための旅費が提供されます。より包括的でグローバルな画像分類アルゴリズムを開発するコミュニティの一員であることを楽しみにしています。

謝辞
インクルーシブイメージコンペティションとデータセットを可能にしてくれた、以下の人々に感謝します。James Atwood, Pallavi Baljekar, Parker Barnes, Anurag Batra, Eric Breck, Peggy Chi, Tulsee Doshi, Julia Elliott, Gursheesh Kour, Akshay Gaur, Yoni Halpern, Henry Jicha, Matthew Long, Jigyasa Saxena, Richa Singh and D. Sculley.

３．偏っている画像データセットから影響を受けずに画像分類を行うコンペの開催感想

一番右の画像が結婚式である事は、その地域に詳しい人でなければ人間でも判別できないでしょう。人間の目で見てもサンプルとして挙げられた画像全てに共通する項目は存在せず、敢えて特徴を上げるとしたら「男女のペア」「笑顔」「フォーマルな（あまり見慣れない）服装」「女性が白っぽい服装」くらいで、相当にチャレンジングな課題ですね。

ぱっと思いつくのは画像内に存在するオブジェクトを認識するネットワークと、画像に存在する複数のオブジェクトとキャプションの関係性を認識するネットワークの２段階構成でしょうか。