Open Images V4とOpen Images Challenge 2018の紹介

１．Open Images V4とOpen Images Challenge 2018の紹介

・Googleが物体認識学習に有用なOpen Images V4を公開
・Open Images V4は画像内に物体認識用の境界ボックスが含まれる
・同時に賞金総額5万ドルでOpen Images Challenge 2018も開催

２．Open Imagesとは？

以下、ai.googleblog.comより「Announcing Open Images V4 and the ECCV 2018 Open Images Challenge」の超意訳です。元記事の投稿は2018年4月30日、Vittorio Ferrariさんによる投稿です。2020年2月追記：Open Imagesの最新は現在V6です。

Googleは2016年9月に900万に及ぶ機械学習に利用可能な画像データ、Open Imagesを公開した。Oepn Imagesは6000以上のカテゴリに分類され、各画像の内容を説明するラベルも付与されている大変使いやすいデータであった。最初のリリースをした後もGoogleは引き続きデータセットにデータ追加や内容の精査を行い、コンピュータによる画像認識を行うコミュニティにとって有用なデータであるように努めた。

本日、GoogleはOpen Images V4を喜びと共に発表する。Open Images V4は190万を超える画像が600カテゴリに分類され、画像内に1540万の境界ボックス（画像内の物体の位置を特定するための四角形の境界情報）が含まれる。Open Images V4は、境界ボックスにより物体位置が特定されているため、物体認識学習用途に最適且つ過去最大のデータセットである。それぞれの境界ボックスは精度と一貫性を保証するために、専門の注釈者が手動で描いている。各画像は様々な物体が写った複雑なシーンであり、平均して1画像に8物体が含まれる。

Open Images V4と当時に、Googleは、画像認識のコンペ、Open Images Challengeを来る2018 ヨーロピアンカンファレンスオンコンピューターヴィジョン(ECCV 2018)にて開催する。Open Images Challengeは従来のPASCAL VOC、ImageNet、COCOの画像認識コンペの伝統に従っているが、前代未聞の規模となる。

・170万の訓練用画像が500カテゴリに分類され1220万の境界ボックスが付与されている
・「ソフト帽」や「雪だるま」など、以前よりも幅広いカテゴリから物体検出が求められる
・主要課題である物体認識に加え、物体同士の関係を検出する課題も含まれる。例えば画像から「ギターを弾いている女性」を認識する等

人工知能学習用の訓練用画像セットは既に公開されている。学習済みモデルの性能を確認するためのテスト用画像は7月1日にKaggleで公開される。最終締め切り日は2018年9月1日になる。コンペデータには含まれないが、Open Images V4は、画像を説明する3,010万のラベルを用いて19,794カテゴリに分類されており、このラベルは人が目で確認済である。また、データセットには世界中の何万人ものソーシャルワーカーが付与した5.5Mの画像を説明するためのラベルも含まれている。

Open Images Challenge 2018はGoogleがスポンサーで賞金総額$5万ドル（日本円で540万円）で開催されています。