Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)

  • 2019.05.14
  • AI
Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)

1.Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)まとめ

・Open Images V5の検証データセットとテストデータセットは完全に人力で作成されている
・従来のポリゴン型アノテーションと比較して複雑な物体の細部まで境界を捉える事ができている
・Open Images Challenge 2019では新たにインスタンスセグメンテーション競技が加わった

2.Open Images Challenge 2019とは?

以下、ai.googleblog.comより「Announcing Open Images V5 and the ICCV 2019 Open Images Challenge」の意訳です。元記事は2019年5月8日、Vittorio Ferrariさんによる投稿です。

Open Images V5のセグメンテーションマスクは完璧に近いもので、複雑な物体の細部まで境界を捉えています。(例:刺々しい輪郭を持つ花や人工物の繊細な構造など)。私たちのトレーニングと検証用とテスト用アノテーションは、他のほとんどの既存データセットが提供しているポリゴン型アノテーションよりも正確なオブジェクト境界を提供します。


完全に人力で設定されたOpen Images V5の検証データセットとテストデータセットのサンプルマスク。左上から:「thistle flowers」 by sophie「still life with ax」 by liz west。「Fischkutter KOŁ-180 in Kolobrzeg (PL)」 by zeesenboot. 全ての画像はCCライセンスVersion2.0の元で使用しています。

マスクに加えて、我々はまた640万の新たな人間が目で検証したラベルを画像に追加しました。カテゴリ総数は約20,000、合計3650万になりました。

最後に、検証セットとテストセットの600のオブジェクトカテゴリについて、画像一枚辺りの注釈数を増やし、トレーニングセットの注釈密度と一致するように40万以上の境界ボックスを追加しました。これにより、物体検出モデルのより正確な評価が保証されます。

Open Images Challenge 2019
Open Images V5のリリースと併せて、2019年コンピュータビジョン国際会議(ICCV 2019)で第2回Open Images Challengeも開催されます。この課題では、上記のデータに基づいて新しいインスタンスセグメンテーション競技が開催されます。

さらに、2018年版と同様に、大規模なオブジェクト検出競技(500のカテゴリに分類される12.2万のトレーニング用境界ボックス)、特定の関係にあるオブジェクトの対を検出するための視覚的関係検出競技(37.5万のトレーニングサンプルを有する329の三つ組の関連性(relationship triplets)、例えば「女性 演奏 ギター」または「ビール 上 テーブル」)も開催されます。

注釈を含む全てのトレーニングセットは現在既に利用可能です。テストセットは2018年のチャレンジと同じ10万の画像を擁しており、Kaggleで2019年6月3日に公開されるでしょう。評価サーバーは、6月3日にオブジェクト検出および視覚的関係の追跡用に、7月1日にインスタンスセグメンテーション追跡用にオープンします。 結果提出の締め切りは2019年10月1日です。

非常に大きく多様なトレーニングセットが、より高度なインスタンスセグメンテーションモデルの研究に役立つことを願っています。私たちが提供する非常に正確なグラウンドトゥルースマスクは、出力セグメンテーションの精緻な改善をもたらすでしょう。それは、正確な境界を提供する、より高品質のモデルの開発を奨励するでしょう。最後に、画像分類、オブジェクト検出、視覚的関係検出、およびインスタンスセグメンテーションのための統一された注釈を持つ単一のデータセットを持つことで、研究者はこれらのタスクを共同で研究し、現実世界の風景をAIが真に理解するための進歩を刺激するでしょう。

 

3.Open Images V5とICCV 2019 Open Images Challengeの発表(2/2)関連リンク

1)ai.googleblog.com
Announcing Open Images V5 and the ICCV 2019 Open Images Challenge

2)arxiv.org
Large-scale interactive object segmentation with human annotators

3)storage.googleapis.com
Open Images Dataset V5 + Extensions