1.動画解析のためのオープンデータYouTube-8Mの第二版とコンペの開催まとめ
・Googleが動画学習のためのデータセットであるYouTube-8Mを更新
・説明ラベルの品質が大幅にアップし、619万の動画に3692種のラベルがついている
・kaggleでコンペも同時開催され上位5チームにミュンヘンのECCV’18の旅費支援
2.YouTube-8M ver2とは?
昨年、GoogleはKaggle(機械学習のコンテストを定期的に開催しているサイト)にて、 YouTube-8M Large-Scale Video Understanding Challengeを開催した。Kaggleでは、60カ国の946人から成る742チームがYouTube-8Mデータセット(2017版)を使用して、動画を正確に分類する人工知能の開発を競い合った。コンペの目的は、巨大スケールの動画データを正確に分類するのに役立つ様々な手法、表現学習、ノイズのまざったデータのモデリング、転移学習、およびドメイン適応アプローチの改善を加速することであった。コンテストに加え、GoogleはCVPR’17で提携ワークショップを開催し、優秀なパフォーマーと研究者を招待し、動画分類の研究を更に最先端に進めるためのアイデアを共有した。
この度、Googleは人工知能による動画理解を促進するこれらの取り組みを継続するため、YouTube-8Mデータセットを新たに更新し、Kaggleで新しいコンペを開催し、ECCV’18(2018 European Conference on Computer Vision)において第二回YouTube-8M Large-Scale Video Understanding Challengeワークショップを開催する。
YouTube-8Mデータセット(2018版)
YouTube-8M(2018年版)の主な改良点は、動画データに対するタイトル、説明、その他のメタデータ、注釈の品質の大幅に改善された事である。更新されたYouTube-8M(2018年版)には610万のURLが含まれている。3,692種類の単語でラベル付けされており、各動画には1つまたは複数のラベルが付いており、動画あたり平均3つのラベルが付いている。また、TensorFlowによる入門コードが用意されておりダウンロードして、すぐにYouTube-8M(2018年版)データセットを使った学習を開始させる事ができる。
第2回YouTube-8Mビデオ理解のチャレンジ
第2回YouTube-8Mビデオ理解のチャレンジでは、YouTube-8Mをトレーニングデータとして使用してオーディオビジュアルコンテンツ分類モデルを構築し、テストビデオの未知のサブセットにラベルを付ける事が参加者に求められる。昨年と違って、我々はモデルサイズに厳しい制限を課し、参加者が可能な限り多くのモデルを組み立てるのではなく、厳しいサイズ制限内で単一のモデルを追求する事が求める。各上位5チームには、ミュンヘンへのECCV’18への旅行を支援するために5,000ドルが授与される。詳細は、Kaggleの競技ページを参照。
第2回YouTube-8M大規模ビデオ理解ワークショップ
ECCV’18で開催されるワークショップは、著名な研究者による招待講演と、アイデアの交換を促進するために、実績のあるコンペ参加者によるプレゼンテーションで構成される。出席希望者は、上記の課題への参加を要約した論文を含め、YouTube-8Mデータセットに基づいて、研究、実験、またはアプリケーションを記述した論文を提出すること勧める。詳細については、ワークショップのページを参照の事。
新しいコンペとワークショップとともに、このデータセットの更新が大規模なビデオ理解の研究を進めていくことが私たちの希望である。もう一度参加してくれる事を願っている!
3.動画解析のためのオープンデータYouTube-8Mの第二版とコンペの開催感想
これはやっぱり、AutoAugmentを使って見てねって話でもあるのでしょうか。賞金は25000ドル、現在の参加Teamsは223でした。
4.動画解析のためのオープンデータYouTube-8Mの第二版とコンペの開催関連リンク
1)ai.googleblog.com
Announcing an updated YouTube-8M, and the 2nd YouTube-8M Large-Scale Video Understanding Challenge and Workshop
2)kaggle.com
The 2nd YouTube-8M Video Understanding Challenge
コメント