1.Googleがランドマーク認識のためのオープンデータを公開まとめ
・Googleがランドマーク認識のためのオープンデータを公開
・同時にランドマーク認識とランドマーク検索のコンテストも開催されている
・ランドマーク認識は通常の画像認識と比べて外見が変化しないなどの特徴がある
2.ランドマークとは何か?
ランドマークとは、例えば富士山や東京タワーなど、観光名所になるような地域を特徴づける建造物などの事。それらのランドマークを人工知能に認識させるための学習用画像データがGoogleによって公開され、コンテストが開催されている。
近年、人工知能による画像認識の進歩はすさまじい。一般的な「建物」とか「山」とか「猫」などを認識する段階を超え、より実例レベルの「エッフェル塔」「富士山」「ペルシャ猫」などの認識に挑戦する研究者が増えてきているが、学習用の画像データ不足が障害となっていた。
今回、Googleは、「ランドマーク認識」と「画像を使ったランドマーク検索」の2つのコンテストを賞金各$2500で開催し、そのコンテストで利用可能な学習用画像データとしてGoogle-Landmarksが公開されている。
Google-Landmarksには全世界の3万以上のランドマークの200万以上の画像が含まれる。また同時に、DELF(Deep Local Features)と言う、画像検索に有効とGoogleが信じる手法がオープンソースプログラムとして公開されている。
ランドマーク認識は通常の画像認識と異なった下記の特徴がある
・Google-Landmarksのような大きなデータセットであってもマイナーなランドマークは画像が少ない
・ランドマークは異なった画像であっても外見の変化が少ない。撮影場所や天気、写真の撮り方くらい。
従来の「猫の画像」などは様々なバリエーションが存在している。
現時点では「ランドマーク認識コンテスト」は107チーム、「画像を使ったランドマーク検索コンテスト」の方が60チームが参加している。
3.Googleがランドマーク認識のためのオープンデータを公開関連リンク
1)research.googleblog.com
Google-Landmarks: A New Dataset and Challenge for Landmark Recognition
2)arxiv.org
Large-Scale Image Retrieval with Attentive Deep Local Features
3)kaggle.com
Google Landmark Recognition Challenge
コメント