fine-grained(きめ細かい)画像認識の困難さ

  • 2018.03.23
  • AI
fine-grained(きめ細かい)画像認識の困難さ

1.fine-grained(きめ細かい)画像認識の困難さまとめ

・人工知能による画像認識は2つのチャレンジングな課題がある
・instance-levelとfine-grainedな画像認識である
・fine-grained(きめ細かい)画像認識はコンテストが開催中

2.人工知能による画像認識に残された2つの課題

ディープラーニングにより、コンピュータの画像認識能力は劇的に向上し、自動車運転者による歩行者探知やヘッドセットを必要としないヴァーチャルリアルティーなど、実践的なアプリケーションが作れるようになった。

しかし、画像認識には2つの挑戦的な課題がまだ残っている。

1)実例レベルの画像認識(instance-level recognition)
実例レベルの画像認識(instance-level recognition)は、以前、「Googleがランドマーク認識のためのオープンデータを公開」で書いたが、ランドマーク(富士山や東京タワーなど観光名所になるような地域を特徴づける建造物の事)などの「ある特定の実例」を認識する事。例えば、お相撲さんの集合写真から「この人は貴乃花です」と認識するのがinstance-level recognition。

2)きめ細かいレベルの画像認識(fine-grained recognition)
きめ細かいレベルの画像認識(fine-grained recognition)とは、動物や植物の種別、車やバイクのモデル、建築物の様式、などを見分ける事。例えば、芸能人の集合写真から「この人は歌手です。この人はコメディアンです」等々の分類をするのがfine-grained recognition。

例えば、上記写真の左に「亀」が写っている事は人間でも人工知能でも比較的容易に認識できる。しかし、fine-grained recognitionではこれが「アカミミガメ」である事を認識する事が求められる。

信頼できる学習用画像データが比較的少なく、数もロングテール状に偏っている事もfine-grained recognitionを困難な課題にしている。

1のクーパーハイタカは2017年データでも2018年データでも1000近いが、4のアイランドフォックスは2018年データであっても10枚程度しか存在しない。

CVPR 2018(コンピュータビジョンとパターン認識の国際会議)で、FGVC5(5th International Workshop on Fine Grained Visual Categorization)が開催予定で、その中できめ細かいレベルの画像分類コンテストが開催される予定

・2018 iNaturalist Challenge (iNat-2018)
動植物や菌類の8000に分類された学習用写真45万が対象
・2018 iMaterialist Challenge
家具やファッションを対象
・FGVCx
その他、食品や現代アートを対象

3.fine-grained(きめ細かい)画像認識の困難さ関連リンク

1)research.googleblog.com
Introducing the iNaturalist 2018 Challenge

2)kaggle.com
iNaturalist Challenge at FGVC5