Kaggleのラクガキ認識コンペの紹介

入門/解説

1.Kaggleのラクガキ認識コンペの紹介まとめ

・Googleが「Quick, Draw!」のデータを使ったラクガキ認識コンペを開催
・「Quick, Draw!」はお題にそったラクガキを人間が書くゲーム
・「Quick, Draw!」で入力された手入力データから逆にお題を認識するコンペ

2.手書き認識の可能性

以下、ai.googleblog.comより「Introducing the Kaggle “Quick, Draw!” Doodle Recognition Challenge」の意訳です。

手書き入力の認識は、フリーハンド(つまり、汚い文字も綺麗な文字も混在している)の手書き入力から、一定の構造化パターンを認識することからはじまります。Google翻訳などのGoogle製品は、十分なトレーニングデータが利用できる事前定義済みのパターンで動作しますが、手書き入力も同様な技術を使用して手書き入力を認識させる事ができます。

手書きの入力をデジタル化する技術は、ユーザーの描画能力の向上や、仮想世界を構築するためにも使用できます。そして、手入力を人間とコンピュータの相互作用の手法として探求する興味深い研究の可能性と方向性も示しています。

「Quick, Draw!」ゲームでは、50メガの図面(100万回以上、人間によって描画されたもの)データセットが生成され、多くの異なる新しいプロジェクトに影響を与えました。

注)Quick, Draw!は、Googleが公開しているWebゲームです。「顔を書いてください」等々のお題が最初に与えられ、それを描いていくと人工知能が絵を認識して、「わかりました、円です」「わかりました、マッチです」とか、推測してくれて20秒以内に当てさせるとクイズクリア、となります。

このエキサイティングな分野でさらなる研究を奨励するため、Kaggleで「Quick、Draw!」のデータを使ったコンペを開始しました。 Doodle Recognition Challengeは、参加者が既存の「Quick、Draw!」データセットを使ってより良い機械学習分類機の構築を競うコンペです。

重要な事は、トレーニングデータはゲームで実際にプレーヤーが入力した画像なので、画像は不完全であったり、ラベルと一致していない可能性がある事です。このコンペでは、品質の高くないデータから効果的に学習する事と、手動でラベル付けされた異なる精度のテストデータセットでうまく機能することが要求されます。

データセット
オリジナルの「Quick、Draw!」ゲームでは、プレイヤーは特定のカテゴリ(犬、牛、車など)の画像を描画するように求められます。プレイヤーは20秒間で描画を完了します。その時間内にコンピュータが正しく描画を認識すると、そのプレイヤーはポイントを獲得します。各ゲームは6つのランダムに選択されたカテゴリから構成されています。


ゲームの仕様により、Quick、Draw!のデータセットのラベルは次の4つのカテゴリに分類されます。

「正解」
ユーザーがお題を描き、ユーザーが描画を完了した後にAIが正しくお題を認識したケースです。

「正解ではあるが不完全」
ユーザーがお題を描いている最中に、AIがそれを正しく認識しました。
不完全さは、ほとんど完全に描かれている物からほんの一部しか描かれていない物まで多種多様です。この種のカテゴリの数は、正しく認識されている画像の中では、かなり多いです。

「正解だが、正しく認識されていない」
プレイヤーは正しくお題を描いていますが、AIはそれを認識する事ができませんでした。一部のプレイヤーは、詳細を追加して正しく認識させようとしますし、他のプレーヤーはもう一度最初から書き直そうとします。

「不正解」
一部のプレイヤーは、単語を見たときに異なる概念を念頭に置いて絵を描いています。例えば、お題「seesaw(シーソー、公園にある遊具。ぎっこんばったんのアレ)」では、私たちはいくつかの「saw(ノコギリ)」の絵を発見しています。

上で説明したラベルに加えて、各図面は一連のストローク(書き順)として与えられます。各ストロークは一連のタッチポイントです。これらは簡単に画像としてレンダリングできますし、ストロークの順序と方向を使用すると、しばしば手書き認識機能を向上させる事ができます。

はじめるには?
以前はこのデータセットを使用したチュートリアルを公開しましたが、今度はコミュニティにこのアプローチや他のアプローチを使って、さらに高い分類精度を達成するよう呼びかけています。

コンペのウェブサイトにアクセスし、データの分析と視覚化ができる既存のカーネルを調べることから始めましょう。我々は、コミュニティがコンペで披露する新たな発想とオリジナルのGoogleの分類モデルがどれだけ改善されるかを楽しみにしており、そこから学んでいきたいと考えています。

謝辞
私たちと協力してくれた全ての人に感謝します。特にCreative LabチームのJonas Jongejan and Brenda Fogg、KaggleチームのJulia ElliottとWalter Reade、そして手書き認識チームの皆さんに感謝します。

3.Kaggleのラクガキ認識コンペの紹介関連リンク

1)ai.googleblog.com
Introducing the Kaggle “Quick, Draw!” Doodle Recognition Challenge

2)www.kaggle.com
Quick, Draw! Doodle Recognition Challenge

3)experiments.withgoogle.com
Quick, Draw!

コメント

タイトルとURLをコピーしました