Kaggleのラクガキ認識コンペの紹介

１．Kaggleのラクガキ認識コンペの紹介まとめ

・Googleが「Quick, Draw!」のデータを使ったラクガキ認識コンペを開催
・「Quick, Draw!」はお題にそったラクガキを人間が書くゲーム
・「Quick, Draw!」で入力された手入力データから逆にお題を認識するコンペ

２．手書き認識の可能性

以下、ai.googleblog.comより「Introducing the Kaggle “Quick, Draw!” Doodle Recognition Challenge」の意訳です。

手書き入力の認識は、フリーハンド（つまり、汚い文字も綺麗な文字も混在している）の手書き入力から、一定の構造化パターンを認識することからはじまります。Google翻訳などのGoogle製品は、十分なトレーニングデータが利用できる事前定義済みのパターンで動作しますが、手書き入力も同様な技術を使用して手書き入力を認識させる事ができます。

手書きの入力をデジタル化する技術は、ユーザーの描画能力の向上や、仮想世界を構築するためにも使用できます。そして、手入力を人間とコンピュータの相互作用の手法として探求する興味深い研究の可能性と方向性も示しています。

「Quick, Draw!」ゲームでは、50メガの図面（100万回以上、人間によって描画されたもの）データセットが生成され、多くの異なる新しいプロジェクトに影響を与えました。

注）Quick, Draw!は、Googleが公開しているWebゲームです。「顔を書いてください」等々のお題が最初に与えられ、それを描いていくと人工知能が絵を認識して、「わかりました、円です」「わかりました、マッチです」とか、推測してくれて２０秒以内に当てさせるとクイズクリア、となります。

このエキサイティングな分野でさらなる研究を奨励するため、Kaggleで「Quick、Draw！」のデータを使ったコンペを開始しました。 Doodle Recognition Challengeは、参加者が既存の「Quick、Draw！」データセットを使ってより良い機械学習分類機の構築を競うコンペです。

重要な事は、トレーニングデータはゲームで実際にプレーヤーが入力した画像なので、画像は不完全であったり、ラベルと一致していない可能性がある事です。このコンペでは、品質の高くないデータから効果的に学習する事と、手動でラベル付けされた異なる精度のテストデータセットでうまく機能することが要求されます。

データセット
オリジナルの「Quick、Draw！」ゲームでは、プレイヤーは特定のカテゴリ（犬、牛、車など）の画像を描画するように求められます。プレイヤーは20秒間で描画を完了します。その時間内にコンピュータが正しく描画を認識すると、そのプレイヤーはポイントを獲得します。各ゲームは6つのランダムに選択されたカテゴリから構成されています。

ゲームの仕様により、Quick、Draw！のデータセットのラベルは次の４つのカテゴリに分類されます。