GoogleのAI研究チームの2017年成果オープンデータ他編

１．GoogleのAI研究チームの2017年成果オープンデータ他編まとめ

・機械学習に利用可能な動画、音声、サウンド、切出しのための境界情報を公開
・機械学習を用いたプライバシーとセキュリティ、基礎研究と情報公開
・機械学習用ツールTensorFlowの改良と開発者コミュニティの育成、独自ハードウェアTPUの進化

２．機械学習のために自由に利用可能なオープンデータセット

・YouTube-8M：4716種類に分類された700万以上のYouTube動画
・YouTube-Bounding Boxes：21万本のYouTube動画に切り出ししやすいように500万の境界情報
・Speech Commands Datase：GoやStopなど短い命令文を録音したものを数千人分
・AudioSet：200万本のYouTube動画からの527種類のサウンド
・Atomic Visual Actions(AVA)：57000の動画に関連付けされた21万のアクション
・Open Images：6000種類に分類された900万枚の画像
・Open Images with Bounding Boxes：600種類の画像に切り出ししやすいように120万枚の境界情報

３．プライバシーとセキュリティ、基礎研究と情報公開

プライバシーは機械学習を使ってもっと細かくプライバシー保護を提供する方法など。

セキュリティとは悪意あるデータに対する機械学習の備えも含む。例えば、黒人をゴリラと人工知能が誤認識した理由は、悪意ある人が黒人の写真にゴリラと名前を付けると、それを見た人工知能が間違った知識を覚えてしまうため。そういった悪意ある入力データに対する備えなどの論文。

基礎研究はディープラーニングが何故、従来のニューラルネットワークより優れた成果を出せるの数学的に説明できない事から、どうしてディープラーニングが優れた成果を出すのか？どんな時に動かないのか？どのような過程でディープラーニングの学習が行われるかを解明しようとする試みなど。

情報公開は機械学習専門のジャーナル「Distill」の立ち上げなど。

４．TensorFlowとTPU

TensorFlow v1.4が2017年11月にリリース。
開発者向けイベントをGoogle本社で実施。現地参加者が450人、動画配信を6500人が視聴。第二世代TPUが2017年5月のGoogle I/O 2017で発表、推論だけでなく学習も可能になり性能もアップ。

１．GoogleのAI研究チームの2017年成果 オープンデータ他編まとめ

２．機械学習のために自由に利用可能なオープンデータセット

３．プライバシーとセキュリティ、基礎研究と情報公開

４．TensorFlowとTPU

コメント

１．GoogleのAI研究チームの2017年成果オープンデータ他編まとめ