GoogleのAI研究チームの2017年成果 オープンデータ他編

入門/解説

1.GoogleのAI研究チームの2017年成果 オープンデータ他編まとめ

・機械学習に利用可能な動画、音声、サウンド、切出しのための境界情報を公開
・機械学習を用いたプライバシーとセキュリティ、基礎研究と情報公開
・機械学習用ツールTensorFlowの改良と開発者コミュニティの育成、独自ハードウェアTPUの進化

2.機械学習のために自由に利用可能なオープンデータセット

YouTube-8M:4716種類に分類された700万以上のYouTube動画
YouTube-Bounding Boxes:21万本のYouTube動画に切り出ししやすいように500万の境界情報
Speech Commands Datase:GoやStopなど短い命令文を録音したものを数千人分
AudioSet:200万本のYouTube動画からの527種類のサウンド
Atomic Visual Actions(AVA):57000の動画に関連付けされた21万のアクション
Open Images:6000種類に分類された900万枚の画像
Open Images with Bounding Boxes:600種類の画像に切り出ししやすいように120万枚の境界情報

3.プライバシーとセキュリティ、基礎研究と情報公開

プライバシーは機械学習を使ってもっと細かくプライバシー保護を提供する方法など。

セキュリティとは悪意あるデータに対する機械学習の備えも含む。例えば、黒人をゴリラと人工知能が誤認識した理由は、悪意ある人が黒人の写真にゴリラと名前を付けると、それを見た人工知能が間違った知識を覚えてしまうため。そういった悪意ある入力データに対する備えなどの論文。

基礎研究はディープラーニングが何故、従来のニューラルネットワークより優れた成果を出せるの数学的に説明できない事から、どうしてディープラーニングが優れた成果を出すのか?どんな時に動かないのか?どのような過程でディープラーニングの学習が行われるかを解明しようとする試みなど。

情報公開は機械学習専門のジャーナル「Distill」の立ち上げなど。

4.TensorFlowとTPU

TensorFlow v1.4が2017年11月にリリース。
開発者向けイベントをGoogle本社で実施。現地参加者が450人、動画配信を6500人が視聴。第二世代TPUが2017年5月のGoogle I/O 2017で発表、推論だけでなく学習も可能になり性能もアップ。

コメント

タイトルとURLをコピーしました