人工知能/機械学習

モデル

強化学習を使って量子計算を改善(1/2)

1.強化学習を使って量子計算を改善(1/2)まとめ ・量子コンピュータの構成要素である量子ビットは周囲の微量なエネルギーの影響を受ける ・更には制御用ツールによってもたらされる干渉などの影響も受けて誤差が拡大してしまう ・強化学習を使用して...
モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)まとめ ・多言語モデルはトレーニングセット内に頻繁に表れる言語の特徴表現からより多くの影響を受ける ・利用可能なデータが多い言語から多くの影響を受けてしまうので言語情報を入...
モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)まとめ ・音声データからニューラルネットワークが学習した「知識」の多くは他の言語に流用できる ・この洞察を元に利用可能な音声データが多い言語で学習した結果をマイナーな言語に...
インフラ

機械学習を使った洪水予測の仕組み(1/3)

1.機械学習を使った洪水予測の仕組み(1/3)まとめ ・AIの力でより良い社会の実現を目指すGoogleの会社方針の一環として、洪水予測に取り組んでいる ・まずは様々な河川条件をシミュレートする水理モデルの3D視覚化を行った ・次にリアルタ...
モデル

Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(3/3)

1.Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(3/3)まとめ ・スパイクネットワークが数字の特徴をどのように学習したかも視覚化できた ・他にも生物にヒントを得た様々なニューラルネットワークを研究中 ・人...
モデル

Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(2/3)

1.Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(2/3)まとめ ・学習は従来の人工ニューラルネットワークと同様で逆伝播を使用して行われる ・スパイクネットワークはMNISTで97.96%の精度を達成し、こ...
基礎理論

Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(1/3)

1.Ihmehimmeli:スパイキングニューラルネットワークにおける時間的符号化(1/3)まとめ ・脳の仕組みは生物と同じ方法で情報を処理する効率的な人工ニューラルネットワークのヒントとなる ・しかし、情報の時間的符号化に繋がる可能性があ...
学会

Google at Interspeech 2019

1.Google at Interspeech 2019まとめ ・オーストリアで国際音声コミュニケーション協会の第20回年次会議(Interspeech 2019)が開催 ・GoogleはInterspeech 2019のゴールドスポンサー...
学習手法

ディープラーニングで皮膚疾患の鑑別診断を実現(3/3)

1.ディープラーニングで皮膚疾患の鑑別診断を実現(3/3)まとめ ・DLSの診断の際には多くの患部画像と病歴等のメタデータを用意する事が精度向上に結びつく ・メタデータが用意できない場合は画像のみで学習させた方が精度が向上する ・希少な症例...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(3/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(3/3)まとめ ・VideoBERTはベースラインとした完全教師付き学習のtop-5 accuracyに匹敵する精度を達成 ・VideoBERTはヴィジュアルトークン作成時に細...
モデル

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(2/3)まとめ ・ビデオ内の画像とテキストを組み合わせたクロスモーダルな文章を元にVideoBERTを学習させた ・VideoBERTを、料理、ガーデニング、車両修理など、10...
学習手法

VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)

1.VideoBERT:ビデオ内の画像と音声を組み合わせて学習(1/3)まとめ ・機械学習で動画内でどのような活動が行われているのかを認識させるのは困難 ・従来手法では細かくラベル付けされた大量の動画が必要になるがこれは高価 ・動画内の音声...