音声認識

1/11ページ

NeurIPS 2019におけるGoogleの存在感

AI

1.NeurIPS 2019におけるGoogleの存在感まとめ ・最大の機械学習学会である第33回Neural Information Processing Systemsが開催 ・Googleからは500名以上の研究者が貢献及び学習のために参加 ・Accepted Papersが124本、ワークショップが31本、チュートリアルが1本 2.NeurIPS 2019におけるGoogleの参加人数 以 […]

RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(1/3)

AI

1.RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(1/3)まとめ ・ユーザーニーズに最適に対応するためにユーザーと対話を行う推薦システム、CIRが有望視されている ・しかし、CIRはユーザと対話するアルゴリズムとモデルの開発が困難な事から制限されている ・この問題の解決には強化学習が適しているが推薦システム用の汎用シミュレーション環境は存在しない 2.RecSi […]

Live Caption:オンデバイスで音声コンテンツに字幕を付与(2/2)

AI

1.Live Caption:オンデバイスで音声コンテンツに字幕を付与(2/2)まとめ ・Live Captionを長時間駆動させる事を可能にするために様々な工夫が行われている ・例えばASR用のRNN-Tエンジンは電力消費が激しいので発話が確認された最中のみ実行される ・今後は複数言語の話者が混在する状況での認識精度と一貫性の改善に力を入れていく予定 2.Live Captionに使われている技 […]

Live Caption:オンデバイスで音声コンテンツに字幕を付与(1/2)

AI

1.Live Caption:オンデバイスで音声コンテンツに字幕を付与(1/2)まとめ ・音声コンテンツに字幕を付ける新しいAndroidの機能、Live Captionが発表された ・現在Pixel 4およびPixel 4 XLで利用可能、今後順次Pixel 3や他のAndroidデバイスでも利用可能になる予定 ・メディアの再生中にボリュームコントロールをシングルタップするとLive Capti […]

M4:超多言語、大規模ニューラル機械翻訳(1/3)

AI

1.M4:超多言語、大規模ニューラル機械翻訳(1/3)まとめ ・機械翻訳システムの品質は飛躍的に進歩しているが品質は学習用データの量に依存している ・学習用データが少ない言語では学習用データが多い言語ほど品質を向上できていない問題がある ・ある言語から学習した結果は他言語の翻訳に役立つはずと云う閃きを元に進めている研究がM4 2.M4とは? 以下、ai.googleblog.comより「Explo […]

1 11