音声認識

インフラ

Googleを巨大にした友情(8/9)

1.Googleを巨大にした友情(8/9)まとめ ・2011年からJeffはAndrew Ngと共同でニューラルネットワークの研究に取り組み始めた ・Google Brainは当初はGoogle社内からもその意義をあまり理解されなかった ・...
入門/解説

3人のAIのパイオニアがチューリング賞を受賞

1.3人のAIのパイオニアがチューリング賞を受賞まとめ ・ノーベルコンピューティング賞ともいわれるチューリング賞をAIのパイオニア3名が共同受賞 ・ヨシュア・ベンジオ、ジェフリー・ヒントン、ヤン・ルカンの3博士は2004年にAIを共同研究 ...
入門/解説

ニューラルネットワークの並列訓練の限界を測定(1/2)

1.ニューラルネットワークの並列訓練の限界を測定(1/2)まとめ ・バッチサイズとトレーニング時間の減少の関係を追及した論文が発表 ・作業負荷によって異なるがどのような最適化/データ/モデルも3つの段階がある事を確認 ・サイズに比例して時間...
モデル

RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)

1.RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)まとめ ・RNN-Tモデルは従来モデルに比べて1/5のサイズ圧縮に成功 ・更にTensorFlow Liteのモデル最適化ツールキットで1/4にサイズ...
モデル

RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(1/2)

1.RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(1/2)まとめ ・スマホで実行可能ニューラルネットワークベースの音声認識が発表 ・音声をクラウドに送って認識する従来型システムより応答が早い ・コネクショニス...
インフラ

GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)まとめ ・最近のニューラルネットワークはTPUアクセラレータのメモリに収めるのが難しいくらい巨大化している ・しかし、性能とパラメータ数には強い...
入門/解説

GPT-2:より良い言語モデルとそれが暗示する事(3/3)

1.GPT-2:より良い言語モデルとそれが暗示する事(3/3)まとめ ・GPT-2のような大規模な言語モデルは良い事に使う事もできるが悪用する事も出来る ・画像や音声、動画も簡単に偽造出来る現在では予想外の悪用方法があるかもしれない ・従来...
入門/解説

Live TranscribeとSound Amplifierで音声をより身近にする

1.Live TranscribeとSound Amplifierで音声をより身近にするまとめ ・Live Transcribeは音声を携帯電話のマイクで受信し、リアルタイムで字幕に変換して表示すアプリ ・Sound Amplifierは雑...
入門/解説

Live Transcribe:音声を文章にリアルタイム変換するAndroidアプリ

1.Live Transcribe:音声を文章にリアルタイム変換するAndroidアプリまとめ ・Live Transcribeは音声を文章にリアルタイム変換して聴覚障害者の日常会話への参加を助けるAndroidアプリ ・使い勝手の調査から...
AI関連その他

2018年のGoogleの研究成果を振り返って(4/6)

1.2018年のGoogleの研究成果を振り返って(4/6)まとめ ・Googleの2018年のAI関連の研究や成果の振り返り ・AutoML、TPU、オープンソースソフトウェアとデータセット ・研究開発の結果から実際の製品として世に出たも...
入門/解説

2018年のGoogleの研究成果を振り返って(1/6)

1.2018年のGoogleの研究成果を振り返って(1/6)まとめ ・Googleの2018年のAI関連の研究や成果の振り返り ・まずは倫理原則とAI、社会的利益のためのAI、アシスタントテクノロジー ・原理原則の決定と「ユーザーがより早く...
入門/解説

人工知能を創造するために生物の知能の仕組みを探求する試み(3/6)

1.人工知能を創造するために生物の知能の仕組みを探求する試み(3/6)まとめ ・脳は機能的にも解剖学的にもモジュールとして分離した構造になっている ・現在のAIは平坦な構造であるため脳同等機能を実現するには不適かもしれない ・人工的知能と生...