音声

学習手法

MorphNet:学習済みニューラルネットワークをより速くより小さく改良(1/2)

1.MorphNet:学習済みニューラルネットワークをより速くより小さく改良(1/2)まとめ ・AutoMLのようなニューラルネットワークサーチは思った以上に時間とお金がかかる可能性がある ・既に存在する学習済みニューラルネットワークを特定...
インフラ

Googleを巨大にした友情(8/9)

1.Googleを巨大にした友情(8/9)まとめ ・2011年からJeffはAndrew Ngと共同でニューラルネットワークの研究に取り組み始めた ・Google Brainは当初はGoogle社内からもその意義をあまり理解されなかった ・...
学習手法

TALNet:Google Photosで動画から特別な瞬間を切り出す(2/2)

1.TALNet:Google Photosで動画から特別な瞬間を切り出す(2/2) ・二次元データを扱うFaster R-CNNを一次元の時系列データに応用するためには3つの課題があった ・時間に変動が大きい事、前後の状況が重要な事、入力...
入門/解説

3人のAIのパイオニアがチューリング賞を受賞

1.3人のAIのパイオニアがチューリング賞を受賞まとめ ・ノーベルコンピューティング賞ともいわれるチューリング賞をAIのパイオニア3名が共同受賞 ・ヨシュア・ベンジオ、ジェフリー・ヒントン、ヤン・ルカンの3博士は2004年にAIを共同研究 ...
入門/解説

責任を持ってオープンデータを共有する

1.責任を持ってオープンデータを共有するまとめ ・2019年3月2日はOpen Data Dayと云うお祭りで世界でイベントが開催された ・日本でも57ものイベントが開催され中には毎年開催している地域もある ・GoogleはDataSet検...
入門/解説

ニューラルネットワークの並列訓練の限界を測定(1/2)

1.ニューラルネットワークの並列訓練の限界を測定(1/2)まとめ ・バッチサイズとトレーニング時間の減少の関係を追及した論文が発表 ・作業負荷によって異なるがどのような最適化/データ/モデルも3つの段階がある事を確認 ・サイズに比例して時間...
モデル

RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)

1.RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(2/2)まとめ ・RNN-Tモデルは従来モデルに比べて1/5のサイズ圧縮に成功 ・更にTensorFlow Liteのモデル最適化ツールキットで1/4にサイズ...
モデル

RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(1/2)

1.RNN-T:全てをニューラルネットワークで実装したオンデバイス音声認識の実現(1/2)まとめ ・スマホで実行可能ニューラルネットワークベースの音声認識が発表 ・音声をクラウドに送って認識する従来型システムより応答が早い ・コネクショニス...
インフラ

GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)まとめ ・最近のニューラルネットワークはTPUアクセラレータのメモリに収めるのが難しいくらい巨大化している ・しかし、性能とパラメータ数には強い...
入門/解説

GPT-2:より良い言語モデルとそれが暗示する事(3/3)

1.GPT-2:より良い言語モデルとそれが暗示する事(3/3)まとめ ・GPT-2のような大規模な言語モデルは良い事に使う事もできるが悪用する事も出来る ・画像や音声、動画も簡単に偽造出来る現在では予想外の悪用方法があるかもしれない ・従来...
入門/解説

Live TranscribeとSound Amplifierで音声をより身近にする

1.Live TranscribeとSound Amplifierで音声をより身近にするまとめ ・Live Transcribeは音声を携帯電話のマイクで受信し、リアルタイムで字幕に変換して表示すアプリ ・Sound Amplifierは雑...
入門/解説

Live Transcribe:音声を文章にリアルタイム変換するAndroidアプリ

1.Live Transcribe:音声を文章にリアルタイム変換するAndroidアプリまとめ ・Live Transcribeは音声を文章にリアルタイム変換して聴覚障害者の日常会話への参加を助けるAndroidアプリ ・使い勝手の調査から...