音声

AI関連その他

Google LensのGoogle Goバージョン(2/2)

1.Google LensのGoogle Goバージョン(2/2)まとめ ・OCRエンジンの誤読に備えて、文脈やナレッジグラフから手がかりを得て精度を上げている ・翻訳した文章が元の文章のどの部分に該当するかわかるように着色を行う ・カラオ...
入門/解説

Google LensのGoogle Goバージョン(1/2)

1.Google LensのGoogle Goバージョン(1/2)まとめ ・Google Lensは読み書きに困難を感じている世界の8億人の人々を手助けできる潜在能力がある ・しかし、従来のGoogle Lensはある程度機能が高いスマート...
その他

気候変動に対してAIは何が出来るのか?(4/4)

1.気候変動に対してAIは何が出来るのか?(4/4)まとめ ・機械学習にできる作業の多くは測定や警報に関連している作業 ・機械学習は可能性を示したり物事を安価にする事で意思決定を支援可能 ・しかし集団として気候変動に立ち向かう最終的な意思決...
入門/解説

気候変動に対してAIは何が出来るのか?(3/4)

1.気候変動に対してAIは何が出来るのか?(3/4)まとめ ・気候変動が非常に難しい問題である理由は、温室効果ガスの供給源が非常に多岐にわたるため ・安価な新しいゼロカーボンなテクノロジーが出現すれば経済的モチベーションで人々が動く ・摂氏...
入門/解説

気候変動に対してAIは何が出来るのか?(2/4)

1.気候変動に対してAIは何が出来るのか?(2/4)まとめ ・再生可能エネルギーは非常に安価になってきているが、完全に切り替える事はおそらく不可能 ・再生可能エネルギーは使用コストも高くなるため、貧富の差が拡大する懸念もある ・摂氏2度を防...
入門/解説

気候変動に対してAIは何が出来るのか?(1/4)

1.気候変動に対してAIは何が出来るのか?(1/4)まとめ ・気候変動とAIに関するワークショップの講演者へのインタビュー記事 ・インタビュアーのグレイグはワークショップを聞いてジョンにインタビューを申し込んだ ・講演者のジョンは気候変動に...
学習手法

音響的な手がかりと言語的な手がかりを使って発言者を特定する(3/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(3/3)まとめ ・TPUなどのアクセラレータとTensorFlowの効率的なアルゴリズムにより効率的な開発ができた ・統合モデルは音声認識と同じ様にトレーニングできるが発言者の...
入門/解説

音響的な手がかりと言語的な手がかりを使って発言者を特定する(2/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(2/3)まとめ ・従来のアプローチには、進歩を妨げるいくつかの制限があり改良版も全ての制限を回避はできていない ・今回新しく提案された手法は音響的な手がかりと言語的な手がかりを...
学習手法

音響的な手がかりと言語的な手がかりを使って発言者を特定する(1/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(1/3)まとめ ・スピーカーダイアライゼーション(Speaker Diarization)は「誰が何を発言したのか?」を認識する技術 ・従来は発言者が変化した事を認識するシステ...
学習手法

Project Euphoniaの非標準音声用のパーソナライズされた音声認識(2/2)

1.Project Euphoniaの非標準音声用にパーソナライズした音声認識(2/2)まとめ ・部調整モデルはASLスピーチに関しては、ベースラインモデルに比べてかなり改善する事が検証された ・2つのレイヤーの微調整だけで全体を微調整した...
学習手法

Project Euphoniaの非標準音声用のパーソナライズされた音声認識(1/2)

1.Project Euphoniaの非標準音声用にパーソナライズした音声認識(1/2)まとめ ・Project Euphoniaは音声認識モデルを改良して様々な非定形音声を適切に転写する事が目標 ・一般的な音声モデルでトレーニングした後に...
入門/解説

TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)

1.TCC:繰り返し動作に着目して動画を理解する学習手法(2/2)まとめ ・TCCを使うとポーズ、照明、ボディ、オブジェクトの種類などの差異に関わらず同じ動作を特定できる ・そのため、ラベル付き画像が少数しかない状態でアクションの分類や様々...