音声認識

AI

音響的な手がかりと言語的な手がかりを使って発言者を特定する(3/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(3/3)まとめ ・TPUなどのアクセラレータとTensorFlowの効率的なアルゴリズムにより効率的な開発ができた ・統合モデルは音声認識と同じ様にトレーニングできるが発言...
AI

音響的な手がかりと言語的な手がかりを使って発言者を特定する(2/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(2/3)まとめ ・従来のアプローチには、進歩を妨げるいくつかの制限があり改良版も全ての制限を回避はできていない ・今回新しく提案された手法は音響的な手がかりと言語的な手がか...
AI

音響的な手がかりと言語的な手がかりを使って発言者を特定する(1/3)

1.音響的な手がかりと言語的な手がかりを使って発言者を特定する(1/3)まとめ ・スピーカーダイアライゼーション(Speaker Diarization)は「誰が何を発言したのか?」を認識する技術 ・従来は発言者が変化した事を認識するシ...
AI

Project Euphoniaの非標準音声用のパーソナライズされた音声認識(2/2)

1.Project Euphoniaの非標準音声用にパーソナライズした音声認識(2/2)まとめ ・部調整モデルはASLスピーチに関しては、ベースラインモデルに比べてかなり改善する事が検証された ・2つのレイヤーの微調整だけで全体を微調整...
AI

Project Euphoniaの非標準音声用のパーソナライズされた音声認識(1/2)

1.Project Euphoniaの非標準音声用にパーソナライズした音声認識(1/2)まとめ ・Project Euphoniaは音声認識モデルを改良して様々な非定形音声を適切に転写する事が目標 ・一般的な音声モデルでトレーニングした...
タイトルとURLをコピーしました