音声

AI

Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(2/2)

1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(2/2)まとめ ・翻訳前後で話者の声を保持するために同じ話者の声を使用してS2STモデルをトレーニングする ・多数のバイリンガルに協力して貰うのは難しいのでP...
AI

Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)

1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)まとめ ・音声間翻訳システムは通常、音声認識や機械翻訳、音声合成を順番に適用して実現 ・2019年には2言語間で翻訳元音声を翻訳先音声に直接翻訳できる...
AI

SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)まとめ ・理想的なコーデックはネットワーク状態に応じてビットレートを変更できる能力が必要 ・SoundStreamは「量子化器ドロップアウト」と呼ばれ...
AI

SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)まとめ ・SoundStreamはスマートフォンのCPUでリアルタイムに実行可能で音声と音楽を処理できる ・単一モデルで可変ビットレートで高品質を実現...
AI

人工内耳に高度な音声強調技術を適用(2/2)

1.人工内耳に高度な音声強調技術を適用(2/2)まとめ ・刺激パルスを固定時間間隔にするために細かい時間的構造を犠牲にしている事で品質が低下 ・パルス生成処理を音の波形のピークに合わせるようにすると明瞭さが増すように聞こえる ・課題は...
タイトルとURLをコピーしました