speech-to-speech translation

データセット

CVSS:大規模多言語音声間翻訳データセット(2/2)

1.CVSS:大規模多言語音声間翻訳データセット(2/2)まとめ ・CVSSは翻訳音声の他に、翻訳音声の発音に合わせた正規化された翻訳文も提供 ・CVSSはCreative Commons Attribution 4.0 Internati...
データセット

CVSS:大規模多言語音声間翻訳データセット(1/2)

1.CVSS:大規模多言語音声間翻訳データセット(1/2)まとめ ・ある言語の音声を別の言語の音声に自動翻訳する事を音声合成翻訳(S2ST)という ・S2STは直接翻訳するタイプと複数システムを連結して実現する2種が存在する ・直接型のS2...
モデル

Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(2/2)

1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(2/2)まとめ ・翻訳前後で話者の声を保持するために同じ話者の声を使用してS2STモデルをトレーニングする ・多数のバイリンガルに協力して貰うのは難しいのでPnG...
モデル

Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)

1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)まとめ ・音声間翻訳システムは通常、音声認識や機械翻訳、音声合成を順番に適用して実現 ・2019年には2言語間で翻訳元音声を翻訳先音声に直接翻訳できるTr...