end-to-end model

モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(2/2)まとめ ・多言語モデルはトレーニングセット内に頻繁に表れる言語の特徴表現からより多くの影響を受ける ・利用可能なデータが多い言語から多くの影響を受けてしまうので言語情報を入...
モデル

エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)

1.エンドツーエンドモデルによる多言語リアルタイム音声認識(1/2)まとめ ・音声データからニューラルネットワークが学習した「知識」の多くは他の言語に流用できる ・この洞察を元に利用可能な音声データが多い言語で学習した結果をマイナーな言語に...
モデル

Translatotron:入力された音声を外国語の音声に直接翻訳する試み(2/2)

1.Translatotron:入力された音声を外国語の音声に直接翻訳する試み(2/2)まとめ ・Translatotronの翻訳品質は現時点ではまだ従来手法のシステムに劣る ・しかし、従来システムでは難しい声質の保存や推論速度の速さなどポ...
モデル

Translatotron:入力された音声を外国語の音声に直接翻訳する試み(1/2)

1.Translatotron:入力された音声を外国語の音声に直接翻訳する試み(1/2)まとめ ・従来の音声翻訳システムは入力された音声を一旦テキストにし、それを翻訳して再び音声に戻していた ・Translatotronは中間のテキストを生...