音声

AI

SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(2/2)まとめ ・理想的なコーデックはネットワーク状態に応じてビットレートを変更できる能力が必要 ・SoundStreamは「量子化器ドロップアウト」と呼ばれ...
AI

SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)

1.SoundStream:ビットレート可変なニューラルオーディオコーデック(1/2)まとめ ・SoundStreamはスマートフォンのCPUでリアルタイムに実行可能で音声と音楽を処理できる ・単一モデルで可変ビットレートで高品質を実現...
AI

人工内耳に高度な音声強調技術を適用(2/2)

1.人工内耳に高度な音声強調技術を適用(2/2)まとめ ・刺激パルスを固定時間間隔にするために細かい時間的構造を犠牲にしている事で品質が低下 ・パルス生成処理を音の波形のピークに合わせるようにすると明瞭さが増すように聞こえる ・課題は...
AI

人工内耳に高度な音声強調技術を適用(1/2)

1.人工内耳に高度な音声強調技術を適用(1/2)まとめ ・人工内耳(CI)は外部サウンドプロセッサを介して聴覚神経を電気的に刺激する電子デバイス ・補聴器は音を増幅させるだけだがCIは音声を電気刺激として感じさせる事が出来る ・CIで...
AI

HuBERT:話言葉を音声から直接学習する自己教師あり特徴表現学習(2/2)

1.HuBERT:話言葉を音声から直接学習する自己教師あり特徴表現学習(2/2)まとめ ・HuBERTは完全に音声データだけでトレーニングされたNLPシステムを開発するのに役立つ ・AI音声アシスタントは人が発音するニュアンスや感情を考...
タイトルとURLをコピーしました