アプリケーション Lyra:音声圧縮用の新しい超低ビットレートコーデック(2/2) 1.Lyra:音声圧縮用の新しい超低ビットレートコーデック(2/2)まとめ ・Lyraは計算量の少ないWaveRNNの亜種を使用することで生成モデルの計算の複雑さを回避 ・中級クラスのスマートフォン上でもリアルタイム処理が出来るほど軽量なモ... 2021.03.13 アプリケーションモデル
学習手法 WaveNetEQでGoogle Duoの通話品質を向上(2/2) 1.WaveNetEQでGoogle Duoの通話品質を向上(2/2)まとめ ・コンディショニングネットワークは抑揚を意識して自己回帰ネットワークをあるべき波形に修正できる ・WaveNetEQの学習時は実際のデータを次のステップの入力に使... 2020.04.10 学習手法
入門/解説 フレシェ距離を使用したオーディオとビジュアルの品質測定(3/3) 1.フレシェ距離を使用したオーディオとビジュアルの品質測定(3/3)まとめ ・FADとFVDによる評価が人間による評価を厳密に相関する事は実際のデータを使った検証された ・同じ音声を異なった2つの手段で歪ませて、どちらがよりすぐ実音声に近い... 2019.10.25 入門/解説
入門/解説 フレシェ距離を使用したオーディオとビジュアルの品質測定(2/3) 1.フレシェ距離を使用したオーディオとビジュアルの品質測定(2/3)まとめ ・GANの品質を測定する手法としてFID、フレシェ インセプション 距離がある ・FIDの原則に基づいてフレシェビデオ距離(FVD)とフレシェオーディオ距離(FAD... 2019.10.24 入門/解説
入門/解説 フレシェ距離を使用したオーディオとビジュアルの品質測定(1/3) 1.フレシェ距離を使用したオーディオとビジュアルの品質測定(1/3)まとめ ・生成モデルが生成した画像や音声を定量的に評価する手法は従来は存在しなかった ・この課題を解決するフレシェオーディオ距離(FAD)とフレシェビデオ距離(FVD)の2... 2019.10.23 入門/解説
その他の調査 長文を読みあげる合成音声の品質を評価する(2/2) 1.長文を読みあげる合成音声の品質を評価する(2/2)まとめ ・複数の文が含まれる長文を評価する事は人間の音声を評価対象にしても評価がぶれる ・長文を読みあげる合成音声の評価は簡単ではなく、人間の行動真理などが関係している可能性がある ・段... 2019.09.15 その他の調査