アプリケーション Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2) 1.Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2)まとめ ・現在のGoogle Assistantは「OK Google」と呼びかける事で起動する仕組みに依存している ・ホームデバイスとの自然で直感的な対... 2022.07.31 アプリケーション
その他の調査 Google Research:2022年以降にAIはどのように進化していくか?(3/6) 1.Google Research:2022年以降にAIはどのように進化していくか?(3/6)まとめ ・個人スマホがプライバシーを保ったまま世界中のスマホと共同して学習する事が可能な時代 ・世界のデータを使いつつ状況に応じて個人に最適化出来... 2022.01.17 その他の調査
モデル Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2) 1.Translatotron 2:音声間直接翻訳アプローチの品質を更に改良(1/2)まとめ ・音声間翻訳システムは通常、音声認識や機械翻訳、音声合成を順番に適用して実現 ・2019年には2言語間で翻訳元音声を翻訳先音声に直接翻訳できるTr... 2021.10.02 モデル
アプリケーション FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2) 1.FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)まとめ ・FRILLはPixel 1スマートフォン上で推論時間8.5ミリ秒、TRILL比で40%のサイズ削減を達成 ・10ミリ秒を超える応... 2021.06.18 アプリケーションモデル
アプリケーション IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2) 1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能 ・アイコン情報を提供していないアプリもあ... 2021.02.08 アプリケーション
アプリケーション Hum to Search:鼻歌検索の背後に存在する技術(2/2) 1.Hum to Search:鼻歌検索の背後に存在する技術(2/2)まとめ ・トレーニングデータは元の歌声をハミングや口笛に変換して認識率を向上させている ・トレーニング時にはトリプレット損失関数をベースに信頼性の概念に改良を加えた ・現... 2020.11.15 アプリケーション
アプリケーション VoiceFilter-Lite:オンデバイス音声認識の改善(2/2) 1.VoiceFilter-Lite:オンデバイスの音声認識の改善(2/2)まとめ ・VoiceFilter-Liteは使用者が自分の音声を登録しなかった場合はアプリ側で無効化できる ・音声分離モデルに発生しがちな抑制不足と抑制過剰への対処... 2020.11.13 アプリケーション
アプリケーション VoiceFilter-Lite:オンデバイス音声認識の改善(1/2) 1.VoiceFilter-Lite:オンデバイスの音声認識の改善(1/2)まとめ ・2018年に自分の声を登録して音声認識機能をパーソナライズするVoiceFilterを発表 ・VoiceFilterは成功したがスマートフォンなどのデバイ... 2020.11.12 アプリケーション
学習手法 WaveNetEQでGoogle Duoの通話品質を向上(2/2) 1.WaveNetEQでGoogle Duoの通話品質を向上(2/2)まとめ ・コンディショニングネットワークは抑揚を意識して自己回帰ネットワークをあるべき波形に修正できる ・WaveNetEQの学習時は実際のデータを次のステップの入力に使... 2020.04.10 学習手法
AI関連その他 WaveNetEQでGoogle Duoの通話品質を向上(1/2) 1.WaveNetEQでGoogle Duoの通話品質を向上(1/2)まとめ ・Google Duo通話の20%は3%以上の音声データを失い、10%の通話は8%以上の音声データを失っている ・失われた音声データを処理する手法はPLCと呼ばれ... 2020.04.09 AI関連その他
学習手法 Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2) 1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2)まとめ ・Recorderは音声を50ms単位で小さく分析し正確に音声イベントの開始時間と終了時間を特定している ・音声分類結果が目まぐるしく変わらないようにa... 2019.12.28 学習手法
学習手法 Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2) 1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)まとめ ・録音音声をリアルタイムで書き起こしてタグ付けし、検索しやすくするPixel用アプリが公開 ・Recorderと名付けられたこのアプリはオンデバイスで動... 2019.12.27 学習手法