アプリケーション speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(2/2) 1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(2/2)まとめ ・音声をembedding化した後、複数のクラスタリング手法で話者推定を実施する ・メイン処理に渡す前に予備的アルゴリズムで事前... 2022.12.24 アプリケーションAI
アプリケーション speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(1/2) 1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(1/2)まとめ ・Pixel用の音声録音アプリRecorderは便利だが誰が何を言ったのかが不明確 ・録音中にリアルタイムで各発言者にユニークな... 2022.12.23 アプリケーション
モデル ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(2/2) 1.ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(2/2)まとめ ・ByteQRNNはマージAttentionサブレイヤーと量子化ビーム探索で計算を効率化している ・事前学習済みのByteQRNNの性能は、3... 2022.08.05 モデル
モデル ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(1/2) 1.ByteQRNN:BERTの1/300のサイズで同等性能なオンデバイスモデル(1/2)まとめ ・トークンフリーモデルは文字列をバイト列として扱うのでモデルサイズを小さくできる ・サイズは小さくできるが推論の待ち時間や計算コストが増加する... 2022.08.04 モデル
アプリケーション Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2) 1.Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2)まとめ ・現在のGoogle Assistantは「OK Google」と呼びかける事で起動する仕組みに依存している ・ホームデバイスとの自然で直感的な対... 2022.07.31 アプリケーション
アプリケーション データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(3/3) 1.データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(3/3)まとめ ・前世代の最先端モデルであるMobileDet-EdgeTPUをエネルギー効率で30%上回る ・顔検出性能の向上に加えホワイトバランスと露出の... 2021.11.22 アプリケーションモデル
アプリケーション データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(2/3) 1.データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(2/3)まとめ ・様々なタイプのIBNを含めた探索空間を構築しNASで画像像分類用のモデルを発見 ・発見されたMobileNetEdgeTPUV2はCPU上で... 2021.11.21 アプリケーションモデル
アプリケーション GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2) 1.GCE:Pixel6の文字入力時の文法エラー修正モデル(2/2)まとめ ・大規模なクラウドベースのモデルを作りそこからオンデバイス用の学習データを作成 ・クラウドベースのモデルの学習用データをそのまま使うより良いモデルが出来た ・このモ... 2021.11.12 アプリケーションモデル
アプリケーション GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2) 1.GCE:Pixel6の文字入力時の文法エラー修正モデル(1/2)まとめ ・スマートフォンを使用してより長い文章を作成することは、依然として非常に面倒 ・この問題に対処するためにPixel 6のGboardに直接組み込んだ文法修正機能をリ... 2021.11.11 アプリケーションモデル
アプリケーション FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2) 1.FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)まとめ ・FRILLはPixel 1スマートフォン上で推論時間8.5ミリ秒、TRILL比で40%のサイズ削減を達成 ・10ミリ秒を超える応... 2021.06.18 アプリケーションモデル
アプリケーション FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(1/2) 1.FRILL:TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(1/2)まとめ ・昨年、音声の特徴表現を比較するベンチマークと新しい音声特徴表現モデルTRILLを公開 ・TRILLは有用だが単純な音声特徴を処理... 2021.06.17 アプリケーションモデル
アプリケーション IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2) 1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能 ・アイコン情報を提供していないアプリもあ... 2021.02.08 アプリケーション