オンデバイス

1/7ページ

自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)

AI

1.自己教師学習で音声特徴表現と個人専用モデルを改善(1/2)まとめ ・非セマンティックタスクとは、声の調子など、人間の音声の「意味以外の側面」に焦点を当てたタスク ・従来のベンチマークでは非セマンティックタスク用の特徴表現が有用か否かを比較する事が困難 ・音声関連の特徴表現学習研究コミュニティにデータセット、モデル、測定ツールの3つの貢献を行った 2.非セマンティックな音声タスクとは? 以下、a […]

MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)

AI

1.MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)まとめ ・実世界データとAR合成データを組み合わせることで、精度を約10%向上させる事に成功 ・バックボーンとなっている技術は、MobileNetv2上に構築されたエンコーダーデコーダーアーキテクチャー ・ モバイルパイプラインの効率をさらに高めるために、数フレームごとに1回だけモデルの推論を実行 […]

Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2)

AI

1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2)まとめ ・Recorderは音声を50ms単位で小さく分析し正確に音声イベントの開始時間と終了時間を特定している ・音声分類結果が目まぐるしく変わらないようにadaptive-size median filteringを使っている ・オンデバイスのpart-of-speech-taggerを使用し一般的な名詞と固有名詞 […]

Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)

AI

1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)まとめ ・録音音声をリアルタイムで書き起こしてタグ付けし、検索しやすくするPixel用アプリが公開 ・Recorderと名付けられたこのアプリはオンデバイスで動作する機械学習で実現されている ・音声の内容を色で視覚化する機能もあり最も支配的なサウンドを単一の色で表現する 2.Recorderとは? 以下、ai.goog […]

Pixel 4のNight Sightで撮影した天体写真(3/3)

AI

1.Pixel 4のNight Sightで撮影した天体写真(3/3)まとめ ・人々は夜間は空が暗くなっている事を当然と思っているため空が明るく見えると撮影時刻を誤解する ・Night Sightでは撮影部分に空が含まれるとわざと空の部分を暗くする処理を加えている ・写真から空を検出する処理にはオンデバイスの畳み込みニューラルネットワークが使われている 2.夜空をわざと暗くする処理 以下、ai.g […]

1 7