アプリケーション MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(2/2) 1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(2/2)まとめ ・MediaPipe Holisticは2017年モデルや中価格帯のスマホほぼリアルタイムで実行可能 ・モデルがほとんど独立しているため、速... 2020.12.12 アプリケーションモデル
アプリケーション MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2) 1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)まとめ ・MediaPipeはスマホで人間のポーズ、顔、手をリアルタイムで認識するフレームワーク ・従来のMediaPipeシリーズは各モデルで個々... 2020.12.11 アプリケーションモデル
アプリケーション Smart Scroll:録音データから探している音声を捜しやすくする(1/2) 1.Smart Scroll:録音データから探している音声を捜しやすくする(1/2)まとめ ・昨年、音声録音をより便利にする新しい録音アプリであるRecorderをリリース ・Recorderは最大18時間を転記できるため特定のセクションを... 2020.11.28 アプリケーション
アプリケーション VoiceFilter-Lite:オンデバイス音声認識の改善(2/2) 1.VoiceFilter-Lite:オンデバイスの音声認識の改善(2/2)まとめ ・VoiceFilter-Liteは使用者が自分の音声を登録しなかった場合はアプリ側で無効化できる ・音声分離モデルに発生しがちな抑制不足と抑制過剰への対処... 2020.11.13 アプリケーション
アプリケーション VoiceFilter-Lite:オンデバイス音声認識の改善(1/2) 1.VoiceFilter-Lite:オンデバイスの音声認識の改善(1/2)まとめ ・2018年に自分の声を登録して音声認識機能をパーソナライズするVoiceFilterを発表 ・VoiceFilterは成功したがスマートフォンなどのデバイ... 2020.11.12 アプリケーション
モデル MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2) 1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2)まとめ ・Tracking Modelはキーポイントの「ヒートマップとオフセット」の組合わせを教師として使用 ・20%の誤差であれな許容範囲(PC... 2020.08.23 モデル
モデル MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2) 1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2)まとめ ・動画内の人間のポーズを推定する技術はARやフィットネス向けのアプリなどで重要 ・BlazePoseは人体のポーズを知覚する新しい手法で既... 2020.08.22 モデル
アプリケーション Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2) 1.Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)まとめ ・LookoutはMediaPipe Box trackingやScaNNを使って実装されている ・大規模な分類モデルであるNASNetを教師モデルとしてト... 2020.08.16 アプリケーション
学習手法 Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2) 1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(2/2)まとめ ・Recorderは音声を50ms単位で小さく分析し正確に音声イベントの開始時間と終了時間を特定している ・音声分類結果が目まぐるしく変わらないようにa... 2019.12.28 学習手法
学習手法 Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2) 1.Recorder:Pixelスマートフォン用の検索可能な録音アプリ(1/2)まとめ ・録音音声をリアルタイムで書き起こしてタグ付けし、検索しやすくするPixel用アプリが公開 ・Recorderと名付けられたこのアプリはオンデバイスで動... 2019.12.27 学習手法
入門/解説 Pixel 4のNight Sightで撮影した天体写真(3/3) 1.Pixel 4のNight Sightで撮影した天体写真(3/3)まとめ ・人々は夜間は空が暗くなっている事を当然と思っているため空が明るく見えると撮影時刻を誤解する ・Night Sightでは撮影部分に空が含まれるとわざと空の部分を... 2019.11.30 入門/解説
学習手法 MobileNetV3:次世代のオンデバイス視覚モデル(3/3) 1.MobileNetV3:次世代のオンデバイス視覚モデル(3/3)まとめ ・精度とEdge TPU上で実行された際の速度を両立させるAutoMLをした結果MobileNetEdgeTPUモデル誕生 ・既存のモバイルモデルよりも同一精度でよ... 2019.11.22 学習手法