mobile

ヘルスケア

スマートフォンで目を撮影して9種の病気の兆候を検出する(1/2)

1.スマートフォンで目を撮影して9種の病気の兆候を検出する(1/2)まとめ ・昨年の研究ではディープラーニングを使って眼球写真を解析し糖尿病網膜疾患の状態や糖化ヘモグロビンの上昇を予測できることを示す結果を発表した ・今年は更に研究を推し進...
アプリケーション

speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(2/2)

1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(2/2)まとめ ・音声をembedding化した後、複数のクラスタリング手法で話者推定を実施する ・メイン処理に渡す前に予備的アルゴリズムで事前...
アプリケーション

speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(1/2)

1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(1/2)まとめ ・Pixel用の音声録音アプリRecorderは便利だが誰が何を言ったのかが不明確 ・録音中にリアルタイムで各発言者にユニークな...
アプリケーション

毛先まで明瞭に自撮りできるPixel 6のポートレートモード(1/2)

1.毛先まで明瞭に自撮りできるPixel 6のポートレートモード(1/2)まとめ ・従来のマスク手法は画素が前景に属するか背景に属するかをYes or Noの2値で判断していた ・2値しか持たないと透明度の値を推定する必要があり髪の毛などの...
その他の調査

Google Research:2022年以降にAIはどのように進化していくか?(3/6)

1.Google Research:2022年以降にAIはどのように進化していくか?(3/6)まとめ ・個人スマホがプライバシーを保ったまま世界中のスマホと共同して学習する事が可能な時代 ・世界のデータを使いつつ状況に応じて個人に最適化出来...
アプリケーション

データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(3/3)

1.データセンター内のBERTに匹敵する性能を持つPixel 6搭載の言語モデル(3/3)まとめ ・前世代の最先端モデルであるMobileDet-EdgeTPUをエネルギー効率で30%上回る ・顔検出性能の向上に加えホワイトバランスと露出の...
アプリケーション

Polyblur:過去に撮影した写真からノイズとピンボケを除去(1/2)

1.Polyblur:過去に撮影した写真からノイズとピンボケを除去(1/2)まとめ ・未知のカメラで生成された画像からノイズ除去とシャープネスの改善を行う事は困難 ・ノイズ除去とブレ削減は矛盾した操作であるため計算効率の高い画像強調技術が必...
アプリケーション

IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(2/2)

1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(2/2)まとめ ・デバイス上で実行するためバックボーンの幅と深さをパフォーマンスに影響を与えずに削減 ・バックボーン選択後ニューラルアーキテクチャ探索(NAS...
アプリケーション

IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)

1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能 ・アイコン情報を提供していないアプリもあ...
アプリケーション

MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)

1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)まとめ ・MediaPipeはスマホで人間のポーズ、顔、手をリアルタイムで認識するフレームワーク ・従来のMediaPipeシリーズは各モデルで個々...
アプリケーション

Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)

1.Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)まとめ ・LookoutはMediaPipe Box trackingやScaNNを使って実装されている ・大規模な分類モデルであるNASNetを教師モデルとしてト...
その他の分野

MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)

1.MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)まとめ ・実世界データとAR合成データを組み合わせることで、精度を約10%向上させる事に成功 ・バックボーンとなっている技術は、Mobil...