モバイル

AI関連その他

AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測インダストリー編(3/3)

1.AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測インダストリー編(3/3)まとめ ・コロナの大きな影響を受けた業界以外はAI関連プロジェクトへの投資を減らしていない ・AIを使用するため自動運転、...
アプリケーション

Portrait Light:機械学習を使ってポートレートモードの照明を強化(2/2)

1.Portrait Light:機械学習を使ってポートレートモードの照明を強化(2/2)まとめ ・照明方向とポートレートを指定する照明を元の写真に追加するモデルを学習させた ・トレーニングには多数のポートレートが必要でLight Stag...
アプリケーション

MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)

1.MediaPipe Holistic:オンデバイスで顔、手、ポーズを同時に予測(1/2)まとめ ・MediaPipeはスマホで人間のポーズ、顔、手をリアルタイムで認識するフレームワーク ・従来のMediaPipeシリーズは各モデルで個々...
入門/解説

ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版

1.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版まとめ ・ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ30選 ・一般的なデータサイエンス用ツールは対象外とし、ニ...
アプリケーション

機械学習を使って触覚用のセンサーを改良(1/2)

1.機械学習を使って触覚用のセンサーを改良(1/2)まとめ ・ウェアラブル端末にとって触覚は直感的なフィードバックのためのますます重要 ・触覚はLRAと呼ばれる触覚信号を提供する小さなリニアモーターで実現できていた ・しかし圧力の検知は別の...
アプリケーション

VoiceFilter-Lite:オンデバイス音声認識の改善(1/2)

1.VoiceFilter-Lite:オンデバイスの音声認識の改善(1/2)まとめ ・2018年に自分の声を登録して音声認識機能をパーソナライズするVoiceFilterを発表 ・VoiceFilterは成功したがスマートフォンなどのデバイ...
データセット

三次元物体認識のためのObjectronデータセットの発表(1/2)

1.三次元物体認識のためのObjectronデータセットの発表(1/2)まとめ ・二次元と比較して大規模なデータセットがないため三次元で物体を理解することは困難 ・Objectronデータセットはこの問題を解決する三次元物体中心の短いビデオ...
アプリケーション

YouTubeストーリーで人の声だけ音量を上げる(1/2)

1.YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい ・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の音声...
モデル

pQRNN:射影とクラスタリングで一部のNLPタスクを効率化(1/2)

1.pQRNN:射影とクラスタリングで一部のNLPタスクを効率化(1/2)まとめ ・昨年発表したPRADOはパラメータ数が少なくとも最先端のパフォーマンスを実現した ・PRADOはタスクに最も関連するトークンのみを学習するためパラメータを少...
モデル

MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2)

1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2)まとめ ・Tracking Modelはキーポイントの「ヒートマップとオフセット」の組合わせを教師として使用 ・20%の誤差であれな許容範囲(PC...
モデル

MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2)

1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2)まとめ ・動画内の人間のポーズを推定する技術はARやフィットネス向けのアプリなどで重要 ・BlazePoseは人体のポーズを知覚する新しい手法で既...
アプリケーション

Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)

1.Lookout:視覚に困難を抱える人のためにスマホで商品を識別(2/2)まとめ ・LookoutはMediaPipe Box trackingやScaNNを使って実装されている ・大規模な分類モデルであるNASNetを教師モデルとしてト...