mobilenet

AI

YouTubeストーリーで人の声だけ音量を上げる(1/2)

1.YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい ・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の...
AI

RigL:ニューラルネットワークの冗長性を動的に最適化(3/3)

1.RigL:ニューラルネットワークの冗長性を動的に最適化(3/3)まとめ ・RigLのパフォーマンスはトレーニング時間を伸ばすと基本時間の百倍までは常に改善された ・ResNet-50では最先端のtop 1精度、MobileNet-v...
AI

Lookout:視覚に困難を抱える人のためにスマホで商品を識別(1/2)

1.Lookout:視覚に困難を抱える人のためにスマホで商品を識別(1/2)まとめ ・Lookoutは視覚に困難があっても現実世界で活躍できるようにするAndroidアプリ ・スマートフォンカメラをスーパーの陳列棚に向けるとLookou...
AI

自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)

1.自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)まとめ ・同じ音声のembeddingは、別の音声のembeddingよりembedding空間内で近い場所に位置するはず ・これを利用しBERTと同様なデータ自体の構造にの...
AI

MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)

1.MediaPipe Objectron:モバイル上でリアルタイムに物体の三次元形状を認識(2/2)まとめ ・実世界データとAR合成データを組み合わせることで、精度を約10%向上させる事に成功 ・バックボーンとなっている技術は、Mob...
タイトルとURLをコピーしました