mobilenet

FRILL：TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)

１．FRILL：TensorFlow-Liteを使用したオンデバイスで動作可能な音声特徴表現(2/2)まとめ・FRILLはPixel 1スマートフォン上で推論時間8.5ミリ秒、TRILL比で40%のサイズ削減を達成・10ミリ秒を超える応...

2021.06.18

アプリケーションモデル

１．Project Guideline：視力の弱い人が一人で走れるようにする(1/2)まとめ・失明または弱視状態の人にとって支援者なしに一人でランニングすることは困難・Project Guidelineは路面に案内線が塗装されている様々...

2021.05.28

アプリケーション公平性

１．ニューラルネットワークを疎にして推論を高速化(2/2)まとめ・密なバージョンから重みの一部を徐々にゼロにしていく事がスパース化のコツ・トレーニング時間の増加で品質を低下させることなく深層学習モデルをスパース化可能・スパースネットワ...

2021.03.25

基礎理論学習手法

１．ニューラルネットワークを疎にして推論を高速化(1/2)まとめ・モデル最適化には大部分の重みが0に設定されているスパースニューラルネットワークが有効・しかし良く使われる畳み込みスパース化するツールとサポートするツールがなかった・XN...

2021.03.24

基礎理論学習手法

１．IconNet：スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(2/2)まとめ・デバイス上で実行するためバックボーンの幅と深さをパフォーマンスに影響を与えずに削減・バックボーン選択後ニューラルアーキテクチャ探索(NAS...

2021.02.09

アプリケーション

１．IconNet：スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能・アイコン情報を提供していないアプリもあ...

2021.02.08

アプリケーション

１．AIのアルゴリズムの効率性は16か月毎に2倍に上昇(2/2)まとめ・少量のコンピューティングで達成された顕著な進歩の測定に力を注ぐことが重要・今後も効率的な最新技術を引き続き追跡し、視覚と翻訳タスク以外も追加して行く予定・未掲載の...

2020.11.17

AI関連その他

１．Web MLによるGoogle Meetの背景置き換え(1/2)まとめ・ビデオ会議ソフトGoogle Meetで機械学習を使用して背景を置き換える技術が発表・ブラウザで直接動作するMediaPipeを使っているのでアドオンのインスト...

2020.11.08

アプリケーション

１．YouTubeストーリーで人の声だけ音量を上げる(1/2)まとめ・バックグラウンドノイズが大きいビデオでは被写体のスピーチが曖昧になり理解しにくい・Looking to Listenは音声と口の動きなどの視覚信号を使い特定の人の音声...

2020.10.06

アプリケーション

１．RigL：ニューラルネットワークの冗長性を動的に最適化(3/3)まとめ・RigLのパフォーマンスはトレーニング時間を伸ばすと基本時間の百倍までは常に改善された・ResNet-50では最先端のtop 1精度、MobileNet-v1で...

2020.09.23

モデル学習手法

１．Lookout：視覚に困難を抱える人のためにスマホで商品を識別(1/2)まとめ・Lookoutは視覚に困難があっても現実世界で活躍できるようにするAndroidアプリ・スマートフォンカメラをスーパーの陳列棚に向けるとLookoutは...

2020.08.15

ヘルスケア

１．自己教師学習で音声特徴表現と個人専用モデルを改善(2/2)まとめ・同じ音声のembeddingは、別の音声のembeddingよりembedding空間内で近い場所に位置するはず・これを利用しBERTと同様なデータ自体の構造にのみ依...

2020.07.02

モデル