視覚

モデル

Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(2/2)

1.Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(2/2)まとめ ・Transporter Netはサンプル効率が高く100回のデモで多くのタスクで90%以上の成功率 ・Transporter N...
モデル

Apollo:コンピュータアーキテクチャのために機械学習を活用(2/3)

1.Apollo:コンピュータアーキテクチャのために機械学習を活用(2/3)まとめ ・本調査ではアーキテクチャ探索を4つの最適化戦略で実施して結果を比較した ・ランダム探索はランダムに、Vizierはベイズ最適化を用いて探索と開拓のバランス...
学習手法

World Models Library:強化学習で将来の画像を予測する事に意味はあるのか?(2/2)

1.World Models Library:強化学習で将来の画像を予測する事に意味はあるのか?(2/2)まとめ ・エージェントが予測する画像の画素数が増えるとパフォーマンスは一般的に向上 ・報酬予測の精度とエージェントのパフォーマンスの間...
アプリケーション

IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)

1.IconNet:スマホ画面上のアイコンを検出して音声でアプリ操作を可能にする(1/2)まとめ ・Android用アプリのVoice Accessを使用するとユーザーは口頭で指示してアプリ操作可能 ・アイコン情報を提供していないアプリもあ...
基礎理論

RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)

1.RxR:多言語の案内指示に対応する能力を測るベンチマーク(1/2)まとめ ・話し言葉や書き言葉を使った指示に応じて複雑な環境を案内できるAIの開発は大きな課題 ・視覚と言語のナビゲーション(VLN)と呼ばれるこの課題には、空間言語の高度...
アプリケーション

Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(1/2)

1.Pr-VIPE:異なる視点から撮影した画像間で人間の姿勢の類似性を認識(1/2)まとめ ・人間の姿勢を画像や動画などで2次元として撮影するとカメラの視点によって見え方が異なる ・二次元情報のみを使用して三次元ポーズの類似性を認識できると...
AI関連その他

2020年版AIによる創造と夢(1/2)

1.2020年版AIによる創造と夢(1/2)まとめ ・AIを使って作文、作曲、画像生成、合成音声、など様々な表現が出来るようになった ・それらを繋ぎ合わせて映像作品などを造られている方の2020年の作品集まとめ ・画像、動画、独自の空間効果...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(5/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(5/5)まとめ ・TensorFlowは5周年で累計ダウンロード数は1億6000万を超え、JAXへの投資も倍増 ・データセットの公開、各種助成金などにより研究...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(4/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(4/5)まとめ ・アルゴリズム基礎は主に本業の広告オークション関係で注目すべき結果が多かった ・機械知覚は音声と映像を組み合わせて学習する等のマルチモーダルな...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(3/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(3/5)まとめ ・機械学習アルゴリズムや基礎理論の研究により効率的な手法の探求が前進 ・強化学習は履歴データの利用やサンプル効率の向上、適用分野の拡大 ・Au...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(1/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(1/5)まとめ ・年始の恒例のGoogle Researchの去年の振り返りと今年の展望の主要なハイライト ・COVID-19を中心とした医療関係におけるAI...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(3/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(3/3)まとめ ・CLIPは一般的な物体認識には優れているが抽象的または体系的なタスクには苦戦 ・CLIPは、言葉遣いや言い回しに過敏で機能させるために試行錯誤も必要 ・分類対...