AI

1/136ページ
人工知能、機械学習、深層学習、コグニティブなど

視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(1/3)

AI

1.視覚タスクで学習した重みをロボット操作タスクに転移学習する試み(1/3)まとめ ・ロボットが「物体に対して何が出来て何が出来ないのか?」を直接知覚できるようになると学習効率が良い ・これをアフォーダンスベースの操作と言い入力画像にアクション値を割り当てる事で実装される ・入力画像処理部分に関してはロボットと関係ない全く別の画像処理タスクの重みを転移できないだろうか? 2.affordance- […]

Dreamer:長期視点で考える事が出来る強化学習(3/3)

AI

1.Dreamer:長期視点で考える事が出来る強化学習(3/3)まとめ ・モデルベースのエージェントは500万フレーム未満、シミュレーション内の28時間で効率的に学習可能 ・モデルフリーのエージェントは学習が遅く1億フレーム、23日間に相当する時間を必要とする ・Dreamerは現在の最高のモデルフリーエージェントの平均スコアを20倍少ない学習時間で達成 2.Dreamerの性能 以下、ai.go […]

Dreamer:長期視点で考える事が出来る強化学習(2/3)

AI

1.Dreamer:長期視点で考える事が出来る強化学習(2/3)まとめ ・強力な世界モデルでさえ、正確に予測できる範囲が限られており多くは近視眼的だった ・Dreamerは、バリューネットワークとアクターネットワークでこの制限を克服 ・Dreamerは、計画と行動を切り離すことによりPlaNetが持つ高価な検索コストを回避 2.DreamerとPlaNetの違い 以下、ai.googleblog. […]

Dreamer:長期視点で考える事が出来る強化学習(1/3)

AI

1.Dreamer:長期視点で考える事が出来る強化学習(1/3)まとめ ・世界モデルを使用しない強化学習は学習に大量の試行錯誤と時間が必要なため実用性が制限される ・世界モデルを使用する強化学習もプランニングメカニズムがネックになり能力が制限されている ・既存モデルを改良し長期視点から最適な行動を学習出来る強化学習エージェントDreamerが発表 2.Dreamerとは? 以下、ai.google […]

Neural Tangents:高速に手軽にニューラルネットワークの幅を無限に拡張(2/2)

AI

1.Neural Tangents:高速に手軽にニューラルネットワークの幅を無限に拡張(2/2)まとめ ・無限幅のアンサンブルは単純な閉形式であるが有限幅のアンサンブルと顕著に一致している ・無限幅のニューラルネットワークは有限幅のネットワークの学習過程の変遷を捕捉する能力を持つ ・Neural Tangentsを使用して構築されたネットワークは通常のネットワークと同様に問題に適用可 2.無限幅の […]

1 136