学習手法 SEED RLによる大規模強化学習(3/3) 1.SEED RLによる大規模強化学習(3/3)まとめ ・SEED RLが4,160CPUで達成する性能と同等な性能を出すにはIMPALAでは14,000CPUが必要となる ・DeepMindラボでは毎秒240万フレームを達成、これは、以前... 2020.04.03 学習手法
モデル Dreamer:長期視点で考える事が出来る強化学習(1/3) 1.Dreamer:長期視点で考える事が出来る強化学習(1/3)まとめ ・世界モデルを使用しない強化学習は学習に大量の試行錯誤と時間が必要なため実用性が制限される ・世界モデルを使用する強化学習もプランニングメカニズムがネックになり能力が制... 2020.03.26 モデル
その他の分野 StarCraft2でプロに勝ったAlphaStarが一般のゲームにも参戦 1.StarCraft2でプロに勝ったAlphaStarが一般のゲームにも参戦まとめ ・StarCraft2でプロに勝ったAlphaStarが一般のプレーヤーが遊ぶゲームにも研究目的で匿名で参戦 ・プレーヤーは設定でAlphaStarの対戦... 2019.07.18 その他の分野
アプリケーション Deepmindの人工知能AlphaStarがStarCraft2でプロゲーマーに打ち勝つ 1.Deepmindの人工知能AlphaStarがStarCraft2でプロゲーマーに打ち勝つまとめ ・Deepmindの人工知能AlphaStarがStarCraft2でプロゲーマーに打ち勝つ ・しかし、実はハンデ戦であってマクロの視点が... 2019.02.03 アプリケーション