deepmind

SEED RLによる大規模強化学習(3/3)

１．SEED RLによる大規模強化学習(3/3)まとめ・SEED RLが4,160CPUで達成する性能と同等な性能を出すにはIMPALAでは14,000CPUが必要となる・DeepMindラボでは毎秒240万フレームを達成、これは、以前の最...

2020.04.03

学習手法

１．Dreamer：長期視点で考える事が出来る強化学習(1/3)まとめ・世界モデルを使用しない強化学習は学習に大量の試行錯誤と時間が必要なため実用性が制限される・世界モデルを使用する強化学習もプランニングメカニズムがネックになり能力が制限さ...

2020.03.26

モデル

１．StarCraft2でプロに勝ったAlphaStarが一般のゲームにも参戦まとめ・StarCraft2でプロに勝ったAlphaStarが一般のプレーヤーが遊ぶゲームにも研究目的で匿名で参戦・プレーヤーは設定でAlphaStarの対戦の許...

2019.07.18

その他の分野

１．Deepmindの人工知能AlphaStarがStarCraft2でプロゲーマーに打ち勝つまとめ・Deepmindの人工知能AlphaStarがStarCraft2でプロゲーマーに打ち勝つ・しかし、実はハンデ戦であってマクロの視点が欠け...

2019.02.03

アプリケーション