入門/解説 強化学習における好奇心報酬とぐずぐず先延ばしの罠(2/2)
1.強化学習における好奇心報酬とぐずぐず先延ばしの罠(2/2)まとめ ・強化学習は飴と鞭で人工知能を学習させるが飴も鞭もほとんど発生しない世界では学習できない ・好奇心を満たす事を報酬として組み込む手法が以前より研究されている ・今回発表さ...
入門/解説
学習手法
入門/解説
学習手法
モデル
学習手法