学習手法 オフライン強化学習に関する楽観的な見解(2/2)
1.オフライン強化学習に関する楽観的な見解(2/2)まとめ ・教師あり学習のアンサンブル手法を応用してREMと言う新しい強化学習アルゴリズムを開発 ・REMはオフライン設定とオンライン設定で比較するとオフライン設定の方が高い性能を出せていた...
学習手法
公平性
画像生成
入門/解説
入門/解説
ロボット
AI関連その他
入門/解説
基礎理論
入門/解説
基礎理論
入門/解説