強化学習

AI

オフライン強化学習における未解決の課題への取り組み(3/3)

1.オフライン強化学習における未解決の課題への取り組み(3/3)まとめ ・オフラインRLを改善するためには履歴データにない行動を学習する必要がある ・既存手法は履歴データにない行動を過度に過大評価してしまう問題があった ・基本的に悲観...
AI

オフライン強化学習における未解決の課題への取り組み(2/3)

1.オフライン強化学習における未解決の課題への取り組み(2/3)まとめ ・D4RLは現実的なアプリケーションを念頭に作られたベンチマークである事が特徴 ・タスクの目的と違う目的を実行した記録から学習する能力などが試される ・タスクと標...
AI

オフライン強化学習における未解決の課題への取り組み(1/3)

1.オフライン強化学習における未解決の課題への取り組み(1/3)まとめ ・強化学習は医療など試行錯誤によるデータ収集が難しい現実世界には適用が難しい ・オフラインRLは実際に動かさなくても過去に収集されたデータを使って学習可能なため有望...
AI

RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2)

1.RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2)まとめ ・RWRLは現在のRLが抱える9つの異なる課題のうち8つに関連する実験を行う機能を提供 ・複数の課題と難易度レベルを組み合わせた環境でアルゴリズムをテス...
AI

RWRL:強化学習の課題に取り組むための一連のシミュレーション(1/2)

1.RWRL:強化学習の課題に取り組むための一連のシミュレーション(1/2)まとめ ・成功している強化学習はシミュレータが利用可能か動作環境が安価に利用可能である ・シミュレーターが利用できない環境で強化学習を実際の製品に展開する事は難...
タイトルとURLをコピーしました