基礎理論 RLiable: 強化学習における信頼性の高い性能評価指標(2/2)
1.RLiable: 強化学習における信頼性の高い性能評価指標(2/2)まとめ ・同じ実験を他で繰り返した場合の集約指標を予測する層別ブートストラップ信頼区間を提唱 ・パフォーマンスプロファイルによりアルゴリズム間の定性的な比較が一目瞭然と...
基礎理論
基礎理論
プライバシー
入門/解説