強化学習

AI

JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)

1.JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)まとめ ・JSRLは任意の初期ガイドポリシーや微調整アルゴリズムと組み合わせて使用する事が可能 ・視覚ベースタスクでも他のすべての手法よりも高速に改善可能で...
AI

JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(1/2)

1.JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(1/2)まとめ ・強化学習は試行錯誤でタスクを実行するがゼロからポリシーを学習する事は難しい ・例えば複雑でゴールにどれだけ近づいているかを測定できないようなタスク...
AI

視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(2/2)

1.視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(2/2)まとめ ・順列不変のニューラルネットワークは、未定義で変化する観測空間を扱うことが可能 ・冗長な情報やノイズの多い情報を含む観測結果や破損した不完全な観測結果に対して...
AI

視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(1/2)

1.視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(1/2)まとめ ・人間は触覚を使って視覚を補う等の驚くべき感覚置換能力を持つが人工知能はこれを持たない ・強化学習は入力データサイズが固定されている事や各要素が意味を持つ事を...
AI

RLiable: 強化学習における信頼性の高い性能評価指標(2/2)

1.RLiable: 強化学習における信頼性の高い性能評価指標(2/2)まとめ ・同じ実験を他で繰り返した場合の集約指標を予測する層別ブートストラップ信頼区間を提唱 ・パフォーマンスプロファイルによりアルゴリズム間の定性的な比較が一目瞭...
タイトルとURLをコピーしました