強化学習

AI

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(3/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(3/3)まとめ ・時間的順序をモデル化して行動可逆性を予測し探索と制御を効率化出来る事を示した ・自己教師型であるため行動の可逆性に関する事前知識を必要とせず様々な環...
AI

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)まとめ ・強化学習に可逆性を統合する手法として探索のRAEと制御のRACを提案した ・RAEとRACの重要な違いはRAEは可逆的な動作を推奨するだけで禁止して...
AI

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)まとめ ・強化学習エージェントは試行錯誤を繰り返するで元に戻せない行動をしてしまう事がある ・現実のロボットが部品破損につながる可能性のあるアクションを実行す...
AI

PSM:行動の類似性に着目して強化学習の一般化性能を改善(2/2)

1.PSM:行動の類似性に着目して強化学習の一般化性能を改善(2/2)まとめ ・本研究は効果的な特徴表現を学習するために強化学習で固有構造を活用する利点を示した ・ポリシー類似性指標(PSM)と対照指標埋め込み(CME)の提唱によって強...
AI

PSM:行動の類似性に着目して強化学習の一般化性能を改善(1/2)

1.PSM:行動の類似性に着目して強化学習の一般化性能を改善(1/2)まとめ ・強化学習は意味的に同等なタスク間であっても新タスクへの応用が困難 ・障害物を飛び越えるタスクでは初見の場所に設置された障害物に苦労する ・タスク間で類似し...
タイトルとURLをコピーしました