強化学習

1/22ページ

AttentionAgent:重要度が低い情報を無視する強化学習エージェント(2/2)

AI

1.AttentionAgent:重要度が低い情報を無視する強化学習エージェント(2/2)まとめ ・Attention Agentは主要タスクにとって重要ではない情報を無視するので小規模環境変化に対応可能 ・しかし、背景を猫動画に変更するような劇的に変化した環境にまだ対応できない制限がある ・複雑なタスクには不十分なため、より意味のある特徴を学習する事が今後の研究課題となる 2.Attention […]

AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)

AI

1.AttentionAgent:重要度が低い情報を無視する強化学習エージェント(1/2)まとめ ・人間は選択的注意の仕組みにより膨大な情報を圧縮し意思していると考えられている ・強化学習エージェントは逆に全視覚情報に加えて将来予測まで情報として受け取っている ・注意に制約を課してエージェントの視覚情報を軽減するとパフォーマンスが向上するのではないか? 2.AttentionAgentとは? 以下 […]

DADS:教師なしで有用なスキルを発見する強化学習(2/2)

AI

1.DADS:教師なしで有用なスキルを発見する強化学習(2/2)まとめ ・DADSは環境にとらわれないため、ロボット移動タスクにも操作タスクにも適用可能 ・スキルに追加のトレーニングが必要ないため、サンプル効率が非常に高く追加トレーニングが不要 ・オフポリシー学習化したoff-DADSにより現実世界のロボットに歩行スキルを学習させる事が出来た 2.off-DADSとは? 以下、ai.googleb […]

DADS:教師なしで有用なスキルを発見する強化学習(1/2)

AI

1.DADS:教師なしで有用なスキルを発見する強化学習(1/2)まとめ ・教師有り強化学習はシミュレーション環境を飛び出して現実世界の複雑な動作を学習できるようになった ・しかし、様々なタスク用に報酬関数を手動で設計する必要がありこれがボトルネックとなっている ・DADSは有用な行動、つまりスキルを見つけてそれを強化する事を教師無しで行う事で制限を回避 2.DADSとは? 以下、ai.google […]

深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)

AI

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)まとめ ・階層強化学習では高レベルポリシーと低レベルポリシーは同時にトレーニングされる ・トレーニング目的はロボットの軌道から得られる総報酬を最大化する事 ・学習完了後は高レベルポリシーを再学習させて微調整すれば他の経路にも対応可能 2.階層強化学習の性能 以下、ai.googleblog.comより「Agile and Intell […]

1 22