robotics

ロボット

iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)

1.iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)まとめ ・iGibson Challenge 2021には実際のアパートから派生させた8つの風景が含まれる ・各環境内には人間の挙動...
学習手法

RCE:報酬関数が不要な強化学習(2/2)

1.RCE:報酬関数が不要な強化学習(2/2)まとめ ・自律エージェントに成功事例を提供する事でタスクを実行するように教える方法を提案 ・本手法では報酬関数の設計もエキスパートがデモして成功操作を見せる必要がなくなる ・ユーザーの能力の違い...
学習手法

RCE:報酬関数が不要な強化学習(1/2)

1.RCE:報酬関数が不要な強化学習(1/2)まとめ ・ロボット工学で使われる強化学習は望ましい行動を促すために報酬関数が必要になる ・しかし報酬関数の設定は非常に面倒で手間がかかり追加の設備が必要になるケースがある ・RCEは成功事例を示...
モデル

Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(2/2)

1.Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(2/2)まとめ ・Transporter Netはサンプル効率が高く100回のデモで多くのタスクで90%以上の成功率 ・Transporter N...
モデル

Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(1/2)

1.Transporter Networks:物体の再配置問題を改善してロボットの性能を向上(1/2)まとめ ・本の山を積み重ねるなどの物体の再配置問題は基本的なスキルだがロボットにとって困難 ・従来のオブジェクト中心の特徴表現では変形可能...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(4/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(4/5)まとめ ・アルゴリズム基礎は主に本業の広告オークション関係で注目すべき結果が多かった ・機械知覚は音声と映像を組み合わせて学習する等のマルチモーダルな...
学習手法

オフライン強化学習における未解決の課題への取り組み(2/3)

1.オフライン強化学習における未解決の課題への取り組み(2/3)まとめ ・D4RLは現実的なアプリケーションを念頭に作られたベンチマークである事が特徴 ・タスクの目的と違う目的を実行した記録から学習する能力などが試される ・タスクと標準化さ...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(2/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(2/2)まとめ ・DADSは環境にとらわれないため、ロボット移動タスクにも操作タスクにも適用可能 ・スキルに追加のトレーニングが必要ないため、サンプル効率が非常に高く追加トレーニングが...
学習手法

DADS:教師なしで有用なスキルを発見する強化学習(1/2)

1.DADS:教師なしで有用なスキルを発見する強化学習(1/2)まとめ ・教師有り強化学習はシミュレーション環境を飛び出して現実世界の複雑な動作を学習できるようになった ・しかし、様々なタスク用に報酬関数を手動で設計する必要がありこれがボト...
モデル

深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(3/3)まとめ ・階層強化学習では高レベルポリシーと低レベルポリシーは同時にトレーニングされる ・トレーニング目的はロボットの軌道から得られる総報酬を最大化する事 ・学習完了後は高レベ...
学習手法

深層強化学習の力でロボットが俊敏で知的な移動を実現(2/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(2/3)まとめ ・ロボットにオフィス内を移動させる等の複雑なタスクは速度、方向、高さを複数回調整する必要がある ・従来は複雑なタスクを複数の階層的小タスクに分解することで解決していたが...
学習手法

深層強化学習の力でロボットが俊敏で知的な移動を実現(1/3)

1.深層強化学習の力でロボットが俊敏で知的な移動を実現(1/3)まとめ ・強化学習のサンプル効率の悪さは依然として多くのアルゴリズムにとって主要なボトルネック ・脚式ロボットのためのデータ効率の良い強化学習として効率的な学習方法を発表 ・必...