ロボット

ロボット

Table Tennis:俊敏な動きを研究するためにロボットと卓球をする(2/2)

1.Table Tennis:俊敏な動きを研究するためにロボットと卓球をする(2/2)まとめ ・実データだけで学習する事が望ましい場合もあるが既存手法には問題があった ・GoalsEyeでは行動クローニング技術を組み合わせて徐々に継続的に学...
ロボット

Table Tennis:俊敏な動きを研究するためにロボットと卓球をする(1/2)

1.Table Tennis:俊敏な動きを研究するためにロボットと卓球をする(1/2)まとめ ・卓球は人間や他のロボットと対戦できるので強化学習の試験環境として有用 ・モデルがなければデータが収集できないがデータがなければモデルの学習は不可...
ロボット

ロボットが地形を見て適切な歩き方を選択できるようになる(2/2)

1.ロボットが地形を見て適切な歩き方を選択できるようになる(2/2)まとめ ・最初にセマンティックセグメンテーションモデルを学習させる事で学習を効率化 ・速度ポリシーからの指令に基づいて歩行スタイルを計算するようにした ・登山同を従来手法よ...
ロボット

ロボットが地形を見て適切な歩き方を選択できるようになる(1/2)

1.ロボットが地形を見て適切な歩き方を選択できるようになる(1/2)まとめ ・4足歩行ロボットの能力は大幅に向上したが不整地を対象とした研究は少ない ・不整地では地形特性の推定が重要だが既存の知覚運動システムでは困難 ・階層的な学習フレーム...
モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)まとめ ・ポリシーの学習には10台のロボットで11ヶ月間収集したデモデータ+αを使用 ・更にシミュレーションでオンラインデータを収...
モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)まとめ ・ロボットは明確なタスク定義を用いて学習しているので曖昧な指示が苦手 ・言語モデルは曖昧な指示も理解できるが現実世界を知ら...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(3/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(3/3)まとめ ・2脚バランスタスクでは2脚だけで最大4回ジャンプしてバランスを維持することができた ・実世界で自律的かつ安全にロボットが脚式運動スキルを学習できることが示唆された。 ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(2/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(2/3)まとめ ・ロボットを使い効率的歩行、キャットウォーク、2脚バランスタスクで実験を行った ・学習者ポリシーは安全回復ポリシーを発動する必要性を回避しながら学習できた ・安全トリガ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(1/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(1/3)まとめ ・脚式ロボットはは本質的に不安定であり学習中にロボットが転倒し破損する可能性がある ・仮想空間で学習させる事もできるが現実世界に転移学習する際に微妙な違いが問題を引き起...
ロボット

VFS:強化学習で長期目線が必要な行動を実現(2/2)

1.VFS:強化学習で長期目線が必要な行動を実現(2/2)まとめ ・各遷移に影響を与えその結果を予測するために必要な機能情報はVFS特徴表現内にある ・原理的には高レベルのエージェントがすべてのスキルを連鎖させる事が可能になる ・VFSは風...
モデル

VFS:強化学習で長期目線が必要な行動を実現(1/2)

1.VFS:強化学習で長期目線が必要な行動を実現(1/2)まとめ ・強化学習の進歩によりロボットは複雑なタスクを実行できるようになった ・しかし、可能なのは短期目線タスクで長期目線が必要なタスクは困難 ・VFSで長期目線を持たせると状態と行...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高...