ロボット

ロボット

ロボットが地形を見て適切な歩き方を選択できるようになる(2/2)

1.ロボットが地形を見て適切な歩き方を選択できるようになる(2/2)まとめ ・最初にセマンティックセグメンテーションモデルを学習させる事で学習を効率化 ・速度ポリシーからの指令に基づいて歩行スタイルを計算するようにした ・登山同を従来手法よ...
ロボット

ロボットが地形を見て適切な歩き方を選択できるようになる(1/2)

1.ロボットが地形を見て適切な歩き方を選択できるようになる(1/2)まとめ ・4足歩行ロボットの能力は大幅に向上したが不整地を対象とした研究は少ない ・不整地では地形特性の推定が重要だが既存の知覚運動システムでは困難 ・階層的な学習フレーム...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(3/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(3/3)まとめ ・2脚バランスタスクでは2脚だけで最大4回ジャンプしてバランスを維持することができた ・実世界で自律的かつ安全にロボットが脚式運動スキルを学習できることが示唆された。 ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(2/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(2/3)まとめ ・ロボットを使い効率的歩行、キャットウォーク、2脚バランスタスクで実験を行った ・学習者ポリシーは安全回復ポリシーを発動する必要性を回避しながら学習できた ・安全トリガ...
ロボット

脚式ロボットが学習時に転倒して破損しないようにする(1/3)

1.脚式ロボットが学習時に転倒して破損しないようにする(1/3)まとめ ・脚式ロボットはは本質的に不安定であり学習中にロボットが転倒し破損する可能性がある ・仮想空間で学習させる事もできるが現実世界に転移学習する際に微妙な違いが問題を引き起...
ロボット

VFS:強化学習で長期目線が必要な行動を実現(2/2)

1.VFS:強化学習で長期目線が必要な行動を実現(2/2)まとめ ・各遷移に影響を与えその結果を予測するために必要な機能情報はVFS特徴表現内にある ・原理的には高レベルのエージェントがすべてのスキルを連鎖させる事が可能になる ・VFSは風...
モデル

VFS:強化学習で長期目線が必要な行動を実現(1/2)

1.VFS:強化学習で長期目線が必要な行動を実現(1/2)まとめ ・強化学習の進歩によりロボットは複雑なタスクを実行できるようになった ・しかし、可能なのは短期目線タスクで長期目線が必要なタスクは困難 ・VFSで長期目線を持たせると状態と行...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)まとめ ・人は他人から学ぶがロボットも同じようにする事ができないか考えた ・しかしロボットは人間と物理的に異なる構造を持つため人間の模倣が困難 ・XIRLは動画から...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)まとめ ・模倣学習の拡張でロボットが未経験の新しいタスクに対応できるようになる可能性を示した ・言語モデルが学習した概念同士の関連がロボットに柔軟性...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)まとめ ・既存のロボット工学は新しい対象やタスク、目標に汎化できるようにする研究が多い ・指示を元に全く新しいタスクをロボットが実行できるようになる...
モデル

Pathdreamer:馴染のない建物内で何処に何がありそうか予測するAI(2/2)

1.Pathdreamer:馴染のない建物内で何処に何がありそうか予測するAI(2/2)まとめ ・Pathdreamerはベースラインと比較して成功率を10%高くする事ができる ・現実世界を実際に移動するエージェントより成功率は低いが時間と...