ロボット

ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)まとめ ・人は他人から学ぶがロボットも同じようにする事ができないか考えた ・しかしロボットは人間と物理的に異なる構造を持つため人間の模倣が困難 ・XIRLは動画から...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)まとめ ・模倣学習の拡張でロボットが未経験の新しいタスクに対応できるようになる可能性を示した ・言語モデルが学習した概念同士の関連がロボットに柔軟性...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)まとめ ・既存のロボット工学は新しい対象やタスク、目標に汎化できるようにする研究が多い ・指示を元に全く新しいタスクをロボットが実行できるようになる...
ロボット

Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2)

1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2)まとめ ・教師あり学習による行動クローニングはロボットが人間から学習する最も簡単な方法の一つ ・行動クローニングを行う際には暗黙的なポリシーでより複雑で正確...
ロボット

Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2)

1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2)まとめ ・ロボットは複雑な行動を模倣しようとしたときに優柔不断になる事がある ・決断力を向上させるため離散化された行動空間を使用する事が多いが欠点がある ・...
ロボット

Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(3/3)

1.Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(3/3)まとめ ・BraxはCPUだけで実行しても従来の一般的な環境に比べて1桁以上高速に動作する ・Braxは高速で規模拡大可能な強化学習とロボ...
ロボット

Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(2/3)

1.Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(2/3)まとめ ・Braxは「シミュレーション時に分岐が発生しない」ことを保証する事で効率化を実現 ・計算が厳密に同じであるため複雑さを軽減でき、...
ロボット

Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(1/3)

1.Brax:Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(1/3)まとめ ・強化学習は単純なタスクでも習熟するために数百万から数十億のデータが必要になる ・大規模分散システムを使えば迅速に強化学習をトレー...
ロボット

ロボット工学におけるA/Bテストの重要性の検証(2/2)

1.ロボット工学におけるA/Bテストの重要性の検証(2/2)まとめ ・制御された単純な環境で行う実験であっても意図せず現実世界の変動の影響を受ける ・ランダム割り当てでデータをランダムにグループ化するとA/Bテストを実現できる ・相対パフォ...
ロボット

ロボット工学におけるA/Bテストの重要性の検証(1/2)

1.ロボット工学におけるA/Bテストの重要性の検証(1/2)まとめ ・自然科学、社会科学、医学などは変化する現実世界の中で結果を評価および比較している ・機械学習研究の大部分は固定した世界で仮定に依存する手法を使用して比較をしている ・制御...
ロボット

MT-OptとActionable Models:複数ロボットで自動データ収集を行って初見タスクを実行可能にする(3/3)

1.MT-OptとActionable Models:複数ロボットで自動データ収集を行って初見タスクを実行可能にする(3/3)まとめ ・MT-Optでデータ収集が容易になったがより広いタスクを学習させる事を検討した ・目標条件付き学習は「目...
ロボット

MT-OptとActionable Models:複数ロボットで自動データ収集を行って初見タスクを実行可能にする(2/3)

1.MT-OptとActionable Models:複数ロボットで自動データ収集を行って初見タスクを実行可能にする(2/3)まとめ ・大規模マルチタスクデータ収集システムのタスク間バランスを取りMT-Optを構成 ・MT-Optを使用する...