robotics

モデル

VFS:強化学習で長期目線が必要な行動を実現(1/2)

1.VFS:強化学習で長期目線が必要な行動を実現(1/2)まとめ ・強化学習の進歩によりロボットは複雑なタスクを実行できるようになった ・しかし、可能なのは短期目線タスクで長期目線が必要なタスクは困難 ・VFSで長期目線を持たせると状態と行...
学習手法

JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)

1.JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)まとめ ・JSRLは任意の初期ガイドポリシーや微調整アルゴリズムと組み合わせて使用する事が可能 ・視覚ベースタスクでも他のすべての手法よりも高速に改善可能で最も...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(2/2)まとめ ・XIRLは実演者と学習者が異なる形状である際の模倣問題に取り組む手法 ・時間的サイクル整合性を用いて実施形態に依存しない報酬関数を学習 ・サンプル効率が高...
ロボット

XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)

1.XIRL:人と形状が異なるロボットは人から学ぶ事が出来るのか?(1/2)まとめ ・人は他人から学ぶがロボットも同じようにする事ができないか考えた ・しかしロボットは人間と物理的に異なる構造を持つため人間の模倣が困難 ・XIRLは動画から...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(2/2)まとめ ・模倣学習の拡張でロボットが未経験の新しいタスクに対応できるようになる可能性を示した ・言語モデルが学習した概念同士の関連がロボットに柔軟性...
ロボット

BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)

1.BC-Z:ロボットは完全に新しい作業を指示に従って実行できるようになれるのか?(1/2)まとめ ・既存のロボット工学は新しい対象やタスク、目標に汎化できるようにする研究が多い ・指示を元に全く新しいタスクをロボットが実行できるようになる...
ロボット

Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2)

1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2)まとめ ・教師あり学習による行動クローニングはロボットが人間から学習する最も簡単な方法の一つ ・行動クローニングを行う際には暗黙的なポリシーでより複雑で正確...
ロボット

Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2)

1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2)まとめ ・ロボットは複雑な行動を模倣しようとしたときに優柔不断になる事がある ・決断力を向上させるため離散化された行動空間を使用する事が多いが欠点がある ・...
学習手法

取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)

1.取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)まとめ ・強化学習エージェントは試行錯誤を繰り返するで元に戻せない行動をしてしまう事がある ・現実のロボットが部品破損につながる可能性のあるアクションを実行するこ...
モデル

Pathdreamer:馴染のない建物内で何処に何がありそうか予測するAI(1/2)

1.Pathdreamer:馴染のない建物内で何処に何がありそうか予測するAI(1/2)まとめ ・人はなじみのない建物内でも視覚的な手がかりを利用して効率的に移動できる ・この機能をAIで実現するためには「視覚的な世界モデル」の実装が必要と...
学習手法

SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(2/2)

1.SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(2/2)まとめ ・GANは現実世界の軌道と区別できない合成軌道を生成するためにも使用できる ・これによりシステム同定を手動ではなくGANを使用して実行する事ができる ・Si...
学習手法

SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(1/2)

1.SimGAN:敵対的強化学習を使い正確な物理シミュレータを構築(1/2)まとめ ・物理シミュレーションはロボットがスキルを習得するための活動の場を提供する ・現実のロボットの動きを元により正確な物理シミュレーターを開発できないか考えた ...