TossingBot：物理学と深層学習の統合(1/2)

１．TossingBot：物理学と深層学習の統合(1/2)まとめ

・非構造化環境でロボットを安全に動作させる事は依然として困難
・TossingBotは乱雑な状況で稼働可能なピッキングロボット
・投げたオブジェクトが何処に着地したかを観察して学習していく

２．TossingBotとは？

以下、ai.googleblog.comより「Unifying Physics and Deep Learning with TossingBot」の意訳です。元記事は2019年3月26日、Andy Zengさんによる投稿です。

昨今の技術の進歩により、ロボットが物体を効率的に掴むこと、視覚情報から自己学習すること、あるいは現実世界の経験から学ぶ事さえも可能になりました。しかし、特に非構造化環境(訳注：予想外の事が起こり得る環境。例えば、物体の形状が定まっていない等)では、ロボットは依然として物体を拾い上げ、取り扱いそして配置する際に慎重なオペレーションを必要とします。

例えば、Amazon Robotics Challengeの収納作業で1位になったこのピッキングロボットを考えてみましょう。

この動きは、物体が思わぬ相互作用(ダイナミクス)の影響で落下するのを運動学的な観点から防止している事など、多くを考慮して設計された印象的なシステムです。安定したそして意図的な動きで、物体が滑らないようにグリッパーで物体の運動量を機械的に拘束しています。

このロボットは、他の多くのものと同様に、非構造化世界のダイナミクスに耐えるように設計されています。しかし、ダイナミクスを単に許容するのではなく、ロボットにそれらを有利に利用することを学ばさせ、彼らがより効率的にタスクを完了することを可能にするような物理的「直感」を開発することができるでしょうか？

おそらくそうすることで、ロボットは能力を向上させ、トスする事(訳注：バレーボールのトスのイメージです)、スライディングする事、回転する事、スイングする事、キャッチする事のような複雑な運動技能を習得することができ、災害対応のような対応速度が最も重要な場面において効率的にガレキを除去するロボットのような多くの有用な応用につながる可能性があります。

この概念を探求するために、プリンストン、コロンビア、およびMITの研究者と共同でTossingBotを開発しました。これは、現実世界、つまり乱雑な状況で稼働可能なピッキングロボットです。私達は投げ方を学ぶことによって、TossingBotが以前のシステムの2倍速いピッキング速度を達成できる事を発見しました。動作可能範囲も2倍になります。

TossingBotは、掴み方と投げ方を同時に学習します。視覚的観察（RGB-D画像）を動作を制御するパラメータに落とし込むエンドツーエンドのニューラルネットワークを使用してこれを実現しています。

具体的にはTossingBotは、頭上カメラを使用して自分が投げたオブジェクトが何処に着地したかを観察する事を繰り返し、自己教師機能により時間の経過とともに能力を向上します。より技術的な詳細はarXivに投稿した初期の論文に書かれています。

課題
「物体を投げる事」は、多くの要因が絡み合った、特に困難な作業です。物体を拾う方法（すなわち、「投擲前の前提条件」）から、質量、摩擦、空気力学などのような物体の物理的性質までが関わります。

例えば、ドライバーを持ち手部分(重心に近い）を掴んで投げる場合と金属製の先端部分を掴んで投げた場合では、先端部分を掴んだ方がより遠くに投げる事ができます。

あなたがそれをどのように握ったとしても、ドライバーを投げる事はピンポン玉を投げる事とは信じられないほど異なっています。そして、ピンポン玉は空気抵抗のためドライバーより近くに着地するでしょう。

投げる対象が決まっていない場合、オブジェクトごとにこれらの不確定要素への対処方法を明示的に手動で設計することはほぼ不可能です。

投げる事は多くの要因に左右されます：あなたがそれを拾った方法から、オブジェクトの特性とダイナミクスまで。しかし、ディープラーニングを使って、私達のロボットは個別に手動設計する事に頼るのではなく自らの経験から学ぶ事ができるのです。

これまで、私たちのロボットは多種多様な物体を押したり掴んだりする事を自律的に学習できることを示してきましたが、物体を正確に投げるには発射体物理学のより深い理解が必要です。試行錯誤だけでこの知識を最初から習得するのは、時間と費用がかかるだけでなく、一般的に非常に具体的で注意深く設定されたトレーニング手法を用いなければ学習はできません。

物理学とディープラーニングの統合
TossingBotの基本的な要素は、簡単な物理学とディープラーニングを統合することによって投擲を学ぶことです。これにより、TossingBotは素早くトレーニングして新しいシナリオに一般化することができます。