ロボット

ロボット

再始動したGoogleのロボットプロジェクトの内情

1.再始動したGoogleのロボットプロジェクトの内情まとめ ・2013年にGoogleが始動した人間そっくりのロボットを作るプロジェクトは頓挫 ・現在のプロジェクトは機械学習を用いてシンプルなロボットアーム等を自律学習させる方向にシフト ...
AI関連その他

TossingBot:物理学と深層学習の統合(2/2)

1.TossingBot:物理学と深層学習の統合(2/2)まとめ ・TossingBotは物理学と深層学習、及び残差物理学を組み合わせて高性能を実現 ・残差物理学とは物理学が提供する理論値と現実世界のズレをニューラルネットワークで埋める作業...
ロボット

TossingBot:物理学と深層学習の統合(1/2)

1.TossingBot:物理学と深層学習の統合(1/2)まとめ ・非構造化環境でロボットを安全に動作させる事は依然として困難 ・TossingBotは乱雑な状況で稼働可能なピッキングロボット ・投げたオブジェクトが何処に着地したかを観察し...
入門/解説

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)まとめ ・SimPLeはモデルベース強化学習でありサンプル効率性が高い ・他のモデルフリー強化学習の2倍程度のサンプル効率性を達成 ・モデルフリー強化学習のパフォーマ...
ロボット

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)まとめ ・PRM-RLにAutoRLでトレーニングしたローカルプランナーを組み合わせる等多数の改良をした ・SLAMマップでsim2realギャップの解消に成功...
AI関連その他

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)まとめ ・PRMのようなサンプリングベースのプランナーを使う事によって長距離ナビゲーションを実現できる ・強化学習ベースのローカルプランナーがノード間を接続でき...
学習手法

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)まとめ ・AutoMLの強化学習版であるAutoRLを使ってロボットを遠く離れた場所までお使いに行かせる研究 ・現在のロボットは近距離を安全に移動するためのロー...
入門/解説

GPT-2が自動生成したその他の文章(3/3)

1.GPT-2が自動生成したその他の文章(3/3)まとめ ・GPT-2が自動作成した事実を強引に捻じ曲げる文章とフェイクニュースの2つの紹介 ・どちらも25回の試行を行っているためGPT-2的には作りにくい文章だったかもしれないが出来が良い...
入門/解説

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3)

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3)まとめ ・強化学習はアクションに対するフィードバック(報酬)が重要 ・報酬が疎であったり報酬に繋がる行動が不明では学習が困難 ・特に仕様が不明確な報酬は予想外の行動に繋がる可能...
学習手法

PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3)

1.PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3)まとめ ・PlaNetは一つのエージェントで6つの異なるタスクを行うように訓練する事ができた ・比較的単純なタスクに対する学習は遅かったが複雑なタスクは素早く学習し高いレベルに...
学習手法

PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3)

1.PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3)まとめ ・エージェントは特定の操作によってボールの位置やゴールまでの距離がどのように変化するか想像出来る ・大量の計算が必要な画像作成を省略し将来の報酬を予測するだけでよいので...
学習手法

PlaNet:画像入力から世界モデルを学ぶ強化学習(1/3)

1.PlaNet:画像入力から世界モデルを学ぶ強化学習(1/3)まとめ ・PlaNetはモデルベース(Model-based)強化学習であり世界モデルを学ぶ強化学習 ・世界モデルを学ぶと従来より少ないデータで効率的な学習を行う事ができる ・...