simulation

モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)まとめ・ポリシーの学習には10台のロボットで11ヶ月間収集したデモデータ+αを使用・更にシミュレーションでオンラインデータを収集し...
データセット

Scanned Objects dataset:日用品を3Dスキャンしたデータセット(2/2)

1.Scanned Objects dataset:日用品を3Dスキャンしたデータセット(2/2)まとめ・初期のスキャンモデルで摩擦や変形などの表面特性がなくシミュレーションに不適だった・スキャンモデルをシミュレーションで利用できるようにす...
データセット

Scanned Objects dataset:日用品を3Dスキャンしたデータセット(1/2)

1.Scanned Objects dataset:日用品を3Dスキャンしたデータセット(1/2)まとめ・コンピュータビジョンとロボット工学の進歩は多種多様なデータによって可能に必要となる・データセットの作成には多大な労力が必要だがそれでも...
学習手法

PRIME:過去のシミュレーションログ使ってアクセラレータを新規に設計(3/3)

1.PRIME:のシミュレーションログ使ってアクセラレータを新規に設計(3/3)まとめ・PRIMEは複数アプリケーション対応とゼロショット対応の2つの目的で設計されている・一部モデルではシミュレータ駆動型の方が待ち時間が短いがPRIMEはメ...
ヘルスケア

COVID-19疫学のための機械学習ベースのフレームワーク(2/2)

1.COVID-19疫学のための機械学習ベースのフレームワーク(2/2)まとめ・COVID19 ForecastHubに登録されている他のモデルをほぼ上回った・本フレームワークでは仮定に基づいてシミュレーションができる・特定のグループでモデ...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(1/2)まとめ・ロボットに硬い物体を掴ませる研究は多いが変形可能な物体を対象とした研究は多くない・変形可能な物体を操作するためには物体の輪郭を指定する必要がありこれが...
学習手法

RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)

1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)まとめ・シミュレーションの並行実行は簡単ではないためTFのAutoGraphなど最適化の利用が重要・RecSim NGにより複雑なマルチエージェ...
学習手法

RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)

1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)まとめ・推薦システムは広く利用されているが公平なサービスを提供するために多くの課題がある・推薦システムで強化学習アルゴリズムを利用すためシミュレ...
学習手法

HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3)

1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3)まとめ・システムは予測、計画、および制御の3つのモジュールから構成されている・各エージェントは自分自身の動き用と他のエージェント用の予測モデルを学習・予測を使...
ロボット

iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)

1.iGibson Challenge:ロボットは人の邪魔にならないように建物内を移動出来るのか?(2/2)まとめ・iGibson Challenge 2021には実際のアパートから派生させた8つの風景が含まれる・各環境内には人間の挙動を模...
アプリケーション

ゲーム開発に機械学習を活用(1/2)

1.ゲーム開発に機械学習を活用(1/2)まとめ・オンラインーゲームの人気は爆発的に高まっているがバランス調整は手間がかかる・機械学習を使って何百万回ものシミュレーションを実行してバランスを取る事が可能・ゲーム状態を画像をエンコーディングして...
入門/解説

RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2)

1.RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2)まとめ・RWRLは現在のRLが抱える9つの異なる課題のうち8つに関連する実験を行う機能を提供・複数の課題と難易度レベルを組み合わせた環境でアルゴリズムをテストする事...