AI

RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)

1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)まとめ ・シミュレーションの並行実行は簡単ではないためTFのAutoGraphなど最適化の利用が重要 ・RecSim NGにより複雑なマルチ...
AI

RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)

1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)まとめ ・推薦システムは広く利用されているが公平なサービスを提供するために多くの課題がある ・推薦システムで強化学習アルゴリズムを利用すため...
AI

HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(3/3)

1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(3/3)まとめ ・HPPを使用すると、エージェントは軌道を予測して調整し、調整ミスを回避できる ・HPPは追加のトレーニングなしで現実の世界に直接転移させる事が出...
AI

HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3)

1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3)まとめ ・システムは予測、計画、および制御の3つのモジュールから構成されている ・各エージェントは自分自身の動き用と他のエージェント用の予測モデルを学習 ...
AI

HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(1/3)

1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(1/3)まとめ ・制御された環境では一元化されたプランナーを使えば複数ロボットが連携して動作可能 ・現実世界では独立したロボット同士で連携する場合は目標を互いに調...
タイトルとURLをコピーしました