基礎理論 ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2) 1.ディープなネットワークもワイドなネットワークも同じ事を学習しているのか?(1/2)まとめ ・ニューラルネットワークの性能を調整する際はネットワークの深さや幅が調整される ・しかし精度以外にこれらの違いがどのように影響するかについての理解... 2021.05.13 基礎理論
学会 ICLR 2021におけるGoogleの存在感 1.ICLR 2021におけるGoogleの存在感まとめ ・2021年5月3日(月)から7日(金)まで仮想空間でICLR 2021が開催 ・Google AIブログで概要が発表済みの論文も10存在するので要チェック ・Gradient Bo... 2021.05.12 学会
学習手法 RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2) 1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)まとめ ・シミュレーションの並行実行は簡単ではないためTFのAutoGraphなど最適化の利用が重要 ・RecSim NGにより複雑なマルチエー... 2021.05.11 学習手法
学習手法 RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2) 1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)まとめ ・推薦システムは広く利用されているが公平なサービスを提供するために多くの課題がある ・推薦システムで強化学習アルゴリズムを利用すためシミ... 2021.05.10 学習手法
学習手法 HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(3/3) 1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(3/3)まとめ ・HPPを使用すると、エージェントは軌道を予測して調整し、調整ミスを回避できる ・HPPは追加のトレーニングなしで現実の世界に直接転移させる事が出来る... 2021.05.09 学習手法
学習手法 HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3) 1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(2/3)まとめ ・システムは予測、計画、および制御の3つのモジュールから構成されている ・各エージェントは自分自身の動き用と他のエージェント用の予測モデルを学習 ・予... 2021.05.08 学習手法
学習手法 HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(1/3) 1.HPP:ロボット同士が待ち合わせできるようにするモデルベース強化学習(1/3)まとめ ・制御された環境では一元化されたプランナーを使えば複数ロボットが連携して動作可能 ・現実世界では独立したロボット同士で連携する場合は目標を互いに調整す... 2021.05.07 学習手法
モデル ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2) 1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(2/2) ・Panoptic-DeepLabは複数フレームにおける深度推定やインスタンスID付与ができない ・ViP-DeepLabは2つの連続... 2021.05.06 モデル
モデル ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2) 1.ViP-DeepLab:深度推定とパノプティックセグメンテーションを動画に対して同時に適用(1/2) ・人間は二次元画像である写真から三次元環境に関する視覚情報を非常に簡単に取得できる ・自動運転などを実現するためには同様に平面画像から... 2021.05.05 モデル
モデル 自動進化する強化学習でDDQNを凌駕する(2/2) 1.自動進化する強化学習でDDQNを凌駕する(2/2)まとめ ・発見されたアルゴリズムの中でDQNRegとDQNClippedが優れたパフォーマンスを出した ・これらはDQNが一般的にQ値を過大評価してしまう事を各々の方法で回避している ・... 2021.05.02 モデル学習手法
モデル 自動進化する強化学習でDDQNを凌駕する(1/2) 1.自動進化する強化学習でDDQNを凌駕する(1/2)まとめ ・強化学習の長期的で包括的な目標は様々な問題を解決できる単一の汎用学習アルゴリズムの設計 ・強化学習は多岐にわたるため、学習方法を学習して新しいRLを設計するメタ学習手法が有望 ... 2021.05.01 モデル学習手法
モデル MaX-DeepLab:デュアルパストランスフォーマーを使ってパノプティックセグメンテーションを直接実行(2/2) 1.MaX-DeepLab:デュアルパストランスフォーマーを使ってパノプティックセグメンテーションを直接実行(2/2)まとめ ・MaX-DeepLabはパノプティコンセグメンテーションを直接トレーニングできる初の手法 ・マスクとクラスを直接... 2021.04.30 モデル学習手法