ベンチマーク

AI

Axial-DeepLab:パノプティックセグメンテーション用にattentionを改良(2/2)

1.Axial-DeepLab:パノプティックセグメンテーション用にattentionを改良(2/2)まとめ ・self-attentionは離れた位置の情報も集約できるが位置情報は提供しなかった ・相対位置などの情報を特徴表現に含める...
AI

対照学習で最良のビューを選択するための原則(2/2)

1.対照学習で最良のビューを選択するための原則(2/2)まとめ ・InfoMin仮説を検証のため相互情報量を徐々に減らすと逆U字型の曲線が観察される ・アーキテクチャ等の違いにもかかわらず、直近の対照学習は暗黙的にInfoMin仮説に従...
AI

オフライン強化学習における未解決の課題への取り組み(3/3)

1.オフライン強化学習における未解決の課題への取り組み(3/3)まとめ ・オフラインRLを改善するためには履歴データにない行動を学習する必要がある ・既存手法は履歴データにない行動を過度に過大評価してしまう問題があった ・基本的に悲観...
AI

オフライン強化学習における未解決の課題への取り組み(2/3)

1.オフライン強化学習における未解決の課題への取り組み(2/3)まとめ ・D4RLは現実的なアプリケーションを念頭に作られたベンチマークである事が特徴 ・タスクの目的と違う目的を実行した記録から学習する能力などが試される ・タスクと標...
AI

オフライン強化学習における未解決の課題への取り組み(1/3)

1.オフライン強化学習における未解決の課題への取り組み(1/3)まとめ ・強化学習は医療など試行錯誤によるデータ収集が難しい現実世界には適用が難しい ・オフラインRLは実際に動かさなくても過去に収集されたデータを使って学習可能なため有望...
タイトルとURLをコピーしました