学習手法 RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2) 1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(2/2)まとめ ・シミュレーションの並行実行は簡単ではないためTFのAutoGraphなど最適化の利用が重要 ・RecSim NGにより複雑なマルチエー... 2021.05.11 学習手法
学習手法 RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2) 1.RecSim NG:柔軟で規模拡大可能で微分可能なシミュレーション付き推薦システム(1/2)まとめ ・推薦システムは広く利用されているが公平なサービスを提供するために多くの課題がある ・推薦システムで強化学習アルゴリズムを利用すためシミ... 2021.05.10 学習手法
入門/解説 RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(3/3) 1.RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(3/3)まとめ ・RecSimは強化学習/推奨アルゴリズムを調査するために十分な機能を持つが拡張機能も存在 ・「sim-to-real」ギャップの部分的解... 2019.11.27 入門/解説
入門/解説 RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(2/3) 1.RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(2/3)まとめ ・ほとんどの推薦システムは静的データセットを使用しておりユーザと実際に対話しているわけではい ・また推薦ポリシーそのものがユーザーの行動に... 2019.11.26 入門/解説
入門/解説 RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(1/3) 1.RecSim:推薦システムに強化学習を使うためのシミュレーションプラットフォーム(1/3)まとめ ・ユーザーニーズに最適に対応するためにユーザーと対話を行う推薦システム、CIRが有望視されている ・しかし、CIRはユーザと対話するアルゴ... 2019.11.25 入門/解説