基礎理論 RLiable: 強化学習における信頼性の高い性能評価指標(2/2) 1.RLiable: 強化学習における信頼性の高い性能評価指標(2/2)まとめ ・同じ実験を他で繰り返した場合の集約指標を予測する層別ブートストラップ信頼区間を提唱 ・パフォーマンスプロファイルによりアルゴリズム間の定性的な比較が一目瞭然と... 2021.12.06 基礎理論
基礎理論 RLiable: 強化学習における信頼性の高い性能評価指標(1/2) 1.RLiable: 強化学習における信頼性の高い性能評価指標(1/2)まとめ ・平均値や中央値などを評価指標にしたままでは強化学習の性能を見誤る可能性がある ・より多く試行して性能評価する事は限られた計算機資源の観点から現実的ではない ・... 2021.12.05 基礎理論
プライバシー FedJAX:連合学習のシミュレーションをJAXで容易に実行(2/2) 1.FedJAX:連合学習のシミュレーションをJAXで容易に実行(2/2)まとめ ・GPU、TPU 1 TensorCore、マルチコアTPUと2つのデータセットでFedJAXを評価 ・TPUを使用するとfederated EMNIST-6... 2021.10.09 プライバシー
入門/解説 その転移学習は本当に有用なのか?(1/3) 1.その転移学習は本当に有用なのか?(1/3)まとめ ・転移学習は医療用画像処理タスクのパフォーマンスに大きな影響を与えていない事がわかった ・医療用画像処理タスクでは小さいモデルが大きなモデルに匹敵するパフォーマンスを出せていた ・大きな... 2019.12.10 入門/解説