ヘルスケア DeepCTRL:ニューラルネットワークにルールを教えて制御する試み(3/3) 1.DeepCTRL:ニューラルネットワークにルールを教えて制御する試み(3/3)まとめ ・元データが必ずしもルールに従うとは限らないのでルールの効果は元データに依存 ・DeepCTRLは再トレーニングせずにデータに合わせてルールの強さを変... 2022.02.08 ヘルスケア学習手法
学習手法 DVRL:強化学習を使って学習用データの影響を推定(2/2) 1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ ・DVRLはデータ価値の推定やノイズ影響の除去で従来手法より優れた成果を出した ・学習データが検証/テストデータと異なる分布に由来するドメイン適応シナリオも対応可 ・デ... 2020.11.03 学習手法基礎理論
ロボット ロボット学習のためにシミュレーションと現実のギャップを埋める(4/4) 1.ロボット学習のためにシミュレーションと現実のギャップを埋める(4/4)まとめ ・合成画像とドメイン適応のみで現実世界のデータを使用せずとも一定レベルのパフォーマンスを達成 ・シミュレーションと現実世界の経験を統合するためにドメイン適応を... 2019.12.05 ロボット
ロボット ロボット学習のためにシミュレーションと現実のギャップを埋める(3/4) 1.ロボット学習のためにシミュレーションと現実のギャップを埋める(3/4)まとめ ・シミュレーションのランダム化は現実世界の環境に一般化する上で有望な手法である事がわかっている ・外観のランダム化とダイナミクスのランダム化について個々に評価... 2019.12.04 ロボット
モデル ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4) 1.ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4)まとめ ・ロボットを自律的に学習させるためにはシミュレーションが有用であるが現実世界との間にギャップがある ・現実世界とのギャップは、現実とシミュレーションの間の微妙... 2019.12.02 モデル