simulation

入門/解説

RWRL:強化学習の課題に取り組むための一連のシミュレーション(1/2)

1.RWRL:強化学習の課題に取り組むための一連のシミュレーション(1/2)まとめ ・成功している強化学習はシミュレータが利用可能か動作環境が安価に利用可能である ・シミュレーターが利用できない環境で強化学習を実際の製品に展開する事は難しい...
公平性

ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(3/3)

1.ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(3/3)まとめ ・機会均等エージェントは公平性を担保しようとして多くの貸付を行い信用格差を拡大する側面がある ・重視する指標が「グループ間の信用格差」なのか...
入門/解説

ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(2/3)

1.ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(2/3)まとめ ・固定したデータセットを利用した公平性の確認は2つの欠陥がある事が知られている ・第一にテストセットが不完全かシステム固有のバイアスを内包し...
入門/解説

ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(1/3)

1.ML-fairness-gym:機械学習システムの長期的な影響を調査するツール(1/3)まとめ ・機械学習の公平性は一般的に固定したデータセットを利用して公平性を確認する事で行われる ・機械学習の影響を受けたデータが次の入力に使われるよ...
ロボット

ロボット学習のためにシミュレーションと現実のギャップを埋める(4/4)

1.ロボット学習のためにシミュレーションと現実のギャップを埋める(4/4)まとめ ・合成画像とドメイン適応のみで現実世界のデータを使用せずとも一定レベルのパフォーマンスを達成 ・シミュレーションと現実世界の経験を統合するためにドメイン適応を...
ロボット

ロボット学習のためにシミュレーションと現実のギャップを埋める(3/4)

1.ロボット学習のためにシミュレーションと現実のギャップを埋める(3/4)まとめ ・シミュレーションのランダム化は現実世界の環境に一般化する上で有望な手法である事がわかっている ・外観のランダム化とダイナミクスのランダム化について個々に評価...
ロボット

ロボット学習のためにシミュレーションと現実のギャップを埋める(2/4)

1.ロボット学習のためにシミュレーションと現実のギャップを埋める(2/4)まとめ ・ロボットが直面するシミュレーションと現実世界のギャップを埋めるためには以下が重要 ・シミュレートされた経験がニューラルネットワークにとって現実世界と変わらな...
モデル

ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4)

1.ロボット学習のためにシミュレーションと現実のギャップを埋める(1/4)まとめ ・ロボットを自律的に学習させるためにはシミュレーションが有用であるが現実世界との間にギャップがある ・現実世界とのギャップは、現実とシミュレーションの間の微妙...
入門/解説

偏微分方程式をより良く近似するために機械学習を利用(2/2)

1.偏微分方程式をより良く近似するために機械学習を利用(2/2)まとめ ・人間によるヒューリスティックな観察をニューラルネットワークに学習させる事が基本的アイディア ・ニューラルネットワークを従来のシミュレーション手法の要素と組み合わせる事...
入門/解説

偏微分方程式をより良く近似するために機械学習を利用(1/2)

1.偏微分方程式をより良く近似するために機械学習を利用(1/2)まとめ ・スーパーコンピュータであっても物理現象をモデル化するためには性能が不十分 ・精度を上げようとすると計算量が10の四乗で増えいくため手に負えない ・方程式を計算ではなく...
入門/解説

数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(3/3)

1.数学的プログラミング:データサイエンス能力を進化させるための大事な習慣(3/3) ・数学的プログラミングの本質は数学的性質やパターンをプログラムでテストする事 ・この習慣は次世代のデータサイエンティストのためのグッドプラクティスの開発に...
入門/解説

SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)

1.SimPLe:ビデオモデルを用いてポリシー学習をシミュレート(2/2)まとめ ・SimPLeはモデルベース強化学習でありサンプル効率性が高い ・他のモデルフリー強化学習の2倍程度のサンプル効率性を達成 ・モデルフリー強化学習のパフォーマ...