人工知能/機械学習

Brax：Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(3/3)

１．Brax：Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(3/3)まとめ・BraxはCPUだけで実行しても従来の一般的な環境に比べて1桁以上高速に動作する・Braxは高速で規模拡大可能な強化学習とロボ...

2021.07.27

ロボット学習手法

１．Brax：Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(2/3)まとめ・Braxは「シミュレーション時に分岐が発生しない」ことを保証する事で効率化を実現・計算が厳密に同じであるため複雑さを軽減でき、...

2021.07.26

ロボット学習手法

１．Brax：Colabで大規模分散システムを凌駕する強化学習用物理シミュレーションエンジン(1/3)まとめ・強化学習は単純なタスクでも習熟するために数百万から数十億のデータが必要になる・大規模分散システムを使えば迅速に強化学習をトレー...

2021.07.25

ロボット学習手法

１．SSD：半教師あり蒸留を使ってGoogle検索を改善(2/2)まとめ・Noisy Studentとknowledge distillationは似ているが後者はノイズを混入しない・半教師あり蒸留は、生徒に蒸留する前に同等以上の規模の...

2021.07.24

アプリケーション学習手法

１．SSD：半教師あり蒸留を使ってGoogle検索を改善(1/2)まとめ・以前の半教師あり学習はラベル有データが豊富な場合は完全教師あり学習と競合できなかった・Noisy Studentは高データ体制でうまく機能する半教師あり学習でモデ...

2021.07.23

アプリケーション学習手法

１．深層強化学習研究の計算コストの削減(2/2)まとめ・従来の制御環境ではRainbowの論文と異なり分散RLは単体では性能向上に貢献しなかった・Rainbowに採用された各アルゴリズムの貢献度は適用環境ごとに異なる可能性がある・計算...

2021.07.20

学習手法基礎理論

１．深層強化学習研究の計算コストの削減(1/2)まとめ・Rainbowは深層強化学習飛躍のきっかけとなったDQNに更に様々な改良を加えたアルゴリズム・強化学習で論文掲載レベルの検証を行うためにはGCP換算で500万円の高いコストが必要 ...

2021.07.19

学習手法基礎理論

１．Falken：摸倣学習を使用して複雑なゲームを効率的にデバッグ(2/2)まとめ・ゲーム開発者は使用するAPIの組み合わせからどのモデルを選択すべきかわかる・FPS、TPS、レーシング、シューティングゲームなどで制御スキームをモデリン...

2021.07.14

アプリケーション学習手法

１．Falken：摸倣学習を使用して複雑なゲームを効率的にデバッグ(1/2)まとめ・機械学習はゲーム開発に大きな影響を与える可能性があるが実務に応用はまだ難しい・ゲーム開発者がゲームテストエージェントを迅速かつ効率的にトレーニングする手...

2021.07.13

アプリケーション学習手法

１．畳み込みニューラルネットワークは実は特許が取られていた事まとめ・畳み込みニューラルネットワークには1990年代にアメリカで２つの特許が成立していた・AT＆Tの会社分割により研究者と特許が離ればなれになってしまい研究継続が困難になった...

2021.07.09

モデル

１．ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(2/2)まとめ・Wikipedia Biographiesによって機械翻訳の性別バイアス削減度合を評価する事が可能になった・文脈を意識するモデル(contex...

2021.07.07

データセット公平性

１．ニューラル機械翻訳におけるジェンダーバイアスを研究するためのデータセット(1/2)まとめ・ニューラル機械翻訳は学習データ内の偏見やステレオタイプを翻訳に反映してしまう事がある・文を個々に翻訳しており、性別情報は必ずしも個々の文内に明...

2021.07.06

データセット公平性