学習手法 | ページ 13

GSPMD：ニューラルネットワークの規模拡大を可能にする汎用的な並列化手法(1/2)

１．GSPMD：ニューラルネットワークの規模拡大を可能にする汎用的な並列化手法(1/2)まとめ・機械学習アプリケーションではネットワーク規模の拡大が重要であることが判明している・既存の並列化アルゴリズムは実現が大変だったり実装にも汎用性...

2021.12.29

学習手法

１．TokenLearner：柔軟にトークン化する事でVision Transformerの効率と精度を向上(2/2)まとめ・Vision Transformerはトークンの数が多くなってしまう事がボトルネックとなっていた・本研究では多...

2021.12.28

学習手法

１．TokenLearner：柔軟にトークン化する事でVision Transformerの効率と精度を向上(1/2)まとめ・Vision Transformerは画像をトークン単位で扱うので画像の大域的な特徴をつかむ事ができる・課題は...

2021.12.27

学習手法

１．RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(2/2)まとめ・RLDSはEnvLoggerやRLDS CreatorなどのツールでRL用データの収集を楽にする・RLDSはデータセット共有ライブラリであるTF...

2021.12.23

データセット学習手法

１．RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(1/2)まとめ・強化学習アルゴリズムの多くはエージェントが環境と大量に相互作用する学習データが必要・他で収集されたデータセットを再利用する事もできるが仕様がバラ...

2021.12.22

データセット学習手法

１．Implicit BC：ロボットが優柔不断な行動を学習しないようにする(2/2)まとめ・教師あり学習による行動クローニングはロボットが人間から学習する最も簡単な方法の一つ・行動クローニングを行う際には暗黙的なポリシーでより複雑で正確...

2021.12.14

ロボット学習手法

１．Implicit BC：ロボットが優柔不断な行動を学習しないようにする(1/2)まとめ・ロボットは複雑な行動を模倣しようとしたときに優柔不断になる事がある・決断力を向上させるため離散化された行動空間を使用する事が多いが欠点がある・...

2021.12.13

ロボット学習手法

１．視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(2/2)まとめ・順列不変のニューラルネットワークは、未定義で変化する観測空間を扱うことが可能・冗長な情報やノイズの多い情報を含む観測結果や破損した不完全な観測結果に対しても堅...

2021.12.10

学習手法

１．視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(1/2)まとめ・人間は触覚を使って視覚を補う等の驚くべき感覚置換能力を持つが人工知能はこれを持たない・強化学習は入力データサイズが固定されている事や各要素が意味を持つ事を想定...

2021.12.09

学習手法

１．取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(3/3)まとめ・時間的順序をモデル化して行動可逆性を予測し探索と制御を効率化出来る事を示した・自己教師型であるため行動の可逆性に関する事前知識を必要とせず様々な環境に...

2021.11.17

学習手法

１．取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(2/3)まとめ・強化学習に可逆性を統合する手法として探索のRAEと制御のRACを提案した・RAEとRACの重要な違いはRAEは可逆的な動作を推奨するだけで禁止していな...

2021.11.16

学習手法

１．取り返しのつかない行動を避ける可逆性を意識した自己教師型強化学習(1/3)まとめ・強化学習エージェントは試行錯誤を繰り返するで元に戻せない行動をしてしまう事がある・現実のロボットが部品破損につながる可能性のあるアクションを実行するこ...

2021.11.15

学習手法