基礎理論 BERTは文法を理解しているのか?頻度を見ているだけなのか?(2/2) 1.BERTは文法を理解しているのか?頻度を見ているだけなのか?(2/2)まとめ ・BERTは主語と動詞の一致ルールで単純な経験則モデルより良い性能である ・主語と動詞が一致すべき事と高頻度の単語がより可能性が高い事を知っている ・一致が従... 2021.12.25 基礎理論
基礎理論 BERTは文法を理解しているのか?頻度を見ているだけなのか?(1/2) 1.BERTは文法を理解しているのか?頻度を見ているだけなのか?(1/2)まとめ ・言語モデルは機能する理由が不透明な事が多く更なる改善の妨げになっている ・英語の主語と動詞の一致規則を正しく適用するBERTモデルの能力を調査した ・初見の... 2021.12.24 基礎理論
データセット RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(2/2) 1.RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(2/2)まとめ ・RLDSはEnvLoggerやRLDS CreatorなどのツールでRL用データの収集を楽にする ・RLDSはデータセット共有ライブラリであるTF... 2021.12.23 データセット学習手法
データセット RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(1/2) 1.RLDS: 強化学習用データセットの生成と共有をやりやすくするツール群(1/2)まとめ ・強化学習アルゴリズムの多くはエージェントが環境と大量に相互作用する学習データが必要 ・他で収集されたデータセットを再利用する事もできるが仕様がバラ... 2021.12.22 データセット学習手法
モデル MURAL:ヒンディー語で野菜を入れない麺が入った丼を検索されても対応画像を探せる人工知能(2/2) 1.MURAL:ヒンディー語で野菜を入れない素の麺が入った丼を検索されても対応画像を探せる人工知能(1/2)まとめ ・翻訳ペアを用いて共同で学習させるとリソース不足言語のクロスモーダル検索能力を向上可 ・また、マルチモーダルモデルは言語同士... 2021.12.19 モデル
モデル MURAL:ヒンディー語で野菜を入れない麺が入った丼を検索されても対応画像を探せる人工知能(1/2) 1.MURAL:ヒンディー語で野菜を入れない素の麺が入った丼を検索されても対応画像を探せる人工知能(1/2)まとめ ・概念の多くは、ある言語から別の言語への直接的に一対一に翻訳する事ができない ・連想するものが異なるためだが概念のイメージを... 2021.12.18 モデル
入門/解説 Amazon SageMaker Studio Lab:無料版Google Colabの強力なライバル 1.Amazon SageMaker Studio Lab:無料版Google Colabの強力なライバルまとめ ・Amazon SageMaker Studio LabはAmazonが提供する無料のJupyterLab環境 ・Google... 2021.12.17 入門/解説インフラ
ロボット Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2) 1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(2/2)まとめ ・教師あり学習による行動クローニングはロボットが人間から学習する最も簡単な方法の一つ ・行動クローニングを行う際には暗黙的なポリシーでより複雑で正確... 2021.12.14 ロボット学習手法
ロボット Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2) 1.Implicit BC:ロボットが優柔不断な行動を学習しないようにする(1/2)まとめ ・ロボットは複雑な行動を模倣しようとしたときに優柔不断になる事がある ・決断力を向上させるため離散化された行動空間を使用する事が多いが欠点がある ・... 2021.12.13 ロボット学習手法
学習手法 視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(2/2) 1.視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(2/2)まとめ ・順列不変のニューラルネットワークは、未定義で変化する観測空間を扱うことが可能 ・冗長な情報やノイズの多い情報を含む観測結果や破損した不完全な観測結果に対しても堅... 2021.12.10 学習手法
学習手法 視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(1/2) 1.視覚を聴覚で補うような脳の感覚置換能力を実現する強化学習(1/2)まとめ ・人間は触覚を使って視覚を補う等の驚くべき感覚置換能力を持つが人工知能はこれを持たない ・強化学習は入力データサイズが固定されている事や各要素が意味を持つ事を想定... 2021.12.09 学習手法
基礎理論 RLiable: 強化学習における信頼性の高い性能評価指標(2/2) 1.RLiable: 強化学習における信頼性の高い性能評価指標(2/2)まとめ ・同じ実験を他で繰り返した場合の集約指標を予測する層別ブートストラップ信頼区間を提唱 ・パフォーマンスプロファイルによりアルゴリズム間の定性的な比較が一目瞭然と... 2021.12.06 基礎理論