dahara1

ロボット

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)まとめ ・PRM-RLにAutoRLでトレーニングしたローカルプランナーを組み合わせる等多数の改良をした ・SLAMマップでsim2realギャップの解消に成功...
AI関連その他

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)まとめ ・PRMのようなサンプリングベースのプランナーを使う事によって長距離ナビゲーションを実現できる ・強化学習ベースのローカルプランナーがノード間を接続でき...
学習手法

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)まとめ ・AutoMLの強化学習版であるAutoRLを使ってロボットを遠く離れた場所までお使いに行かせる研究 ・現在のロボットは近距離を安全に移動するためのロー...
入門/解説

GPT-2が自動生成したその他の文章(3/3)

1.GPT-2が自動生成したその他の文章(3/3)まとめ ・GPT-2が自動作成した事実を強引に捻じ曲げる文章とフェイクニュースの2つの紹介 ・どちらも25回の試行を行っているためGPT-2的には作りにくい文章だったかもしれないが出来が良い...
入門/解説

GPT-2が自動生成したその他の文章(2/3)

1.GPT-2が自動生成したその他の文章(2/3)まとめ ・GPT-2が得意とする文章である指輪物語の二次創作と宿題 ・指輪物語は物語内に出てくる固有名詞しか使っておらず物語としてほぼ成立している ・宿題の方はダラダラと要旨を掴みにくい文章...
入門/解説

GPT-2が自動生成したその他の文章(1/3)

1.GPT-2が自動生成したその他の文章(1/3)まとめ ・GPT-2が出力したユニコーン以外の文章の紹介 ・プレスリリース、ニュース、芸能ニュース、の3種類 ・部署名等は実在の名称を入れてくるので流し読みしていると読めてしまう 2.GPT...
学習手法

MT-DNN:BERTを凌駕するMicrosoftの新しいNLPモデル

1.MT-DNN:BERTを凌駕するMicrosoftの新しいNLPモデルまとめ ・MT-DNNはマイクロソフトが発表した新しい自然言語処理モデルでBERTを上回るスコアを出した ・2015年に提案したモデルに基づいて構築されマルチタスク学...
モデル

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)まとめ ・報酬が疎になる作業を学習させるためにカルバック・ライブラー情報量(KL)を利用している ・カルバック・ライブラー情報量は、2つの異なる確率分布がどの程度異なるかを示す...
学習手法

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3)

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3)まとめ ・偶然成功した行動は強化学習エージェントが作業を一般化する際に有害な影響を与える ・MeRLでは成功した行動の特徴に基づいて偶然の成功と意図的な成功を区別した補助的な報...
入門/解説

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3)

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3)まとめ ・強化学習はアクションに対するフィードバック(報酬)が重要 ・報酬が疎であったり報酬に繋がる行動が不明では学習が困難 ・特に仕様が不明確な報酬は予想外の行動に繋がる可能...
量子コンピュータ

量子プロセッサの極低温制御への道(2/2)

1.量子プロセッサの極低温制御への道(2/2)まとめ ・配線の問題をクリアするため量子ビットを制御する装置を極低温で稼働可能にする必要があった ・なおかつ、装置内の温度を上げて量子の活動に影響を与えないために消費電力を抑える必要もあった ・...
入門/解説

量子プロセッサの極低温制御への道(1/2)

1.量子プロセッサの極低温制御への道(1/2)まとめ ・Googleの試算によれば第一世代の量子コンピュータはおよそ100万量子ビットを必要とする ・Googleが開発した最新の量子プロセッサであるBristleconeでさえも72量子ビッ...