GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)

AI
  • 2019.03.07

1.GPipe:大規模ニューラルネットワークを効率的に訓練するオープンソースライブラリ(1/3)まとめ ・最近のニューラルネットワークはTPUアクセラレータのメモリに収めるのが難しいくらい巨大化している ・しかし、性能とパラメータ数には強い相関がありニューラルネットワークの大規模化は避けえない ・GPipeはモデルとデータを分割して学習させる事により大規模ネットワークの学習を可能にする 2.GPi […]

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)

AI
  • 2019.03.06

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(3/3)まとめ ・PRM-RLにAutoRLでトレーニングしたローカルプランナーを組み合わせる等多数の改良をした ・SLAMマップでsim2realギャップの解消に成功し、分散型ロードマップで大規模マップにも対応した ・数百メートル範囲を自律的に移動可能なロボットの実現し、移動困難な人々の自律性を支援する道を開いた 2.Aut […]

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)

AI
  • 2019.03.05

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(2/3)まとめ ・PRMのようなサンプリングベースのプランナーを使う事によって長距離ナビゲーションを実現できる ・強化学習ベースのローカルプランナーがノード間を接続できるか調査してPRMを作成していく ・最大の地図は288m x 163mでこれはローカルプランナーが扱える距離(~15m)を大幅に超える 2.PRM-RLとは? […]

AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)

AI
  • 2019.03.04

1.AutoRL:自動強化学習による長距離ロボットナビゲーションの実現(1/3)まとめ ・AutoMLの強化学習版であるAutoRLを使ってロボットを遠く離れた場所までお使いに行かせる研究 ・現在のロボットは近距離を安全に移動するためのローカルプランナーの性能は向上している ・ローカルプランナーで扱える近距離を超えるためにAutoRLで既存の強化学習の課題解決に挑戦 2.AutoRLとは? 以下、 […]

GPT-2が自動生成したその他の文章(3/3)

AI
  • 2019.03.03

1.GPT-2が自動生成したその他の文章(3/3)まとめ ・GPT-2が自動作成した事実を強引に捻じ曲げる文章とフェイクニュースの2つの紹介 ・どちらも25回の試行を行っているためGPT-2的には作りにくい文章だったかもしれないが出来が良い ・どちらの記事も一つ一つの段落が非常に長くなる事が特徴的 2.GPT-2が作ったフェイクニュースの例 人間が読んでもほとんど違和感を感じない文章を作る事ができ […]

GPT-2が自動生成したその他の文章(2/3)

AI
  • 2019.03.02

1.GPT-2が自動生成したその他の文章(2/3)まとめ ・GPT-2が得意とする文章である指輪物語の二次創作と宿題 ・指輪物語は物語内に出てくる固有名詞しか使っておらず物語としてほぼ成立している ・宿題の方はダラダラと要旨を掴みにくい文章だが0点にはしにくい文章 2.GPT-2が作った指輪物語の二次創作と宿題 実は、GPT-2が得意とする文章の一つとされる指輪物語の原作には会話が出来るユニコーン […]

GPT-2が自動生成したその他の文章(1/3)

AI
  • 2019.03.01

1.GPT-2が自動生成したその他の文章(1/3)まとめ ・GPT-2が出力したユニコーン以外の文章の紹介 ・プレスリリース、ニュース、芸能ニュース、の3種類 ・部署名等は実在の名称を入れてくるので流し読みしていると読めてしまう 2.GPT-2の作ったフェイクニュース GPT-2が作成した文章として発表されたのは8例あります。それぞれが異なった用途に使われる文章であり、多様な文章に対応できる事がG […]

MT-DNN:BERTを凌駕するMicrosoftの新しいNLPモデル

AI
  • 2019.02.28

1.MT-DNN:BERTを凌駕するMicrosoftの新しいNLPモデルまとめ ・MT-DNNはマイクロソフトが発表した新しい自然言語処理モデルでBERTを上回るスコアを出した ・2015年に提案したモデルに基づいて構築されマルチタスク学習と事前トレーニングを取り込んでいる ・MT-DNNによる特徴表現はBERTによる特徴表現よりも効率的に他の分野の作業に適応できる 2.MT-DNNとは? 以下 […]

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)

AI
  • 2019.02.27

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(3/3)まとめ ・報酬が疎になる作業を学習させるためにカルバック・ライブラー情報量(KL)を利用している ・カルバック・ライブラー情報量は、2つの異なる確率分布がどの程度異なるかを示す尺度 ・全ての最頻値を網羅しようと試みるKLと特定の最頻値を探し出すKLを活用している 2.報酬が滅多に発生しない作業を学習させるためには? 以下、ai.goo […]

MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3)

AI
  • 2019.02.26

1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3)まとめ ・偶然成功した行動は強化学習エージェントが作業を一般化する際に有害な影響を与える ・MeRLでは成功した行動の特徴に基づいて偶然の成功と意図的な成功を区別した補助的な報酬を使う ・MeRLは補助的な報酬を自動的に学習し疎な報酬より洗練されたフィードバックを与える事が出来る 2.MeRLとは? 以下、ai.googleblog. […]

1 3 46