学習手法 MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3) 1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(2/3)まとめ ・偶然成功した行動は強化学習エージェントが作業を一般化する際に有害な影響を与える ・MeRLでは成功した行動の特徴に基づいて偶然の成功と意図的な成功を区別した補助的な報... 2019.02.26 学習手法
入門/解説 MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3) 1.MeRL:強化学習でまばらで仕様が曖昧な報酬に対応(1/3)まとめ ・強化学習はアクションに対するフィードバック(報酬)が重要 ・報酬が疎であったり報酬に繋がる行動が不明では学習が困難 ・特に仕様が不明確な報酬は予想外の行動に繋がる可能... 2019.02.25 入門/解説
量子コンピュータ 量子プロセッサの極低温制御への道(2/2) 1.量子プロセッサの極低温制御への道(2/2)まとめ ・配線の問題をクリアするため量子ビットを制御する装置を極低温で稼働可能にする必要があった ・なおかつ、装置内の温度を上げて量子の活動に影響を与えないために消費電力を抑える必要もあった ・... 2019.02.24 量子コンピュータ
入門/解説 量子プロセッサの極低温制御への道(1/2) 1.量子プロセッサの極低温制御への道(1/2)まとめ ・Googleの試算によれば第一世代の量子コンピュータはおよそ100万量子ビットを必要とする ・Googleが開発した最新の量子プロセッサであるBristleconeでさえも72量子ビッ... 2019.02.23 入門/解説
入門/解説 GPT-2:より良い言語モデルとそれが暗示する事(3/3) 1.GPT-2:より良い言語モデルとそれが暗示する事(3/3)まとめ ・GPT-2のような大規模な言語モデルは良い事に使う事もできるが悪用する事も出来る ・画像や音声、動画も簡単に偽造出来る現在では予想外の悪用方法があるかもしれない ・従来... 2019.02.22 入門/解説
入門/解説 GPT-2:より良い言語モデルとそれが暗示する事(2/3) 1.GPT-2:より良い言語モデルとそれが暗示する事(2/3)まとめ ・GPT-2はWinograd Schema、LAMBADA、およびその他の言語モデリング用タスクで最先端のスコアを達成 ・質問回答、読解力、要約、翻訳などの他の言語タス... 2019.02.21 入門/解説
入門/解説 GPT-2:より良い言語モデルとそれが暗示する事(1/3) 1.GPT-2:より良い言語モデルとそれが暗示する事(1/3)まとめ ・アンデス山脈の辺境の谷間にかなり普通の英語を話すユニコーンの群れが生息している事が判明 ・彼らの起源はまだはっきりしていないが人間が文明化する前にユニコーンと出会った時... 2019.02.20 入門/解説
学習手法 PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3) 1.PlaNet:画像入力から世界モデルを学ぶ強化学習(3/3)まとめ ・PlaNetは一つのエージェントで6つの異なるタスクを行うように訓練する事ができた ・比較的単純なタスクに対する学習は遅かったが複雑なタスクは素早く学習し高いレベルに... 2019.02.19 学習手法
学習手法 PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3) 1.PlaNet:画像入力から世界モデルを学ぶ強化学習(2/3)まとめ ・エージェントは特定の操作によってボールの位置やゴールまでの距離がどのように変化するか想像出来る ・大量の計算が必要な画像作成を省略し将来の報酬を予測するだけでよいので... 2019.02.18 学習手法
学習手法 PlaNet:画像入力から世界モデルを学ぶ強化学習(1/3) 1.PlaNet:画像入力から世界モデルを学ぶ強化学習(1/3)まとめ ・PlaNetはモデルベース(Model-based)強化学習であり世界モデルを学ぶ強化学習 ・世界モデルを学ぶと従来より少ないデータで効率的な学習を行う事ができる ・... 2019.02.17 学習手法
入門/解説 FastText:テキストデータの特徴量抽出の実装(2/2)まとめ 1.FastText:テキストデータの特徴量抽出の実装(2/2)まとめ ・FastTextでembeddingを作成した後は単語間の類似性や仲間外れを計算する事が出来る ・聖書内の単語に関する類似性や関連性は上手に捉える事が出来ている ・単... 2019.02.16 入門/解説
入門/解説 FastText:テキストデータの特徴量抽出の実装(1/2) 1.FastText:テキストデータの特徴量抽出の実装(1/2)まとめ ・FastTextは2016年にFacebookによって最初に発表された素のWord2Vecモデルを拡張および改善したもの ・各単語をBag of Character ... 2019.02.15 入門/解説