モデル 動画用ニューラルネットワークを自動で探索する試み(1/3) 1.動画用ニューラルネットワークを自動で探索する試み(1/3)まとめ ・現在動画用のモデルは通常既存の画像用モデルなどを元に手動で拡張設計されている ・動画用モデルは時空間情報を扱うためAutoMLのような自動化アプローチが困難 ・この課題... 2019.10.19 モデル
入門/解説 最も役に立った機械学習に関する10の無料オンラインコース 1.最も役に立った機械学習に関する10の無料オンラインコースまとめ ・FastAIのJeremy HowardさんがTwitterで紹介してたまとめの意訳 ・英語の授業ですがどんなコースが評価されてるかの目安として ・良い評判を聞いた事のあ... 2019.10.18 入門/解説
学習手法 M4:超多言語、大規模ニューラル機械翻訳(3/3) 1.M4:超多言語、大規模ニューラル機械翻訳(3/3)まとめ ・低リソース言語の数を増やすと高リソース言語の翻訳の品質が低下する現象が観察される ・これを敷設ために良い学習アルゴリズムやモデルパラメータ数を増やす試みを行った ・最終的に50... 2019.10.17 学習手法
入門/解説 M4:超多言語、大規模ニューラル機械翻訳(2/3) 1.M4:超多言語、大規模ニューラル機械翻訳(2/3)まとめ ・使用可能なすべてのデータを使用してトレーニングすると低リソース言語の翻訳品質が劇的に向上 ・超多言語モデルは一般化に効果的であり多言語全体の特徴表現の類似性を捕捉できている可能... 2019.10.16 入門/解説
入門/解説 M4:超多言語、大規模ニューラル機械翻訳(1/3) 1.M4:超多言語、大規模ニューラル機械翻訳(1/3)まとめ ・機械翻訳システムの品質は飛躍的に進歩しているが品質は学習用データの量に依存している ・学習用データが少ない言語では学習用データが多い言語ほど品質を向上できていない問題がある ・... 2019.10.15 入門/解説
学習手法 ROBEL:3Dプリンタで作成可能な強化学習用ロボット(3/3) 1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(3/3)まとめ ・ROBELは剛い物体も柔らかい物体も扱う事が出来、予期せぬ妨害や障害に関しても対応可能 ・複数のD'Clawが経験を共有することで、タスクをまとめてより速く学習す... 2019.10.14 学習手法
入門/解説 ROBEL:3Dプリンタで作成可能な強化学習用ロボット(2/3) 1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(2/3)まとめ ・ROBELにはD'Clawを用いた操作タスクとD'Kittyを用いた歩行タスクが用意されている ・2つの機関でドキュメントと指示書のみを用いてROBELの構築と再... 2019.10.13 入門/解説
ロボット ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3) 1.ROBEL:3Dプリンタで作成可能な強化学習用ロボット(1/3)まとめ ・シミュレーション環境でロボットを強化学習させると微妙な誤差や遅延により現実世界への展開が困難 ・しかし、物理的なロボットは高価で工業用途向けに作られているために強... 2019.10.12 ロボット
入門/解説 敵対的サンプルはバグではなく人間には知覚できない高度な特徴(3/5) 1.敵対的サンプルはバグではなく人間には知覚できない高度な特徴(3/5)まとめ ・堅牢ではない特徴が存在しなくてもバグから敵対的サンプルを構築できる ・しかし、バグから構築した敵対的サンプルによる学習は転移しない ・堅牢ではない特徴は転移し... 2019.10.11 入門/解説
入門/解説 敵対的サンプルはバグではなく人間には知覚できない高度な特徴(2/5) 1.敵対的サンプルはバグではなく人間には知覚できない高度な特徴(2/5)まとめ ・敵対的サンプルがバグではなく人間にできない特徴説に対するコメント集 ・堅牢な特徴の定義から単純化したモデルを使って調査する案など様々 ・スタイル転送の際に堅牢... 2019.10.10 入門/解説
入門/解説 敵対的サンプルはバグではなく人間には知覚できない高度な特徴(1/5) 1.敵対的サンプルはバグではなく人間には知覚できない高度な特徴(1/5)まとめ ・敵対的サンプルを使ってトレーニングしたモデルが敵対的でないデータを扱う事が出来る事が判明 ・堅牢なデータセットを使ってトレーニングしたモデルが自明でない特徴を... 2019.10.09 入門/解説
学習手法 強化学習を使って量子計算を改善(2/2) 1.強化学習を使って量子計算を改善(2/2)まとめ ・次のステップとして量子制御コスト関数をオンポリシーRLを使って最適化した ・オンポリシーRLとオフポリシーRLの違いは制御ポリシーが制御コストとは独立して表されること ・新しいフレームワ... 2019.10.08 学習手法