dahara1 | ページ 94

Loss-Conditional Training:損失関数を改良してモデルのバリエーションを統合(2/2)

１．Loss-Conditional Training:損失関数を改良してモデルのバリエーションを統合(2/2)まとめ・学習ベースの画像圧縮に応用すると圧縮率と画像品質を係数で調整する事ができる・スタイル転送に応用すると元画像との類似性...

2020.05.05

モデル

１．Loss-Conditional Training:損失関数を改良してモデルのバリエーションを統合(1/2)まとめ・多くの機械学習アプリケーションでは、モデルのパフォーマンスを一つの数値で表現する事ができない・画質と圧縮率のようなト...

2020.05.04

モデル

１．ICLR 2020におけるGoogleの存在感まとめ・エチオピアで開催予定だったICLR2020が完全バーチャル会議として開催・Google AIブログで概要が発表済みの論文も9つ存在するので要チェック・BERTが76分でトレーニ...

2020.05.03

入門／解説

１．深層強化学習を使って半導体チップの設計を自動化・機械学習に専用ハードウェアを使用する事が増えているがチップ設計に数年単位の時間がかかる・チップ設計を強化学習に行わせて、過去の経験から学び、時間をかけて改善するアプローチを実現・これ...

2020.05.02

学習手法

１．2020年4月26日時点の日本のCOVID-19 Community Mobility Reportsまとめ・COVID-19 Community Mobility Reportsが4月26日(日)時点版として更新・4月16日に緊急...

2020.05.01

入門／解説

１．Google翻訳が性別を決めつけてしまう訳を減らす仕組みを拡大まとめ・Google翻訳は性別固有の表現を持たない言語と持つ言語間で翻訳する際に性別を決めつけてしまう事がある・2018年12月に「性別固有の翻訳」の仕組みを取り入れたが...

2020.04.30

入門／解説

１．ロボット工学における進化的メタラーニングの探索(3/3)まとめ・ES-MAMLは優れたパフォーマンスを持つが現実世界に展開する事は依然として困難・現実世界のデータをできるだけ少なくするために、新規にバッチ山登り法を導入・その結果、...

2020.04.29

モデル

１．ロボット工学における進化的メタラーニングの探索(2/3)まとめ・MAMLの代わりに進化的戦略であるES-MAMLを使うと確率性に関する競合を回避できる・ESはパラメータが少ないため展開が容易で電力効率が高く効率的でコンパクトな学習が...

2020.04.28

モデル

１．ロボット工学における進化的メタラーニングの探索(1/3)まとめ・シミュレーションによりロボットのトレーニングは実現しやすくなったがギャップが存在・シミュレーション環境と現実世界の間に存在する微妙なギャップで意図した通りに動かない・...

2020.04.27

モデル

１．無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(2/2)まとめ・定常分布がわからなくても重みの分布がターゲットポリシーの分布が持つ属性を満たす確認すれば良い・「トリッキー」な数学的手法を使い履歴データからターゲットポリシー...

2020.04.26

入門／解説

１．無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(1/2)まとめ・強化学習は広く使われているが過去の履歴データ、つまりオフポリシーで性能評価をする事は難しい・履歴データを収集したエージェントと性能評価されるエージェントが異な...

2020.04.25

入門／解説

１．2020年4月17日時点の日本のCOVID-19 Community Mobility Reportsまとめ・COVID-19 Community Mobility Reportsが2020年4月23日に4月17日(金)時点版として更...

2020.04.24

入門／解説