dahara1

モデル

ロボット工学における進化的メタラーニングの探索(2/3)

1.ロボット工学における進化的メタラーニングの探索(2/3)まとめ ・MAMLの代わりに進化的戦略であるES-MAMLを使うと確率性に関する競合を回避できる ・ESはパラメータが少ないため展開が容易で電力効率が高く効率的でコンパクトな学習が...
モデル

ロボット工学における進化的メタラーニングの探索(1/3)

1.ロボット工学における進化的メタラーニングの探索(1/3)まとめ ・シミュレーションによりロボットのトレーニングは実現しやすくなったがギャップが存在 ・シミュレーション環境と現実世界の間に存在する微妙なギャップで意図した通りに動かない ・...
入門/解説

無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(2/2)

1.無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(2/2)まとめ ・定常分布がわからなくても重みの分布がターゲットポリシーの分布が持つ属性を満たす確認すれば良い ・「トリッキー」な数学的手法を使い履歴データからターゲットポリシー...
入門/解説

無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(1/2)

1.無限に続く行動履歴を学習可能な強化学習のオフポリシー評価(1/2)まとめ ・強化学習は広く使われているが過去の履歴データ、つまりオフポリシーで性能評価をする事は難しい ・履歴データを収集したエージェントと性能評価されるエージェントが異な...
入門/解説

2020年4月17日時点の日本のCOVID-19 Community Mobility Reports

1.2020年4月17日時点の日本のCOVID-19 Community Mobility Reportsまとめ ・COVID-19 Community Mobility Reportsが2020年4月23日に4月17日(金)時点版として更...
モデル

EfficientDet:規模の拡張が容易で効率的な物体検出ネットワーク(2/2)

1.EfficientDet:規模の拡張が容易で効率的な物体検出ネットワーク(2/2)まとめ ・EfficientDetは物体検出器の解像度/深さ/幅を一緒に拡大する、新しい複合スケーリング手法を採用 ・三つの最適化の結果、従来の最先端モデ...
モデル

EfficientDet:規模の拡張が容易で効率的な物体検出ネットワーク(1/2)

1.EfficientDet:規模の拡張が容易で効率的な物体検出ネットワーク(1/2)まとめ ・物体検出アプリケーションは様々な場所で必要とされるため計算能力の限界など様々な制約を受ける ・様々な制約にも適応できる正確で効率的な物体検出アプ...
学習手法

オフライン強化学習に関する楽観的な見解(2/2)

1.オフライン強化学習に関する楽観的な見解(2/2)まとめ ・教師あり学習のアンサンブル手法を応用してREMと言う新しい強化学習アルゴリズムを開発 ・REMはオフライン設定とオンライン設定で比較するとオフライン設定の方が高い性能を出せていた...
学習手法

オフライン強化学習に関する楽観的な見解(1/2)

1.オフライン強化学習に関する楽観的な見解(1/2)まとめ ・ほとんどの強化学習は、エージェントが直接オンライン環境と対話するオンライン強化学習が前提 ・オフライン強化学習はエージェントが収集済みデータにないアクションを実行した際の評価が困...
その他の調査

都道府県別の時系列COVID-19 Community Mobility Reports

1.都道府県別時系列COVID-19 Community Mobility Reportsまとめ ・COVID-19 Community Mobility Reportsが全期間全世界のCSVデータの提供を開始 ・以前はPDFで集計日のデー...
入門/解説

XTREME:多言語対応能力を評価する多言語マルチタスクベンチマーク

1.XTREME:多言語対応能力を評価する多言語マルチタスクベンチマークまとめ ・自然言語処理の主要な挑戦の1つは世界の全ての約6900言語で機能するシステムを構築すること ・「多言語間で汎用的な言語の特徴」を学習しようとするモデルは増加し...
入門/解説

2020年4月11日時点の日本のCOVID-19 Community Mobility Reports

1.2020年4月11日時点の日本のCOVID-19 Community Mobility Reportsまとめ ・COVID-19 Community Mobility Reportsが2020年4月16日に4月11日時点版として更新 ・...