学習手法 オフライン強化学習における未解決の課題への取り組み(2/3) 1.オフライン強化学習における未解決の課題への取り組み(2/3)まとめ ・D4RLは現実的なアプリケーションを念頭に作られたベンチマークである事が特徴 ・タスクの目的と違う目的を実行した記録から学習する能力などが試される ・タスクと標準化さ... 2020.08.30 学習手法
入門/解説 オフライン強化学習における未解決の課題への取り組み(1/3) 1.オフライン強化学習における未解決の課題への取り組み(1/3)まとめ ・強化学習は医療など試行錯誤によるデータ収集が難しい現実世界には適用が難しい ・オフラインRLは実際に動かさなくても過去に収集されたデータを使って学習可能なため有望 ・... 2020.08.29 入門/解説
入門/解説 MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(3/3) 1.MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(3/3)まとめ ・誤ラベルを処理する簡単な方法はクリーンなデータセットで事前トレーニングすること ・合成ノイズで良好に機能する手法は現実のノイズの多いラベルで... 2020.08.28 入門/解説
モデル MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(2/3) 1.MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(2/3)まとめ ・MentorMixは合成ノイズと現実世界のノイズの両方に対処できる効果的な手法 ・MentorMixはMentorNetとMixupに基づい... 2020.08.27 モデル
入門/解説 MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(1/3) 1.MentorMix:現実世界の誤ラベルがディープラーニングに及ぼす影響を調査(1/3)まとめ ・ディープラーニングの学習には大規模データが必要だが大規模になると誤ラベルが混ざる ・ラベルにノイズが多い場合の対処法は研究されてきたが合成し... 2020.08.26 入門/解説
モデル LaBSE:言語に依存しないBERT仕様のEmbedding(2/2) 1.LaBSE:言語に依存しないBERT仕様のEmbedding(2/2)まとめ ・Tatoebaに登録されている言語を使った検証では主要14言語では他の手法と大きな差はなかった ・全112言語を含めてテストを行った場合、従来手法に20%近... 2020.08.25 モデル
基礎理論 LaBSE:言語に依存しないBERT仕様のEmbedding(1/2) 1.LaBSE:言語に依存しないBERT仕様のEmbedding(1/2)まとめ ・多言語アプローチは有用ではあるがパフォーマンスを維持しながら対応言語を増やすのは困難 ・LaBSEは109の言語を使って訓練したBERT仕様で多言語共通なe... 2020.08.24 基礎理論
モデル MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2) 1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(2/2)まとめ ・Tracking Modelはキーポイントの「ヒートマップとオフセット」の組合わせを教師として使用 ・20%の誤差であれな許容範囲(PC... 2020.08.23 モデル
モデル MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2) 1.MediaPipe BlazePose:リアルタイムにオンデバイスでポーズを追跡(1/2)まとめ ・動画内の人間のポーズを推定する技術はARやフィットネス向けのアプリなどで重要 ・BlazePoseは人体のポーズを知覚する新しい手法で既... 2020.08.22 モデル
モデル REALM:言語特徴表現モデルに検索機能を持たせる(2/2) 1.REALM:言語特徴表現モデルに検索機能を持たせる(2/2)まとめ ・REALMでは、最適なドキュメントの選択は、最大内積検索を使っている ・REALMはOpen-QAタスクで30倍以上のパラメータを持つT5を約4ポイント上回った ・画... 2020.08.21 モデル
学習手法 REALM:言語特徴表現モデルに検索機能を持たせる(1/2) 1.REALM:言語特徴表現モデルに検索機能を持たせる(1/2)まとめ ・事前トレーニング済みモデルは世界に関する知識を事前トレーニングで取得する ・モデルの重みの中に抽象化された概念として取り込まれるため取り扱いが困難 ・REALMは学習... 2020.08.20 学習手法
入門/解説 RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2) 1.RWRL:強化学習の課題に取り組むための一連のシミュレーション(2/2)まとめ ・RWRLは現在のRLが抱える9つの異なる課題のうち8つに関連する実験を行う機能を提供 ・複数の課題と難易度レベルを組み合わせた環境でアルゴリズムをテストす... 2020.08.19 入門/解説