学習手法

学習手法

World Models Library:強化学習で将来の画像を予測する事に意味はあるのか?(1/2)

1.World Models Library:強化学習で将来の画像を予測する事に意味はあるのか?(1/2)まとめ ・原則として強化学習で計画立案に厳密に必要なのは、将来の報酬を予測することだけ ・しかし、最近の多くの強化学習手法で将来の画像...
アプリケーション

より少ないデータから表形式データを推論することを学習(2/2)

1.より少ないデータから表形式データを推論することを学習(2/2)まとめ ・パフォーマンスを向上させるために反事実条件と合成の2つの新しい事前トレーニングを導入 ・経験則を用いてデータの一部分のみを使って計算効率を最適化出来ないかを調査 ・...
アプリケーション

より少ないデータから表形式データを推論することを学習(1/2)

1.より少ないデータから表形式データを推論することを学習(1/2)まとめ ・自然言語推論は通常の文章を対象にした研究は多いが構造化データに適用する研究は少ない ・EMNLP 2020で表形式データ解析用にカスタマイズされた初の事前トレーニン...
学習手法

GO:グラフ最適化用強化学習(3/3)

1.GO:グラフ最適化用強化学習(3/3)まとめ ・GOはオフライントレーニングとわずかな微調整で初見のグラフにも一般化可能 ・全タスクを一度に最適化するマルチタスクGOはシングルタスクGOより7.8%速度が向上 ・フレームワークの最適化問...
学習手法

GO:グラフ最適化用強化学習(2/3)

1.GO:グラフ最適化用強化学習(2/3)まとめ ・GOはGraphSAGEを利用しておりトレーニング時に見た事がないグラフに対して一般化可能 ・GOは規模拡大可能なAttentionが含まれノード間の距離が離れていても依存関係を捕捉可 ・...
学習手法

GO:グラフ最適化用強化学習(1/3)

1.GO:グラフ最適化用強化学習(1/3)まとめ ・大規模モデルは多様なアクセラレータが混在する環境でトレーニングされるようになってきた ・MLコンパイラは多くの複雑な最適化問題を解決する必要があるが手動設計には限界がある ・この制限を克服...
アプリケーション

時系列予測にAutoMLを使用する(2/2)

1.時系列予測にAutoMLを使用する(2/2)まとめ ・最新コンペであるM5予測コンペでAutoMLは銀メダルゾーンにあたる成績を収めた ・人間の参加者が数か月かかったモデル設計を2時間と人的介入なしでAutoMLは達成 ・他のデータセッ...
アプリケーション

時系列予測にAutoMLを使用する(1/2)

1.時系列予測にAutoMLを使用する(1/2)まとめ ・時系列予測は重要だがモデルの作成に専門知識が必要で現実世界では利用に制限がある ・AutoMLはMLモデルの作成プロセスを自動化することでMLをより広く利用可能にする ・現実世界のコ...
AI関連その他

LIT:自然言語モデルを対話的に調査して理解を深める解釈性ツール(2/2)

1.LIT:自然言語モデルを対話的に調査して理解を深める解釈性ツール(2/2)まとめ ・LITは事前トレーニング済みモデルを使用したいくつかのデモが公開されている ・感情分析は映画のレビューが肯定的か否定的かを予測する機能をデモできる ・マ...
学習手法

DVRL:強化学習を使って学習用データの影響を推定(2/2)

1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ ・DVRLはデータ価値の推定やノイズ影響の除去で従来手法より優れた成果を出した ・学習データが検証/テストデータと異なる分布に由来するドメイン適応シナリオも対応可 ・デ...
学習手法

DVRL:強化学習を使って学習用データの影響を推定(1/2)

1.DVRL:強化学習を使って学習用データの影響を推定(1/2)まとめ ・全てのデータサンプルがディープラーニングを学習させる際に等しく役立つわけではない ・低品質データを削除することでパフォーマンスを向上させる事が出来る場合もある ・DV...
モデル

人間による評価を使って要約を学ぶ(4/4)

1.人間による評価を使って要約を学ぶ(4/4)まとめ ・モデルは依然として不正確な要約を生成する可能性があり満点の要約は45%の割合で達成 ・人間がモデル出力の品質を簡単に評価できないようなタスクにも今回の手法を応用したい ・人間の好みに合...