学習手法

学習手法

FormNet:書式に基づいた文書理解を実現(1/2)

1.FormNet:書式に基づいた文書理解を実現(1/2)まとめ ・フォームベース(Form-based)の文書理解は実用的な可能性を持つため研究が盛ん ・従来はフォーム文書を一列に直列化してから順次処理していたが書式構造を無視していた ・...
学習手法

L2P:継続学習にプロンプトを導入してコンパクトな記憶を実現(2/2)

1.L2P:継続学習にプロンプトを導入してコンパクトな記憶を実現(2/2)まとめ ・L2PはリハーサルバッファやタスクIDが既知でなくとも高い性能を出す事ができる ・タスクに依存しない設定など、様々な複雑な継続的学習シナリオを扱う事も可能 ...
学習手法

L2P:継続学習にプロンプトを導入してコンパクトな記憶を実現(1/2)

1.L2P:継続学習にプロンプトを導入してコンパクトな記憶を実現(1/2)まとめ ・継続学習はデータ分布が変化する状況で単一のモデルを学習する手法で破局的忘却がネック ・従来手法は過去データをリハーサルバッファに格納して現在のデータと混ぜて...
学習手法

タスク指向対話でシンプルで効果的なゼロショット転移を実現(3/3)

1.タスク指向対話でシンプルで効果的なゼロショット転移を実現(3/3)まとめ ・D3STとSDTは従来モデルと同程度のモデルサイズで、同等以上の性能を発揮 ・D3STとSDTはスキーマの言語的変化に対して強い堅牢性を持つ事もわかった ・D3...
学習手法

タスク指向対話でシンプルで効果的なゼロショット転移を実現(2/3)

1.タスク指向対話でシンプルで効果的なゼロショット転移を実現(2/3)まとめ ・D3STは会話状態を予測を行う際に、スロットと意図の記述を活用するDSTモデル ・SDTは具体的な会話内で可能なスロットと値を示す、単一の注釈付き対話例を活用 ...
学習手法

タスク指向対話でシンプルで効果的なゼロショット転移を実現(1/3)

1.タスク指向対話でシンプルで効果的なゼロショット転移を実現(1/3)まとめ ・会話型エージェントは、航空券の予約やレストランの検索など様々なタスクで使われる ・タスクが異なるとデータ収集とモデルを再トレーニングする必要が出てくるのは問題 ...
学習手法

DeepFusion:センサー情報とカメラ情報を効果的に融合して3次元物体検出(2/2)

1.DeepFusion:センサー情報とカメラ情報を効果的に融合して3次元物体検出(2/2)まとめ ・InverseAugとLearnableAlignという2つの新手法で位置合わせを改善しDeepFusionを実現 ・DeepFusion...
学習手法

DeepFusion:センサー情報とカメラ情報を効果的に融合して3次元物体検出(1/2)

1.DeepFusion:センサー情報とカメラ情報を効果的に融合して3次元物体検出(1/2)まとめ ・LiDARと視覚カメラは、自律走行車やロボットに使用される2種類のセンサー ・最先端の3次元物体検出器の多くはカメラを有効活用できていなか...
学習手法

JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)

1.JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(2/2)まとめ ・JSRLは任意の初期ガイドポリシーや微調整アルゴリズムと組み合わせて使用する事が可能 ・視覚ベースタスクでも他のすべての手法よりも高速に改善可能で最も...
学習手法

JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(1/2)

1.JSRL:事前ポリシーを効率的に使用して強化学習をジャンプスタート(1/2)まとめ ・強化学習は試行錯誤でタスクを実行するがゼロからポリシーを学習する事は難しい ・例えば複雑でゴールにどれだけ近づいているかを測定できないようなタスクの解...
学習手法

PRIME:過去のシミュレーションログ使ってアクセラレータを新規に設計(3/3)

1.PRIME:のシミュレーションログ使ってアクセラレータを新規に設計(3/3)まとめ ・PRIMEは複数アプリケーション対応とゼロショット対応の2つの目的で設計されている ・一部モデルではシミュレータ駆動型の方が待ち時間が短いがPRIME...
学習手法

PRIME:過去のシミュレーションログ使ってアクセラレータを新規に設計(2/3)

1.PRIME:のシミュレーションログ使ってアクセラレータを新規に設計(2/3)まとめ ・PRIMEを未知のアプリケーションに汎化させるためにレイヤー数など高レベル特徴を与えている ・PRIMEはEdgeTPUに比べて2.69倍(t-RNN...