dahara1

FormNet：書式に基づいた文書理解を実現(1/2)

１．FormNet：書式に基づいた文書理解を実現(1/2)まとめ・フォームベース(Form-based)の文書理解は実用的な可能性を持つため研究が盛ん・従来はフォーム文書を一列に直列化してから順次処理していたが書式構造を無視していた・For...

2022.05.07

学習手法

L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(2/2)

１．L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(2/2)まとめ・L2PはリハーサルバッファやタスクIDが既知でなくとも高い性能を出す事ができる・タスクに依存しない設定など、様々な複雑な継続的学習シナリオを扱う事も可能・L2...

2022.05.06

学習手法

L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(1/2)

１．L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(1/2)まとめ・継続学習はデータ分布が変化する状況で単一のモデルを学習する手法で破局的忘却がネック・従来手法は過去データをリハーサルバッファに格納して現在のデータと混ぜて学習...

2022.05.05

学習手法

LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(2/2)

１．LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(2/2)まとめ・転移学習は精度は高いがタスク毎に手間がかかり対照学習はその逆で性能面に難があった・LiTは画像エンコーダの学習をロックする事でこの性能ギャップを半分埋...

2022.05.04

モデル

LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(1/2)

１．LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(1/2)まとめ・画像分類などでは事前学習後にタスク毎に微調整に固有データが必要になるので手間がかかる・代替手法には画像とテキストを使う対照学習があるが微調整手法に比べ...

2022.05.03

モデル

タスク指向対話でシンプルで効果的なゼロショット転移を実現(3/3)

１．タスク指向対話でシンプルで効果的なゼロショット転移を実現(3/3)まとめ・D3STとSDTは従来モデルと同程度のモデルサイズで、同等以上の性能を発揮・D3STとSDTはスキーマの言語的変化に対して強い堅牢性を持つ事もわかった・D3STと...

2022.05.02

学習手法

タスク指向対話でシンプルで効果的なゼロショット転移を実現(2/3)

１．タスク指向対話でシンプルで効果的なゼロショット転移を実現(2/3)まとめ・D3STは会話状態を予測を行う際に、スロットと意図の記述を活用するDSTモデル・SDTは具体的な会話内で可能なスロットと値を示す、単一の注釈付き対話例を活用・SD...

2022.05.01

学習手法

タスク指向対話でシンプルで効果的なゼロショット転移を実現(1/3)

１．タスク指向対話でシンプルで効果的なゼロショット転移を実現(1/3)まとめ・会話型エージェントは、航空券の予約やレストランの検索など様々なタスクで使われる・タスクが異なるとデータ収集とモデルを再トレーニングする必要が出てくるのは問題・タス...

2022.04.30

学習手法

DeepFusion：センサー情報とカメラ情報を効果的に融合して3次元物体検出(1/2)

１．DeepFusion：センサー情報とカメラ情報を効果的に融合して3次元物体検出(1/2)まとめ・LiDARと視覚カメラは、自律走行車やロボットに使用される2種類のセンサー・最先端の3次元物体検出器の多くはカメラを有効活用できていなかった...

2022.04.28

学習手法

ALX：大規模な行列計算をＴＰＵ上で実現(3/3)

１．ALX：大規模な行列計算をＴＰＵ上で実現(3/3)まとめ・ALXのパラメータを慎重に調整し、メモリを半減させながら精度を維持する事ができた・理想はコア数を増すと線形に学習時間が減少する事だがネットワーク通信時間の影響を受ける・ALXは簡...

2022.04.27

基礎理論

ALX：大規模な行列計算をＴＰＵ上で実現(2/3)

１．ALX：大規模な行列計算をＴＰＵ上で実現(2/3)まとめ・ALXは各TPUコアの計算能力とメモリが無駄にならないように設計を工夫している・デモ用にWebGraphと呼ばれる大規模な実世界のウェブリンク予測データセットを公開・WebGra...

2022.04.26

基礎理論

FormNet：書式に基づいた文書理解を実現(1/2)

L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(2/2)

L2P：継続学習にプロンプトを導入してコンパクトな記憶を実現(1/2)

LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(2/2)

LiT：画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(1/2)

タスク指向対話でシンプルで効果的なゼロショット転移を実現(3/3)

タスク指向対話でシンプルで効果的なゼロショット転移を実現(2/3)

タスク指向対話でシンプルで効果的なゼロショット転移を実現(1/3)

DeepFusion：センサー情報とカメラ情報を効果的に融合して3次元物体検出(2/2)

DeepFusion：センサー情報とカメラ情報を効果的に融合して3次元物体検出(1/2)

ALX：大規模な行列計算をＴＰＵ上で実現(3/3)

ALX：大規模な行列計算をＴＰＵ上で実現(2/3)