モデル LiT:画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(1/2)
1.LiT:画像エンコーダを凍結してマルチモーダルな対象学習の性能を向上(1/2)まとめ ・画像分類などでは事前学習後にタスク毎に微調整に固有データが必要になるので手間がかかる ・代替手法には画像とテキストを使う対照学習があるが微調整手法に...
モデル
学習手法
学習手法