モデル ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)
1.ALIGN:ノイズの多い文章を教師に使って視覚と言語で共通する特徴表現を学習(2/3)まとめ ・ALIGNは微調整なしでテキストを使った画像検索や画像とテキストを同時に使った検索を実現 ・微調整を行うとALIGNはBiTやViTなどのほ...
モデル
アプリケーション
学習手法