モデル ViT-VQGAN:画像量子化技術を再考して画像生成と画像理解の性能を向上(2/2)
1.ViT-VQGAN:画像量子化技術を再考して画像生成と画像理解の性能を向上(2/2)まとめ ・VIMは犬や猫など与えられた特定のクラスの画像を合成するクラス条件付き生成が可能 ・画像理解タスクでも分類精度を60.3%(iGPT-L)から...
モデル
モデル
モデル
モデル
モデル
モデル
モデル
モデル
モデル
モデル
モデル
モデル