視覚

AI

CLIP:学習していない視覚タスクを実行可能なニューラルネット(3/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(3/3)まとめ ・CLIPは一般的な物体認識には優れているが抽象的または体系的なタスクには苦戦 ・CLIPは、言葉遣いや言い回しに過敏で機能させるために試行錯誤も必要 ・...
AI

CLIP:学習していない視覚タスクを実行可能なニューラルネット(2/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(2/3)まとめ ・ゼロショット機能実現は単純に事前トレーニングタスクを規模拡大するだけで十分だった ・CLIPは視覚タスクの抱える課題であるデータが高コストである事などを軽...
AI

CLIP:学習していない視覚タスクを実行可能なニューラルネット(1/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(1/3)まとめ ・自然言語を教師に視覚的概念を効率的に学習するネットワークCLIPの紹介 ・CLIPはGPT-2やGPT-3の「ゼロショット」機能を視覚タスクで実現 ・個...
AI

DALL·E:文章から画像を作成(3/3)

1.DALL·E:文章から画像を作成(3/3)まとめ ・DALL·EはGPT-3同様、説明と手がかりを与えるだけで追加学習なしで様々なタスクを実行可 ・視覚IQテストでは簡単な類推問題は解く事ができたが複雑な問題は解く事ができなかった ...
AI

DALL·E:文章から画像を作成(2/3)

1.DALL·E:文章から画像を作成(2/3)まとめ ・DALL·Eでは、画像に対する視点や3Dスタイル、光学的歪みも制御できる ・「極端に拡大した視点」や「X線」スタイルで断面図や接写構図の画像も可能 ・入力文に指定されていない撮影...
タイトルとURLをコピーしました