視覚

モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(2/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(2/3)まとめ ・ゼロショット機能実現は単純に事前トレーニングタスクを規模拡大するだけで十分だった ・CLIPは視覚タスクの抱える課題であるデータが高コストである事などを軽減す...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(1/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(1/3)まとめ ・自然言語を教師に視覚的概念を効率的に学習するネットワークCLIPの紹介 ・CLIPはGPT-2やGPT-3の「ゼロショット」機能を視覚タスクで実現 ・個々のタ...
モデル

DALL·E:文章から画像を作成(3/3)

1.DALL·E:文章から画像を作成(3/3)まとめ ・DALL·EはGPT-3同様、説明と手がかりを与えるだけで追加学習なしで様々なタスクを実行可 ・視覚IQテストでは簡単な類推問題は解く事ができたが複雑な問題は解く事ができなかった ・地...
モデル

DALL·E:文章から画像を作成(2/3)

1.DALL·E:文章から画像を作成(2/3)まとめ ・DALL·Eでは、画像に対する視点や3Dスタイル、光学的歪みも制御できる ・「極端に拡大した視点」や「X線」スタイルで断面図や接写構図の画像も可能 ・入力文に指定されていない撮影状況の...
モデル

DALL·E:文章から画像を作成(1/3)

1.DALL·E:文章から画像を作成(1/3)まとめ ・自然言語で記述した様々な概念を参考にして画像を作成する事ができるDALL·EをOpenAIが発表 ・DALL·Eは、テキストと画像のペアを使用して訓練されたGPT-3の120億パラメー...
入門/解説

AI初心者のための15のAIプロジェクト案

1.AI初心者のための15のAIプロジェクト案まとめ ・2021年の目標や計画を立案する際に参考になりそうな15のプロジェクト案 ・難易度が高いプロジェクトもあるのでヒントと考えるか分割する等の工夫が必要 ・必要になる知識や技能はAIに留ま...
AI関連その他

AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測インダストリー編(3/3)

1.AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測インダストリー編(3/3)まとめ ・コロナの大きな影響を受けた業界以外はAI関連プロジェクトへの投資を減らしていない ・AIを使用するため自動運転、...
入門/解説

グラフニューラルネットワークのわかりやすい紹介(2/3)

1.グラフニューラルネットワークのわかりやすい紹介(2/3)まとめ ・グラフニューラルネットワークは2005年に発表されたが関連する概念はそれ以前からあった ・過去数年間、GNNはSMS分析や計算化学分野、特に創薬分野に熱心に使われている ...
アプリケーション

Portrait Light:機械学習を使ってポートレートモードの照明を強化(1/2)

1.Portrait Light:機械学習を使ってポートレートモードの照明を強化(1/2)まとめ ・ポートレート写真撮影時にプロはカメラから離した位置で照明器具を使用している ・これをシミュレートするためPixelカメラ及びGoogleフォ...
入門/解説

データサイエンス用のライブラリトップ5

1.データサイエンス用のライブラリトップ5まとめ ・有益なデータサイエンスライブラリ5点について書かれた記事を別観点からもう一つ紹介 ・Pandas Profiling、NLTK、TextBlob、pyLDAvis、NetworkXの5ライ...
入門/解説

ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版

1.ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ2020年版まとめ ・ディープラーニングと自然言語、コンピュータビジョン用Python人気ライブラリ30選 ・一般的なデータサイエンス用ツールは対象外とし、ニ...
モデル

ViT:規模拡大可能な画像認識用のTransformers(2/2)

1.ViT:規模拡大可能な画像認識用のTransformers(2/2)まとめ ・画像タスク用に特化したモデルは不要であるか最適ではない可能性がある ・データのサイズが増え続けており画像タスクに関する新しいアプローチが必要 ・ViTは視覚タ...