openAI

アプリケーション

Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(1/2)

1.Jukebox:歌声を含む生のオーディオを生成可能なニューラルネット(1/2)まとめ ・音楽におけるスタイル転送が歌声を含む生の音声データで可能なOpen AIのJukeboxの紹介 ・CD品質の音楽は1,000万を超えるタイムステップ...
AI関連その他

2020年版AIによる創造と夢(2/2)

1.2020年版AIによる創造と夢(2/2)まとめ ・OpenAIのGPT-3は造物主が何者であるのか問う質問に回答可能 ・OpenAIのJukeBoxは生の音を対象にして作風を真似て作曲が可能 ・これらを組み合わせるとAI主導のPodCa...
AI関連その他

2020年版AIによる創造と夢(1/2)

1.2020年版AIによる創造と夢(1/2)まとめ ・AIを使って作文、作曲、画像生成、合成音声、など様々な表現が出来るようになった ・それらを繋ぎ合わせて映像作品などを造られている方の2020年の作品集まとめ ・画像、動画、独自の空間効果...
AI関連その他

Google Research:2020年の振り返りと2021年以降に向けて(2/5)

1.Google Research:2020年の振り返りと2021年以降に向けて(2/5)まとめ ・機械学習の応用は脳の構造解析から有望な分子化合物の探索、チップセットの設計など多岐に ・責任あるAIは解釈可能性の向上やバイアスの削減、安全...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(3/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(3/3)まとめ ・CLIPは一般的な物体認識には優れているが抽象的または体系的なタスクには苦戦 ・CLIPは、言葉遣いや言い回しに過敏で機能させるために試行錯誤も必要 ・分類対...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(2/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(2/3)まとめ ・ゼロショット機能実現は単純に事前トレーニングタスクを規模拡大するだけで十分だった ・CLIPは視覚タスクの抱える課題であるデータが高コストである事などを軽減す...
モデル

CLIP:学習していない視覚タスクを実行可能なニューラルネット(1/3)

1.CLIP:学習していない視覚タスクを実行なニューラルネット(1/3)まとめ ・自然言語を教師に視覚的概念を効率的に学習するネットワークCLIPの紹介 ・CLIPはGPT-2やGPT-3の「ゼロショット」機能を視覚タスクで実現 ・個々のタ...
モデル

DALL·E:文章から画像を作成(3/3)

1.DALL·E:文章から画像を作成(3/3)まとめ ・DALL·EはGPT-3同様、説明と手がかりを与えるだけで追加学習なしで様々なタスクを実行可 ・視覚IQテストでは簡単な類推問題は解く事ができたが複雑な問題は解く事ができなかった ・地...
モデル

DALL·E:文章から画像を作成(2/3)

1.DALL·E:文章から画像を作成(2/3)まとめ ・DALL·Eでは、画像に対する視点や3Dスタイル、光学的歪みも制御できる ・「極端に拡大した視点」や「X線」スタイルで断面図や接写構図の画像も可能 ・入力文に指定されていない撮影状況の...
モデル

DALL·E:文章から画像を作成(1/3)

1.DALL·E:文章から画像を作成(1/3)まとめ ・自然言語で記述した様々な概念を参考にして画像を作成する事ができるDALL·EをOpenAIが発表 ・DALL·Eは、テキストと画像のペアを使用して訓練されたGPT-3の120億パラメー...
AI関連その他

AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測テクノロジー編(2/3)

1.AI、機械学習、データサイエンス、ディープラーニングの2020年の進展と2021年の予測テクノロジー編(2/3)まとめ ・データサイエンスチームは、必要な役割とスキルを分類するようになり細分化が進む ・AIを支援する企業は「サービスとし...
AI関連その他

トレーニングデータ抽出攻撃:大規模言語モデルが記憶してしまうプライバシー情報(1/2)

1.トレーニングデータ抽出攻撃:大規模言語モデルが記憶してしまうプライバシー情報(1/2)まとめ ・言語モデルがトレーニング時に使用したデータの詳細を漏洩してしまう危険性が指摘された ・大規模言語モデルを非公開データを使って公開している際に...