AI関連その他 Googleの人工知能LaMDAは本当に意識を得たのか?(3/3) 1.Googleの人工知能LaMDAは本当に意識を得たのか?(3/3)まとめ ・LaMDAは自然言語を扱うモデルとしては最先端の設計ではなく一世代前のモデル ・パラメータ数も最先端のモデルに比べると1/4程度であり算数では負けている ・現時... 2022.06.17 AI関連その他
AI関連その他 Googleの人工知能LaMDAは本当に意識を得たのか?(2/3) 1.Googleの人工知能LaMDAは本当に意識を得たのか?(2/3)まとめ ・LaMDAは様々な対話に対応可能なチャットボットとして発表されたMeenaの後継モデル ・Meenaから2年が経過しておりこの間のAIの進歩を考えるとLaMDA... 2022.06.16 AI関連その他
AI関連その他 Googleの人工知能LaMDAは本当に意識を得たのか?(1/3) 1.Googleの人工知能LaMDAは本当に意識を得たのか?(1/3)まとめ ・BBCやWashingtonPost誌などで意識を持つかもしれないAIに関する報道があった ・このAIの名前はLaMDA、2021年に紹介された際には意識云々の... 2022.06.15 AI関連その他
アプリケーション DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(2/2) 1.DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(2/2)まとめ ・DALL-E Flowのサーバーは、ピーク時に21GBのVRAMを持つ1つのGPUを必要とする ・12GBのGPUではDALL-E Fl... 2022.06.14 アプリケーションモデル
アプリケーション DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2) 1.DALL·E Flow:複数のモデルを組み合わせて入力文に基づいたHD画像を作成(1/2)まとめ ・DALL·E Flowは幾つかのモデルを連携させてDALL·Eの性能や表現力を底上げする試み ・DALL·E と拡散モデルとSwinIR... 2022.06.13 アプリケーション画像生成
モデル LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(2/2) 1.LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(2/2)まとめ ・多様な情報を処理可能なマルチモーダルモデルは将来が有望視されているが密モデルでは困難 ・疎モデルは規模拡大の容易性と情報同士を組み合わせて性能を向... 2022.06.12 モデル
モデル LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(1/2) 1.LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(1/2)まとめ ・従来の密なモデルに比べると疎らなスパースモデルは規模拡大が用意で将来的に有望 ・疎なモデルは密なモデルが直面するマルチタスク時の性能悪化や破局的忘... 2022.06.11 モデル
モデル MV-GPT:動画に説明文を自動で付与するための新手法(2/2) 1.MV-GPT:動画に説明文を自動で付与するための新手法(2/2)まとめ ・MV-GPTはマルチモーダル事前キャプションで従来モデルを大きく上回る事を実証した ・MV-GPTはVideoQA、テキスト-ビデオ検索、行動分類など、ビデオ理解... 2022.06.10 モデル学習手法
モデル MV-GPT:動画に説明文を自動で付与するための新手法(1/2) 1.MV-GPT:動画に説明文を自動で付与するための新手法(1/2)まとめ ・マルチモーダルビデオキャプションは動画に説明文(キャプション)を生成するタスク ・根拠に基づいてキャプションを生成する必要があり動画理解タスクより困難なタスク ・... 2022.06.09 モデル学習手法
プライバシー LabelDP:秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(2/2) 1.LabelDP:秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(2/2)まとめ ・RR-with-priorは事前確率を使う事で予測の精度を大幅に増加させる ・経験的実験でもLabelDPがモデルの実用性を大幅に向上させる事... 2022.06.08 プライバシー学習手法
プライバシー LabelDP:秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(1/2) 1.LabelDP:秘匿対象をラベルに限定する事で差分プライバシーの精度を向上(1/2)まとめ ・米国国勢調査も採用している差分プライバシーは製品を実世界に展開する際に良く使われる ・差分プライバシーを使うとシステムがプライバシーをどの程度... 2022.06.07 プライバシー学習手法
モデル CoCa:様々な視覚タスクのバックボーンとして利用できる基盤モデル(2/2) 1.CoCa:様々な視覚タスクのバックボーンとして利用できる基盤モデル(2/2)まとめ ・CoCaモデルは、最小限の改造で多くのタスクに対して直接微調整を行うことが可能 ・CoCaは画像分類やクロスモーダル検索などのゼロショットでも最先端モ... 2022.06.06 モデル学習手法