google ai

学習手法

OptFormer:パラメータ名など言語情報を参考にハイパーパラメータを最適化(1/2)

1.OptFormer:パラメータ名など言語情報を参考にハイパーパラメータを最適化(1/2)まとめ ・ハイパーパラメータの最適化はモデルの性能を左右する可能性があるため大事 ・従来のハイパーパラメータ探索法はパラメータ数や範囲が同一である事...
入門/解説

Dall-E 2、Midjourney、Stable Diffusionなど文章から画像を生成する人工知能の一覧

1.Dall-E 2、Midjourneyなど文章から画像を生成する人工知能の一覧まとめ ・入力した文章を元に新しい画像を高品質で生成する人工知能が注目を集めている ・大まかに商用サービス、一般向け技術デモ、研究者向け技術デモの3パターンが...
データセット

Google Universal Image Embeddingチャレンジの紹介(2/2)

1.Google Universal Image Embeddingチャレンジの紹介(2/2)まとめ ・同じ実体レベルの認識でもランドマークとアパレルでは実体にばらつきがあり性質が異なる ・従来の実体レベル認識を競うコンペでは対象とする領域...
データセット

Google Universal Image Embeddingチャレンジの紹介(1/2)

1.Google Universal Image Embeddingチャレンジの紹介(1/2)まとめ ・物体の属しているクラスではなく特定の実体まで認識する事を実体レベルの認識タスクと言う ・世界に一つしかない物体と多くの複製品を持つ可能性...
アプリケーション

Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2)

1.Look and Talk:視線を検知して呼び出しを認識するアシスタント(1/2)まとめ ・現在のGoogle Assistantは「OK Google」と呼びかける事で起動する仕組みに依存している ・ホームデバイスとの自然で直感的な対...
アプリケーション

Mood Board Search:「平穏な」などの主観的な概念を使った画像検索を可能にする(1/2)

1.Mood Board Search:「平穏な」などの主観的な概念を使った画像検索を可能にする(1/2)まとめ ・現在のビジュアル検索ツールはトーンやムードといった主観的な概念では検索できない ・Mood Board Searchはムード...
モデル

Minerva:大学受験レベルの数学を解答可能な言語モデル(2/2)

1.Minerva:大学受験レベルの数学を解答可能な言語モデル(2/2)まとめ ・Minervaは推論ミスや計算ミスなどまだ相応な間違いをする事がわかっている ・また最終的に正しい答えに到達しても途中の推論に誤りがある場合もある ・モデルが...
学会

CVPR 2022におけるGoogleの存在感

1.CVPR 2022におけるGoogleの存在感まとめ ・6/19 - 6/23の間、ロサンゼルスのニューオーリンズと仮想空間でCVPR 2022が開催 ・Google社員も多数参加し80を超える受理された出版物や多数のワークショップを開...
AI関連その他

Googleの人工知能LaMDAは本当に意識を得たのか?(3/3)

1.Googleの人工知能LaMDAは本当に意識を得たのか?(3/3)まとめ ・LaMDAは自然言語を扱うモデルとしては最先端の設計ではなく一世代前のモデル ・パラメータ数も最先端のモデルに比べると1/4程度であり算数では負けている ・現時...
AI関連その他

Googleの人工知能LaMDAは本当に意識を得たのか?(1/3)

1.Googleの人工知能LaMDAは本当に意識を得たのか?(1/3)まとめ ・BBCやWashingtonPost誌などで意識を持つかもしれないAIに関する報道があった ・このAIの名前はLaMDA、2021年に紹介された際には意識云々の...
モデル

LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(1/2)

1.LIMoE:画像と文章に対応可能で規模拡大が容易なスパースMoEモデル(1/2)まとめ ・従来の密なモデルに比べると疎らなスパースモデルは規模拡大が用意で将来的に有望 ・疎なモデルは密なモデルが直面するマルチタスク時の性能悪化や破局的忘...
学習手法

学習用データが非常に少ない言語で機械翻訳を実現した手法(2/2)

1.学習用データが非常に少ない言語で機械翻訳を実現した手法(2/2)まとめ ・単一巨大モデルを高リソース言語の翻訳タスクと低リソース言語のMASSタスクで訓練した ・入力が同じ言語で不明瞭な文章か、まったく別の言語かはモデルからすれば大きな...