AI

人工知能、機械学習などの最新の情報をまとめています。

AI

2023年12月時点で英語圏で人気のある大規模言語モデルとトレンド

1.2023年12月時点で英語圏で人気のある大規模言語モデルとトレンドまとめ ・chatGPTのようにAIが人間に迫るレベルで言葉を扱う事を可能した技術を大規模言語モデル(LLM:Large language Models)と言う ・英語圏...
プライバシー

Connect the Dots:差分プライバシーのより効率的なプライバシーコスト推定(2/2)

1.Connect the Dots:差分プライバシーのより効率的なプライバシーコスト推定(2/2)まとめ ・Connect-the-Dotsは離散化して戻す事で効率的な計算を行うアルゴリズム ・Connect-the-Dotsは先行実装に...
モデル

CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(1/2)

1.CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(1/2)まとめ ・文章生成タスクは直前の単語に基づいて行われるため並列化が困難である ・幾つかの単語は他の単語より次の単語を予測することが簡単な事実に着目し...
アプリケーション

speaker labels:誰の発言がわかるように音声データにラベルをつけるスマホアプリ(2/2)

1.speaker labels:誰の発言かわかるように音声データにラベルをつけるスマホアプリ(2/2)まとめ ・音声をembedding化した後、複数のクラスタリング手法で話者推定を実施する ・メイン処理に渡す前に予備的アルゴリズムで事前...
基礎理論

機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(2/2)

1.機械学習が学習時に抜け道を見つけてズルをしてしまう事を防止(2/2)まとめ ・最も単純な顕著性評価法Gradient L2がBERTベースのモデルに対して良い結果 ・あるモデルでうまくいく方法が、他のモデルでうまくいかないこともある ・...
モデル

DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)

1.DeformableRavens:変形可能な物体を操作することを学ぶ(2/2)まとめ ・硬い物体の再配置研究に使用したTransporter Networkに目標条件付けを統合 ・バッグを開いて物をいれるなど柔軟に指定された形状を操作で...
AI

インターネット上の画像から三次元構造を再構築するコンペの開催

1.インターネット上の画像から三次元構造を再構築するコンペの開催まとめ ・一連の二次元画像から三次元データとして物体を再構築する事をStructure-from-Motion(SfM)と言う ・SfMでは、窓枠の角部分など「局所的な特徴(l...