モデル

アプリケーション

Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)

1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)まとめ ・Spotlightは、4つ下流タスクにおいて4つの従来手法を大幅に上回るスコアを達成する事ができた ・モデルが注目している領域を確...
アプリケーション

Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)

1.Spotlight:視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)まとめ ・AIにユーザーインターフェースの構成を理解して貰う事は、知的なUI動作を実現するための重要なステップとなる ・個々のUIタスクを学...
アプリケーション

chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介

1.chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介まとめ ・OpenAIが最新モデルGPT-4を発表。人間より能力が劣る部分もあるが専門的・学術的ベンチマークで人間レベルの性能を発揮 ・機械学習モ...
モデル

LLaMA、chatGPT値下げ、FLAN-UL2:直近の巨大ゴリラ同士の殴り合い

1.LLaMA、chatGPT値下げ、FLAN-UL2:直近の巨大ゴリラ同士の殴り合いまとめ ・一週間前にMetaが最大650億のパラーメーターを持つLLaMAを非商用ライセンスで公開 ・三日前にOpenAIがchatGPTのAPI経由での...
モデル

CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(2/2)

1.CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(2/2)まとめ ・予測を途中で切り上げる判断は局所的に行なうが、一貫性は全体で判断する ・テキスト整合性とリスクの整合性を設定できるようにしてバランスを取る...
モデル

CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(1/2)

1.CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(1/2)まとめ ・文章生成タスクは直前の単語に基づいて行われるため並列化が困難である ・幾つかの単語は他の単語より次の単語を予測することが簡単な事実に着目し...
モデル

UnCLIP:画像生成人工知能DALL·E 2のオープンソース実装が動かしやすくなる

1.UnCLIP:画像生成人工知能DALL·E 2のオープンソース実装が動かしやすくなる ・画像生成人工知能の先駆けとなったDALL·E 2のオープンソース実装が改装 ・Diffusersライブラリに統合されたためStableDiffusi...
モデル

RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(2/2)

1.RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(2/2)まとめ ・RT-1は他のロボットの経験を観察する事で新しいスキルを身につける事が可能 ・SayCanとRT-1を組み合わせる事によって初見のキ...
モデル

RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(1/2)

1.RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(1/2)まとめ ・機械学習は大規模データセットとそれを活用可能なモデルによって進歩している ・ロボット分野は大規模データセットもそれを活用できるモデル...
モデル

ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(2/2)

1.ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(2/2)まとめ ・現在のChatGPTにはまだ制限があり不正確または無意味な答えを書くことがある ・不明瞭な質問の意図を聞きなおす事も稀でユーザーの意図を推測す...
モデル

ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(1/2)

1.ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(1/2)まとめ ・OpenAIがChatGPTと呼ばれる対話形式で会話可能なモデルを公開 ・ChatGPTは追加の質問に答えたり、不適切な要求を拒否する事が可能...
モデル

Flan-U-PaLM:わずかな追加計算で大規模言語モデルの性能を向上(2/2)

1.Flan-U-PaLM:わずかな追加計算で大規模言語モデルの性能を向上(2/2)まとめ ・指示微調整とは指示形式で表現されたデータセットでLMを微調整する事 ・指示微調整は1800タスクで実施し場合でもわずかな計算量しか必要としない ・...