モデル | ページ 2

segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデル

１．segment-anything:画像内の全ての物体を画素単位で切り出す事が出来るMetaの基盤モデルまとめ・画像内にある物体を自動で認識して、切り出せるようにセグメンテーションマスクを作ってくれるSegment-Anything M...

2023.04.07

アプリケーションモデル

１．USM:100以上の言語に対応した最先端の音声AI(2/2)まとめ・事前学習で得た知識によりUSMは下流タスクからのわずかな量の教師ありデータで良好な品質を達成することができる・YouTubeデータを使った検証では73言語の平均で3...

2023.04.06

モデル

１．USM:100以上の言語に対応した最先端の音声AI(1/2)まとめ・昨年の11月、Googleは世界で最も話されている1,000の言語をサポートする機械学習モデルの構築を目標に掲げた・ユニバーサルスピーチモデルはその実現に向けた重要...

2023.04.05

モデル

１．Spotlight：視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(2/2)まとめ・Spotlightは、4つ下流タスクにおいて4つの従来手法を大幅に上回るスコアを達成する事ができた・モデルが注目している領域を確...

2023.03.21

アプリケーションモデル

１．Spotlight：視覚情報のみを使ってアプリのユーザーインターフェースを理解して改善(1/2)まとめ・AIにユーザーインターフェースの構成を理解して貰う事は、知的なUI動作を実現するための重要なステップとなる・個々のUIタスクを学...

2023.03.20

アプリケーションモデル

１．chatGPTの上位互換であるGPT-4のリサーチブログの全訳とGPT-4で出来る事の紹介まとめ・OpenAIが最新モデルGPT-4を発表。人間より能力が劣る部分もあるが専門的・学術的ベンチマークで人間レベルの性能を発揮・機械学習モ...

2023.03.15

アプリケーションモデル

１．LLaMA、chatGPT値下げ、FLAN-UL2：直近の巨大ゴリラ同士の殴り合いまとめ・一週間前にMetaが最大650億のパラーメーターを持つLLaMAを非商用ライセンスで公開・三日前にOpenAIがchatGPTのAPI経由での...

2023.03.04

モデル

１．CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(2/2)まとめ・予測を途中で切り上げる判断は局所的に行なうが、一貫性は全体で判断する・テキスト整合性とリスクの整合性を設定できるようにしてバランスを取る...

2022.12.27

モデル

１．CALM:簡単な語順には手間をかけないようにして人工知能による文章生成を高速化(1/2)まとめ・文章生成タスクは直前の単語に基づいて行われるため並列化が困難である・幾つかの単語は他の単語より次の単語を予測することが簡単な事実に着目し...

2022.12.26

モデルAI

１．UnCLIP:画像生成人工知能DALL·E 2のオープンソース実装が動かしやすくなる・画像生成人工知能の先駆けとなったDALL·E 2のオープンソース実装が改装・Diffusersライブラリに統合されたためStableDiffusi...

2022.12.25

モデル画像生成

１．RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(2/2)まとめ・RT-1は他のロボットの経験を観察する事で新しいスキルを身につける事が可能・SayCanとRT-1を組み合わせる事によって初見のキ...

2022.12.22

モデルロボット

１．RT-1:現実世界の大規模データを取り扱い可能なロボット操作用Transformer(1/2)まとめ・機械学習は大規模データセットとそれを活用可能なモデルによって進歩している・ロボット分野は大規模データセットもそれを活用できるモデル...

2022.12.21

モデルロボット