dahara1

モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)まとめ ・ロボットは明確なタスク定義を用いて学習しているので曖昧な指示が苦手 ・言語モデルは曖昧な指示も理解できるが現実世界を知ら...
AI関連その他

Rax:JAXで使えるランキングシステム用ライブラリ(2/2)

1.Rax:JAXで使えるランキングシステム用ライブラリ(2/2)まとめ ・RaxはNDCGを近似してノイズを加える事で微分と局所最適化問題を解決した ・他のJax関連ツールとスムーズに連携できるようにRaxは設計されている ・JAXのT5...
AI関連その他

Rax:JAXで使えるランキングシステム用ライブラリ(1/2)

1.Rax:JAXで使えるランキングシステム用ライブラリ(1/2)まとめ ・ランク付けは、様々な領域にまたがる中核的な問題で機械学習技術であるLTRが良く使用される ・比較的新しい機械学習フレームワークであるJAXで動作するLTRライブラリ...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編) ・DALL·E miniの開発者の人が提供してくれているCraiyonにナウシカを描いて貰う試み ・Craiyonは人間の顔の表現がまだ苦手だがナ...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Midjourney編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Midjourney編)まとめ ・Midjourneyは現在ベータテスト中でdiscordサーバーに接続すれば約25枚までは無料で画像生成 ・最初の無料枠を使い切ると...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(DALL·E 2編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か(DALL·E 2編)? ・DALL·E 2のベータテストの敷居はかなり下げられていて登録すると数日で招待される ・初月は50クレジット、その後は毎月15クレジットを無料...
学習手法

iterative co-tokenization:動画内でボウルに注がれた2番目の食材が何か答えられるようにする(2/2)

1.iterative co-tokenization:動画内でボウルに注がれた2番目の食材が何か答えられるようにする(2/2)まとめ ・反復的共同トークン化アルゴリズムは他の最新モデルよりも性能とサイズに優れる ・計算量も他の手法よりも低...
学習手法

iterative co-tokenization:動画内でボウルに注がれた2番目の食材が何か答えられるようにする(1/2)

1.iterative co-tokenization:動画内でボウルに注がれた2番目の食材が何か答えられるようにする(1/2)まとめ ・自動字幕、動画分析、動画を使った質問回答(VideoQA)など動画を使ったアプリは増えている ・Vid...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(latent diffusion編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(latent diffusion編)まとめ ・人工知能に指示を与える際はなるべく具体的な描写が望ましいが長文すぎると後半は無視される ・通常の言い回しよりインターネッ...
入門/解説

Dall-E 2、Midjourney、Stable Diffusionなど文章から画像を生成する人工知能の一覧

1.Dall-E 2、Midjourneyなど文章から画像を生成する人工知能の一覧まとめ ・入力した文章を元に新しい画像を高品質で生成する人工知能が注目を集めている ・大まかに商用サービス、一般向け技術デモ、研究者向け技術デモの3パターンが...
データセット

Google Universal Image Embeddingチャレンジの紹介(2/2)

1.Google Universal Image Embeddingチャレンジの紹介(2/2)まとめ ・同じ実体レベルの認識でもランドマークとアパレルでは実体にばらつきがあり性質が異なる ・従来の実体レベル認識を競うコンペでは対象とする領域...
データセット

Google Universal Image Embeddingチャレンジの紹介(1/2)

1.Google Universal Image Embeddingチャレンジの紹介(1/2)まとめ ・物体の属しているクラスではなく特定の実体まで認識する事を実体レベルの認識タスクと言う ・世界に一つしかない物体と多くの複製品を持つ可能性...