業界/分野

アプリケーション

UVQ:YouTubeの知覚的なビデオ品質を機械的に測定(2/2)

1.UVQ:YouTubeの知覚的なビデオ品質を機械的に測定(2/2)まとめ ・従来は手動で特徴量を設計しMOSでビデオ評価を行う手法が一般的だった ・3つのサブネットワークを自己教師学習させて統合する事で自動化を実現 ・UGCの主観的評価...
アプリケーション

UVQ:YouTubeの知覚的なビデオ品質を機械的に測定(1/2)

1.UVQ:YouTubeの知覚的なビデオ品質を機械的に測定(1/2)まとめ ・従来のビデオ評価指標は参照となるビデオとの差分で計測されている事が多い ・youtubeのようなユーザが作成するコンテンツは従来手法では評価が困難となる ・UV...
画像生成

DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事

1.DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事まとめ ・拡散モデルは画像に加えたノイズを除去して元画像を復元する事を学習をする ・学習済モデルは純粋なノイズから画像を復元できるようになりこれが...
その他の調査

画像生成人工知能のシェア分布

1.画像生成人工知能のシェア分布まとめ ・テキストから画像を生成する人工知能は直近、かなりの盛り上がっている ・Twitter上で言及される事の多いモデルはMidjourneyだがシェアは変動しそう ・自分がイメージしている画像を指示通りに...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(stable diffusion編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(stable diffusion編)まとめ ・stable diffusionという性能が良さそうな画像生成モデルが公開された ・オープンソースとして公開されているの...
モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(2/2)まとめ ・ポリシーの学習には10台のロボットで11ヶ月間収集したデモデータ+αを使用 ・更にシミュレーションでオンラインデータを収...
モデル

PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)

1.PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて!とロボットに頼めるようになる(1/2)まとめ ・ロボットは明確なタスク定義を用いて学習しているので曖昧な指示が苦手 ・言語モデルは曖昧な指示も理解できるが現実世界を知ら...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Craiyon編) ・DALL·E miniの開発者の人が提供してくれているCraiyonにナウシカを描いて貰う試み ・Craiyonは人間の顔の表現がまだ苦手だがナ...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Midjourney編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Midjourney編)まとめ ・Midjourneyは現在ベータテスト中でdiscordサーバーに接続すれば約25枚までは無料で画像生成 ・最初の無料枠を使い切ると...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(DALL·E 2編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か(DALL·E 2編)? ・DALL·E 2のベータテストの敷居はかなり下げられていて登録すると数日で招待される ・初月は50クレジット、その後は毎月15クレジットを無料...
画像生成

人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(latent diffusion編)

1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(latent diffusion編)まとめ ・人工知能に指示を与える際はなるべく具体的な描写が望ましいが長文すぎると後半は無視される ・通常の言い回しよりインターネッ...
入門/解説

Dall-E 2、Midjourney、Stable Diffusionなど文章から画像を生成する人工知能の一覧

1.Dall-E 2、Midjourneyなど文章から画像を生成する人工知能の一覧まとめ ・入力した文章を元に新しい画像を高品質で生成する人工知能が注目を集めている ・大まかに商用サービス、一般向け技術デモ、研究者向け技術デモの3パターンが...