業界/分野

使える時はGPUを使ってビデオ会議の背景置き換えを精緻化(2/2)

１．使える時はGPUを使ってビデオ会議の背景置き換えを精緻化(2/2)まとめ・WebベースのGPUを使った推論はOpenGLの性能の約25%しか達成できない・これはWebGLがML作業ではなく主に画像レンダリング用にに設計されたため・Mul...

2022.09.02

アプリケーション

１．使える時はGPUを使ってビデオ会議の背景置き換えを精緻化(1/2)まとめ・ビデオ会議の使用頻度は高り、背景置き換え機能はプライバシー保護に重要・従来は何処でも使用できるようにCPUを使った推論で背景置き換えをしていた・最新のGoogle...

2022.09.01

アプリケーション

１．stable diffusionに同じ絵を描いて貰うためにはどうすれば良いか？まとめ・人工知能に画像生成して貰う際にはpromptに加えてseedが与えられている・seedは生成する画像にランダム性を持たせるために使われる大きな数字・同...

2022.08.31

その他の調査画像生成

１．UVQ：YouTubeの知覚的なビデオ品質を機械的に測定(2/2)まとめ・従来は手動で特徴量を設計しMOSでビデオ評価を行う手法が一般的だった・３つのサブネットワークを自己教師学習させて統合する事で自動化を実現・UGCの主観的評価の検証...

2022.08.28

アプリケーション

１．UVQ：YouTubeの知覚的なビデオ品質を機械的に測定(1/2)まとめ・従来のビデオ評価指標は参照となるビデオとの差分で計測されている事が多い・youtubeのようなユーザが作成するコンテンツは従来手法では評価が困難となる・UVQは主...

2022.08.27

アプリケーション

１．DALL-E2やStable Diffusion等の拡散モデルの動作原理と説明がつかない事まとめ・拡散モデルは画像に加えたノイズを除去して元画像を復元する事を学習をする・学習済モデルは純粋なノイズから画像を復元できるようになりこれが画像...

2022.08.26

基礎理論画像生成

１．画像生成人工知能のシェア分布まとめ・テキストから画像を生成する人工知能は直近、かなりの盛り上がっている・Twitter上で言及される事の多いモデルはMidjourneyだがシェアは変動しそう・自分がイメージしている画像を指示通りに作って...

2022.08.25

その他の調査画像生成

１．人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か？(stable diffusion編)まとめ・stable diffusionという性能が良さそうな画像生成モデルが公開された・オープンソースとして公開されているのでR...

2022.08.24

画像生成

１．PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて！とロボットに頼めるようになる(2/2)まとめ・ポリシーの学習には10台のロボットで11ヶ月間収集したデモデータ+αを使用・更にシミュレーションでオンラインデータを収集し...

2022.08.20

モデルロボット

１．PaLM-SayCan:飲み物をこぼしてしまったからちょっと助けて！とロボットに頼めるようになる(1/2)まとめ・ロボットは明確なタスク定義を用いて学習しているので曖昧な指示が苦手・言語モデルは曖昧な指示も理解できるが現実世界を知らない...

2022.08.19

モデルロボット

１．人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か？(Craiyon編)・DALL·E miniの開発者の人が提供してくれているCraiyonにナウシカを描いて貰う試み・Craiyonは人間の顔の表現がまだ苦手だがナウシ...

2022.08.16

画像生成

１．人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か？(Midjourney編)まとめ・Midjourneyは現在ベータテスト中でdiscordサーバーに接続すれば約25枚までは無料で画像生成・最初の無料枠を使い切ると約2...

2022.08.15

画像生成