infinite zoom outとzoom in:stable diffusionで作成したイラストを無限にズームして動画を作成

入門/解説

1.infinite zoom outとzoom in:stable diffusionで作成したイラストを無限にズームして動画を作成まとめ

・stable diffusionで画面の奥に向かってひたすらカメラが進む or 引いていく動画を作成するスクリプトが公開されている
・colabも公開されているので動かす事は容易だが、stable diffusion-2 inpaintingモデルが前提のためカスタマイズ今年
・動画内のスタイルや人物を安定させるのは難しいがAIの潜在意識を泳いでいるような世界観の動画を作成できる

2.infinite zoom outとzoom inとは?

アイキャッチ画像はinfinite zoom outとinで生成した動画からの切り取り

「無限にズームして動画化する」と、言葉で書くとよくわかりませんが、おそらく、皆さんもどこかで見たことがあるタイプの動画ではないかな、と思います。

画面の奥に向かってひたすらカメラが進んでいく、もしくは引いていくように見えるので静止画に動きを与える事ができるテクニックです。

注意:動画サイズ(50MBくらい)を5MB以下に小さくするため解像度を512から256に圧縮しており、スムーズさや綺麗さがだいぶ犠牲になっています。本来はもっとスムーズです。以下、全ての動画が同様にスムーズさがだいぶ犠牲になっています。

一か月くらい前に上記のズームアウトしていくinfinite zoom outの方が公開されました。作者はgoogle ai tokyoからstability.aiに行ったhardmaruさんです。google時代は強化学習関連の投稿をgoogle aiブログにも投稿されていたのでwebbigdataでも何度か意訳した事があります。

そして一週間くらい前にBalintKomjatiさんがズームインバージョンのinfinite zoom inとcolabを公開してくれました。実装はdiffusersで、現時点ではまだAUTOMATIC1111に移植はされてないと思います。

colabも公開されているので動かす事は割と簡単にできます。余談ですが、colabに苦手意識ある方は「イラスト生成AIを動かしたい人向けのColabの解説」を読んで是非とも慣れてください。

しかし、カスタムモデルで動かそうとするとちょっと難しく、まだ私は完全に動かし方の手順も整理できておらず、使いこなせているとは言い難い状態です。理由は、内部で使っているモデルがstable diffusion-2 inpaintingといって、インペインティング用のモデルであるためです。

stable diffusion-2 inpaintingはstable diffusion 2.0 baseを更に微調整したもので、インペインティング用に動かす事はありますが、現在はstable diffusion 2.1 or 1.5が主流なので、あまりカスタマイズ対象にする事がない馴染みのないモデルです。

2.1ベースのカスタムモデルに無理やり適用するとなんかちょっと変ですが以下です。

元のデモのように小道やトンネルをひたすらズームしていくのは絵的に面白いですが、人物を主体にする場合は構成等を工夫しないと途中経過があまり面白味がなくなってしまいますが、それ以外にも何かどこかが上手く動いていないようにも見えます。

ただ、やっている事はシードを固定して作成したイラストをinpaintingモデルで一部を描き換えて連続で作成して、最終的に動画として繋げているので、シードとプロンプトの組み合わせがイマイチマッチしていないだけの可能性もあります。

2.0用のを2.1にしたのに無理があるのかな、と思ってカスタマイズしていない1.5のinpaintingモデルで動かしてみると以下ですが、やはりなんか微妙なズレが出てきてしまっている気がします。

このあたり、前述のとおりイラスト品質のブレなのか、モデル側が原因なのか、設定ファイルなのか、スクリプトなのか、ちょっとまだ調べ切れていないのですが、更に頑張って1.5ベースのカスタムモデルに無理やり適用した動画は以下です。

おぉ、面白い!

悪夢のような画像を生み出すと当初はネガティブな反応が多かったけれども、綺麗な画像も生成できたDeepDreamの同様な動画を思い出します。

まだ、道中が色々と崩れてしまっており、やっぱり変ですが、AIの潜在意識、潜在空間内を泳いでいるような、本家宮崎駿の雑想ノート的な世界観は随所に出ているような気はして、とても面白いです。千と千尋の神隠しの油屋を舞台にして動画化するととても雰囲気でそうです。

もっと詳しくしらべて頑張って調整すれば、面白い動画が出来そうです。

3.infinite zoom outとzoom in:stable diffusionで作成したイラストを無限にズームして動画を作成関連リンク

1)github.com
image-notebook/stable-diffusion-2-infinite-zoom-out/ (zoom out)
BalintKomjati / smooth-infinite-zoom (zoom in)

2)colab.research.google.com
smooth_infinite_zoom.ipynb

タイトルとURLをコピーしました