1.話題の画像生成AIなら愛犬の銅像を無料で描いて貰う事が可能まとめ
・話題の画像生成AIにはオリジナル画像を取り込む能力を持つモデルも存在する
・例えば、愛犬の写真を取りこんで人工知能にイラストとして描いて貰う事も実現可能
・誰でもブラウザで無料で動かせる形で公開したので興味ある方は試してみてください
2.話題の画像生成AIに愛犬のイラストを描いて貰う
・上記の修正にミスがあったので再修正しました。ご指摘ありがとうございました。
話題の画像生成AIと言っても新しいモデルが次々と発表されていますが、今回紹介するのはStable Diffusionといって、自由に利用できるような形式で公開されているAIです。しかも、10日前に公開されたばかりの最新のStable Diffusion 2.0です。
Stable Diffusionが有名になった理由や簡単に使う方法は以前紹介していますが、自由に気軽に利用できる形式で公開されたため、その後も様々な人が様々な拡張を発表しており、その中には特定の写真/画像/イラスト/スタイルを取り込む事ができる拡張もあります。
例えば、あなたの愛犬の写真に「waj 」と仮の名前を付けて取り込んで、人工知能に描いて貰いたいイラストとして
「Photo of waj dog」(waj 犬の写真)
を描いて!と英語で指示すれば、貴方の愛犬を人工知能に描いて貰えるのです。
上記の例はシンプルですが、例えば、アイキャッチ画像のように渋谷のハチ公像を入れ替えてもらう事など、指示の仕方を工夫すれば様々な画像を作成して貰う事が可能です。
この手法は色々な応用が出来るので、例えば、結婚式の余興用に新郎新婦の写真を取りこんでイラストを作成してプレゼントしたり、好きなキャラクターのファンアートを作成したり、大物俳優を他の映画に出張させて応援イラストを作ったりなども実現できます。
正直、上手な取り込み方や組み合わせ方法は現在も様々な方が試行錯誤している最先端の研究分野であり、一発で指示通りに欲しい画像を描いて貰う事は難しいかもしれません。私の過去の記事にもありますが上手くいかない事の方が多いです。
しかし、元画像は3~5枚程度で十分であり、取りこむために必要な人工知能の学習時間も1時間程度、Gmailのアカウントを持ってる人であれば誰でもブラウザで無料で動かせるので、元手がかかりません。
ちょっと難しく思えるかもしれませんが、自分の好みの絵を描いて貰うだけならば動作原理を理解する必要はないので、興味を持った方は是非やってみてください、とても面白いですよ。
手順は以下です。
(1)元ファイルの場所に移動
以下のリンクをクリックします。
Stable_Diffusion_2_1_base512_DreamBooth_finetune.ipynb
(2)Google Colabに移動
表示されたページ上の方にある赤い枠部分「Open in Colab」をクリックします。
(3)自分用に保存
左上メニューの「ファイル」→「ドライブにコピーを保存」で自分用にファイルを保存します。ミスしてファイルを壊してしまっても、ここまでの手順を繰り返せば元に戻るので安心です。コピーが完了すると別タブが開くので、わかりやすいように名前を変えて、以降は自分用にコピーしたファイルを使います。
(4)プログラムの実行
基本的には左側にある赤い枠部分を順番にクリックしていくだけです。
内容を理解する必要は全くないですが、初回実行時はボタンを押すと下記の警告が出るので心配性な方はボタンを押す前に何をやっているのかざっと内容を流し読みすると安心できるかもしれません。
それでは頑張ってみてください!
参考)チューニングのポイント
・学習用に与える画像の質と量
・学習時に与える文章と画像生成時に与える文章
・学習率と学習を止めるタイミング
その他、色々な工夫が試行錯誤されている段階です。
どうしても上手くいかない場合はもう少し簡単な特定の画像の作風を変えるサンプルも掲載しているのでそちらにチャレンジしてみる事もおすすめです。
以下、技術系のお話
先日公開した記事「Colabで768版のStable Diffusion2.0をDreamBoothする」で、使ったColabを後で公開する予定ですと書いたのですが、11月30日までは動いていたのに突然メモリ不足で失敗するようになり、その原因がわからず苦戦していました。
良くある事ではありますが、関連ライブラリの依存関係が変った事が原因だったようで原因をひも解いていくのは、骨が折れる作業でした。
そのため、せっかく公開するならば、技術系でない方でも興味を持ってもらえるような記事にしてみようと考え、冒頭のような書き出しになった次第です。
Stable Diffusion 2.0用に汎用性と使い勝手を良くしたColabやDockerイメージを公開してくれる方はきっといると思うので、今回は
・無料版ColabでStable Diffusion 2.1のBaseモデル(512解像度版)を動かす
・無料版ColabでStable Diffusion 2.1のBaseモデル(512解像度版)をDreamBoothで拡張して動かす
事のみに特化したシンプルなnotebookになっています。
画像生成AI関連分野はモデル及び関連ライブラリの開発速度の速さが尋常ではないので今回公開したColabもいつまで問題なく動作するかは未知数ではありますが、少なくとも本日時点では無料版Colabで動作する事は確認済ですので興味のある方は是非使ってみてください。