1.Waifu Diffusion 1.5 Beta 3を使ってLoRAとReference-only ControlNetを比較まとめ
・Waifu Diffusion 1.5 Beta3としてBase, Radiance, Ink, Mofu, Illusionの5つのモデルが公開されてHugging Faceよりダウンロード可能に
・Waifu Diffusion 1.5はStable Diffusion 2.1ベースのモデルであるがReference-only ControlNetは利用できるのでLoraと比較してみた
・各モデルに、LoRAの重み、ControlNetのバランス、プロンプトの重み、更にWDシリーズの特徴でもあるタグを使うと非常に柔軟なスタイル構成が可能
2.Waifu Diffusion 1.5 Beta 3とは?
Waifu Diffusionは二次元イラストに定評がある老舗モデルで、一昨日、Beta 3が発表されました。
なんと一挙に5モデル。Waifu Diffusion 1.5 Beta3 Base, Waifu Diffusion 1.5 Radiance, Waifu Diffusion 1.5 Ink, Waifu Diffusion 1.5 Mofu, Waifu Diffusion 1.5 Illusionです。
Baseモデルは微調整用途のモデルという事ですが、以下でわかるように4モデルで画風がかなり異なります。
Base |
Radiance |
Ink |
Mofu |
Illusion |
ディフォルトの推奨プロンプト「(exceptional, best aesthetic, new, newest, best quality, masterpiece, extremely detailed, anime, waifu:1.2)」
ディフォルトの推奨ネガティブプロンプト「lowres, ((bad anatomy)), ((bad hands)), missing finger, extra digits, fewer digits, blurry, ((mutated hands and fingers)), (poorly drawn face), ((mutation)), ((deformed face)), (ugly), ((bad proportions)), ((extra limbs)), extra face, (double head), (extra head), ((extra feet)), monster, logo, cropped, worst quality, jpeg, humpbacked, long body, long neck, ((jpeg artifacts)), deleted, old, oldest, ((censored)), ((bad aesthetic)), (mosaic censoring, bar censor, blur censor)」
に「nausicaa, hayao miyazaki,1girl」を加えて出力した結果。髪の色の赤と服の色の青からWaifu Diffusionはナウシカと言う概念を最初から知っているように見えます。
そして、BaseモデルでLoRAを学習させ、各モデルに適用した結果が以下です。
Base |
Radiance |
Ink |
Mofu |
Illusion |
さて、本題です。Waifu Diffusion 1.5はStable Diffusion 2.1ベースのモデルであるため、Stable Diffusion 1.5ベースのモデルを使った拡張機能、例えばControlNet等は有志が対応版を作成してくれるまで使用できないケースがありました。しかし、先日紹介したReference-only ControlNetは参照用画像を直接モデルに適用するので何とStable Diffusion 2.1ベースのモデルにもそのまま使えるのです。
そして、ちょうど、LoRAとReference-only ControlNetの比較も気になっていた所なので、以下で各モデルについて「LoRA単独」、「Reference-only ControlNet単独」、「LoRA+Reference-only ControlNet」を比較してみようというのが今回のお題です。
Waifu Diffusion 1.5 RadianceのControlNetとLora
ControlNetに与えた参照画像 |
Waifu Diffusion 1.5 Radiance LoRA only |
|
reference_only |
adain |
adain_attan |
reference_only + LoRA |
adain + LoRA |
adain_attan + LoRA |
Waifu Diffusion 1.5 InkのControlNetとLora
ControlNetに与えた参照画像 |
Waifu Diffusion 1.5 Ink LoRA only |
|
reference_only |
adain |
adain_attan |
reference_only + LoRA |
adain + LoRA |
adain_attan + LoRA |
Waifu Diffusion 1.5 MofuのControlNetとLora
ControlNetに与えた参照画像 |
Waifu Diffusion 1.5 Mofu LoRA only |
|
reference_only |
adain |
adain_attan |
reference_only + LoRA |
adain + LoRA |
adain_attan + LoRA |
Waifu Diffusion 1.5 IllusionのControlNetとLora
ControlNetに与えた参照画像 |
Waifu Diffusion 1.5 Illusion LoRA only |
|
reference_only |
adain |
adain_attan |
reference_only + LoRA |
adain + LoRA |
adain_attan + LoRA |
ControlNetとLoRAの比較まとめ
・各ControlNetではディフォルトに加えて1girlのみプロンプトに加えています。つまり「nausicaa, hayao miyazaki,1girl」は指定していません。
・ControlNet adainはあまり効いてないようにも見えますがControlNet v1.1.173での結果です。
・今回、LoRAの重視度を少し強めすぎた気がしてますが、Waifu Diffusionが元からナウシカを知っている事もあり、明確にしておきたかった経緯です。
・ControlNet Rederence only はどのケースでもポーズをちゃんと捉えてくれているので、Stable Diffusion2.1系列のモデルにとっても使い勝手が良いです
・各モデルに、LoRAの重み、ControlNetのバランス、プロンプトの重み、更にWDシリーズの特徴でもある以下のタグを使うと非常に柔軟なスタイル構成ができます。
年代指定用タグ
タグ | イラストが投稿された年代 |
---|---|
oldest | 1995 – 2010 |
old | 2010-2015 |
new | 2015-2020 |
newest | 2020 – |
aestheticスコア指定用タグ
タグ | aestheticスコア |
---|---|
exceptional | ≥ 6.675 |
best aesthetic | ≥ 6 |
normal aesthetic | ≥ 5 |
bad aesthetic | < 5 |
Booru sitesスコア指定用タグ
タグ | Booru sitesスコア |
---|---|
masterpiece | ≥ 150 |
best quality | ≥ 100 |
high quality | ≥ 75 |
medium quality | ≥ 25 |
normal quality | ≥ 0 |
low quality | < 0 |
worst quality | < -5 |
追加タグ
タグ | タグの意味 |
---|---|
deleted | Booru サイトで削除済みとしてマークされた画像。 |
waifu | 「ワイフ」の概念を体現する、現実世界またはアニメの女性に特化した画像 |
real life | 現実世界の題材を描いた画像。 |
anime | アニメの題材を描いた画像。 |
インスタグラムから引用した画像 |
を使いこなすと、新しめのスタイルと古めのスタイルで、アニメスタイルからリアルスタイルに徐々に変えて好みのスタイルを探す事などもできます、Waifu Diffusionすごい!
Waifu Diffusion 1.5 Beta 3のインストール方法
以下、AUTOMATIC1111用の説明です。
(1)モデルのダウンロード
「 https://huggingface.co/waifu-diffusion/wd-1-5-beta3/tree/main 」より、
wd-illusion-fp16.safetensors, wd-ink-fp16.safetensors, wd-mofu-fp16.safetensors, wd-radiance-fp16.safetensorsの4モデルをダウンロードして、models/StableDiffusionフォルダに格納
(2)設定ファイル(yaml)のダウンロード
beta3のフォルダにはないので以下のbeta2内のフォルダからwd-1-5-beta2-fp16.yamlをダウンロードしてmodels/StableDiffusionフォルダに同名で格納(つまり、wd-illusion-fp16.yaml, wd-ink-fp16.yaml, wd-mofu-fp16.yaml, wd-radiance-fp16yamlというファイルを作る)
「 waifu-diffusion/wd-1-5-beta2 」
(3)VAEのダウンロード
beta3のフォルダにはないのでwaifu-diffusion-v1-4内のフォルダからkl-f8-anime2.ckptをダウンロードしてmodels/StableDiffusionフォルダに同名+拡張子.ptで格納(つまり、wd-illusion-fp16.pt, wd-ink-fp16.pt, wd-mofu-fp16.pt, wd-radiance-fp16.ptというファイルを作る)
「 hakurei / waifu-diffusion-v1-4 」
(3)はAUTOMATIC1111の設定にもよるのでSettingタブで「Ignore selected VAE for stable diffusion checkpoints that have their own .vae.pt next to them」にチェックが付いている事を要確認です。
3.Waifu Diffusion 1.5 Beta 3を使ってLoRAとReference-only ControlNetを比較関連リンク
1)saltacc.notion.site
WD 1.5 Beta 3 – Release Notes (詳細な解説)
2)huggingface.co
waifu-diffusion / wd-1-5-beta3 (モデルのダウンロード先)