DreamBoothで鬼滅の刃の隊服をナウシカに着てもらう事は妥協すれば可能

画像生成

1.DreamBoothで鬼滅の刃の隊服をナウシカに着てもらう事は妥協すれば可能まとめ

・指定の仕方を工夫すると「服と羽織」は同時に取り込む事が出来た
・概念は絵柄など、他のスタイルにも影響を与えるので組み合わせ困難
・3概念を同時に組み合わせる際の最適解はまだよくわからない

2.DreamBoothで3つの概念を同時に扱う

アイキャッチ画像はstable diffusion 2.1のDreamBooth拡張で2つの実体を同時に取りこんで生成したイラストをDALL E2のアウトペインティングで更にサイズを拡張した画像
2023年1月22日更新)本記事の続きとして「DreamBoothで鬼滅の刃の隊服をナウシカに着てもらう事は可能」を掲載しました。

まず、前回のチャレンジ「DreamBoothで鬼滅の刃の蟲柱の服をナウシカに着てもらう事は可能か?」では、最後に「服」と「羽織」を別々の概念として取り込む必要があるかもと書きましたが、指定の仕方を「服と羽織」に工夫する事で一つの概念として取り込む事が出来たと思います。

以下、その結果です。

敢えてナウシカだけを指定したイラスト

まずは「ナウシカ」と「蟲柱の服と羽織」の2つの概念を取りこんだモデルでナウシカの概念を単体で指定した画像です。服は取りこんだ概念を敢えて指定していません。代わりにプロンプトで服を鬼滅の刃に寄せようとしています。顔の輪郭や全体の雰囲気は十分、ナウシカになっていますが、服は不十分で前回と同じレベルに留まっていると思います。

「ナウシカ」と「蟲柱の服と羽織」の2つの概念を指定

では本題。次に、「ナウシカ」と「蟲柱の服と羽織」の2つの概念を指定したイラストは以下です。

羽織の模様を取りこむ事が出来ているので概念2つ取り込みは出来てはいるのですが、予想外の事に、「蟲柱の服と羽織」から影響を受けてしまうのか、絵柄が似通ったイラストになり、且つナウシカから少し離れてしまいます。

2つの概念を指定した上でプロンプトで寄せる

次に「ナウシカ」と「蟲柱の服と羽織」の2つの概念を指定して且つプロンプトでナウシカに寄せようとしたイラストは以下です。

顔が寄ると服が離れ、服が寄ると顔が離れる印象を受けていますが、総合的に見ると割と良い感じです。刀の持ち方や羽織の裾の色など、細かい所に突っ込みどころは沢山あるのですが「妥協すればできました」くらいは言っても良いのかな、と思って今回のタイトルになりました。

概念同士が互いに影響を与える理由や防止策を深堀したいとは思ってはいるのですが、前回投稿時に3つの概念を取りこむと言う話をしてしまったので、3概念を同時に取り込む事が可能かどうかを先に検証する事にしました。

第三の概念

第三の概念として取り込むのは常にナウシカの肩の上にいて、言わばナウシカのシンボルマークでもあるキツネリスのテトです。


テトとナウシカ(スタジオジブリの作品静止画集より引用)

風の谷のナウシカにあまり詳しくない方向けに解説しておくと、キツネリスは作中に登場する架空の動物です。基本的に人には慣れない性格なのですが、ナウシカには心を許しています。

実はテトはナウシカを人工知能に描いて貰う際の難度を上げている原因の1つです。

ほとんどの場面でテトはナウシカの肩回りにいるのですが、現実世界には小動物を肩回りに載せている人間は滅多に存在せず、人工知能が知っている近い事例は毛皮であり、その結果、風の谷のナウシカの世界観からは決して許されざるイラストを描いてしまう危険性があります。それゆえ、テトはしっかり生きている動物である事を概念として取りこんでおきたいのです。

しかし、ここで一つ大きな選択があります。

DreamBoothで概念を取りこむ際は、取りこむ概念が属する集団(クラス)を指定する必要があります。例えば、ナウシカであれば「女性(woman)」、蟲柱の隊服であれば「服(clothes)」などが考えられます。

キツネリスと言う架空の動物は「キツネ(fox)」とするべきでしょうか?それとも「リス(squirrel)」にするべきでしょうか?

テトをリスとして取り込む

大きさ的にはリス(squirrel)なのかなぁ、と感じて取り込んだ結果が以下です。

非常にリス寄りになります。キツネリスのシャープさが失われ、全体的に太く、野生が失われた感があります。人には慣れないどころか、めっちゃ飼いならされてる感が出てきてしまいます。

テトをキツネとして取り込む

では、キツネ(fox)の場合はどうでしょうか?

こちらも非常にキツネ寄りになります。肩に乗せるのは厳しい感じのでかさです、そしてリスより目つき悪いです。そして何故かナウシカに耳が生え始めます。

どちらもテトっぽくはありません。

そしてお気づきとは思いますが、どちらの場合もナウシカの絵の品質劣化が目立っており、これに対する解決策も思いついておりません。

学習不足のような気もするのですが、更に学習を進めると、誰が呼んだかぁ~、誰が呼んだかぁ~と、誰も呼んでないのにテト仮面が頻繁に登場するようになるのでここまでいくと過学習になっている気もします。

3概念を同時に組み合わせる際の最適解はまだよくわかりません。

タイトルとURLをコピーしました