1.人工知能にスタジオジブリの風の谷のナウシカを描いてもらう事は可能か?(Midjourney編)まとめ
・Midjourneyは現在ベータテスト中でdiscordサーバーに接続すれば約25枚までは無料で画像生成
・最初の無料枠を使い切ると約200枚まで10ドル/月のプランなど有料契約が必要になる
・Midjourneyはアニメーション画像風の画像生成は現時点ではDALL·E 2より苦手な可能性あり
2.Midjourneyのプロンプトの実例
latent diffusion、DALL·E 2と並べたからにはとても綺麗な画像を生成できると注目を集めているMidjourney(ミッドジャーニー)もやっておくべきであろうと言う事で、同一プロンプトでMidjourneyにも画像を生成して貰いました。
なお、Midjourneyは現在ベータテスト中でdiscordサーバーに接続すれば約25枚までは無料で画像生成できます。将来的には変更されるかもしれませんが、現時点での価格表は下記。
フリートライアル | ベーシック | スタンダード | 法人プラン ※4 | |
価格 | 無料 | 10ドル/月 | 30ドル/月 | 600ドル/年 |
高速GPU時間 ※1 | 25分/一回限り | 200分/月 | 15時間/月 | 120時間/年 |
リラックスGPU時間 ※2 | No | No | Yes | Yes |
メータモード ※3 | No | Yes | Yes | Yes |
Personal Bot Chat | No | Yes | Yes | Yes |
生成画像を非公開にするオプション | No | 20ドル/月 | 20ドル/月 | 価格に含まれる |
※1 画像生成操作1回には高速GPU時間が約1分、高解像度化操作はもう少し多く、作成した画像のバリエーションを作成する操作ではもう少し少ない時間がかかる
※2 リラックスGPUは高速GPUの4倍くらい時間がかかるけれども無料
※3 メーターモードでは高速GPU時間を1時間辺り4ドルで購入可能
※4 年間収益が100万ドルを超える企業の従業員は要法人プラン
ちなみにMidjourneyも「Nausicaä of the Valley of the Wind(風の谷のナウシカの英語版タイトル)」そのものずばりを入力すると以下のような美麗ではあるけど全くもって無関係な画像を生成するので「ナウシカ描いて!」と直接指定する事は出来ません。
それでは、レッツスタート!
なるべく具体的な指示で人工知能に絵を描いてもらう実例
「A red haired girl in blue smiles in a fungus forest, oil on canvas(赤い髪の青い少女が菌類の森で微笑んでいます。キャンパスの油絵)」
きのこを!きのこをはやすな!
画像自体は美麗だけれども、きのこで全てを台無しにするおそるべし、Midjourneyさん
次、スタジオジブリ風とスタイルを指定するとどうか?
「Studio Ghibli style painting of a girl with red hair, dressed in blue, smiling in a golden meadow.(赤い髪で、青い服、金色の草原で微笑む少女をスタジオジブリ風に描いた作品)」
うお?やっぱりジブリ風とは思えない。笑顔が全て同じパターンと言うのも意外だし、右下凄い首が長い画像を平然と表示してくるのも意外。
それでは日本のアニメーション、Japanimation風では?
「Japanimation style painting of a girl with red hair wearing blue clothes and riding a glider.(赤い髪の女の子が青い服を着てグライダーに乗る姿をジャパニメーション風に描いたもの)」
グライダーの概念がやはり難しいのだろうか理解出来てないように思える。しかし、左上は「子供時代のナウシカが飛行訓練しているところをイメージして描きました」と言い張ればいけるだろう、採用!
アイキャッチ画像は左上の画像をアップスケールして解像度をあげたもの。アップスケールすると細部が更に書き込まれるようになるため、ちょっとイメージが変ってしまった。
次、絶対知ってるだろうと思われるディズニー風を指定
「Disney movie poster showing a girl with red hair wearing blue and riding a bird like horse.(青い服を着た赤毛の女の子と鳥のような馬に乗ったディズニー映画のポスター)」
うほ?
これディズニー?Midjourneyさん、もしかして二次元ネタ苦手でいらっしゃる?
それではカードゲーム風指定はどうだろう?カードゲーム風な美麗な画像を学習用データとして使っているのではないかと思うので親和度は高そうだけど。
MTG card illustration of a girl with red hair wearing blue and holding a sword.(赤い髪の女の子が青い服を着て、剣を持っているMTGカードのイラスト)
うーん、右下とかスターウォーズ入ってるな。カードゲーム的な雰囲気はあまり感じない。
それでは王蟲は?
「Animation of 10 giant sandworms sprinting with angry red eyes through a fungus forest(10匹の巨大な砂虫が怒った赤い目で菌類の森を駆け抜けるアニメーション)」
これはsandwormsはわかってるっぽいですね。でも赤い目等の指示は無視されている。
次、巨神兵のタペストリー
「Tapestry of a giant destroying a city by emitting destructive rays from its mouth.(巨人が都市を破壊し、その口から破壊的な放射線を放射するタペストリー)」
うむ、巨人、どこいった?
では、メーヴェに乗っている場面を描いて貰う事は可能か?
「Watercolor of a woman with red hair, dressed in blue, wearing a helmet, flying above the clouds in a white glider.(青い服を着た赤い髪の女性がヘルメットをかぶり、白いグライダーで雲の上を飛んでいる様子を水彩画で表現)」
年配の女性パイロット的な感じになっちゃいますね。グライダーの概念はやっぱり難しそうですね。
「Oil painting of a red haired woman in blue flying in a white hang glider.(白いハンググライダーで飛行する青い服の赤毛の女性を描いた油絵)」
うむ、やはり年配の女性パイロット的な感じ
では、ポスター風。
Poster for the animated film Nausicaa of the Valley of the Wind.(アニメ映画「風の谷のナウシカ」ポスター)
美麗ではあるけど全くもって無関係ですな。左上、もしかしたら正面下部にナウシカを小さく描いてくれているのかな、と思って限界(1664×1664)までアップスケールしてみました。
特にそんな事はなかった!
くっ、やはり、人工知能に自分が望んだ画像を書いてもらうのって相当、難度高いのか!?
しかし、安心したまえ!
Midjourneyさんには、文章だけではなく、画像をプロンプトとして与える機能もあるのだ!
流石に、画像を直でヒントとして指定したらイイ感じにやってくれるでしょう。
今回、入力プロンプトとして使わせて頂いた画像はスタジオジブリが「常識の範囲でお使いください」と公開してくれている以下の画像
さて、どうだ!頼むぞ、Midjourneyさん!
えぇ~~~~~~~~
将来的には改善されるかもですが、現時点のMidjourneyさんは多分、二次元苦手です。