Stable Diffusion本家サイトに掲載されているプロンプトガイド

AI

1.Stable Diffusion本家サイトに掲載されているプロンプトガイドまとめ

・人工知能に良い絵を描いて貰うためには入力プロンプトを工夫する必要がある
・初心者は生のプロンプトを使いがちだがスタイルやアーティスト指定が有効
・プロンプトエンジニアリングで画像の見栄えをよりよく制御する事が可能

2.イラスト生成人工知能により良いイラストを描いて貰う方法

以下、beta.dreamstudio.aiより「Prompt Guide」の意訳です。元記事の投稿日は不明でGravermanさんによる投稿です。

Stable Diffusionはオープンソース化されて、様々なサービスが立ち上がっているため、モデルを公開してくれた本家提供元の影がやや薄くなってしまっている印象ですが、本家はstability.aiという英国に本社がある企業です。

そのstability.aiが提供しているStable Diffusionを使った人工知能による自動イラスト生成サービスがdreamstudio.ai(ベータ版)で、今回はそのdreamstudio.aiでプロンプトガイドとして紹介されていたページの意訳です。

dreamstudio.aiは訪問すると何の説明もなしに唐突にアカウント登録ウィンドウが表示されてその無愛想さにビビるかもしれませんが、登録に関してメールアドレス以外に必要なものはなく、登録すると2ポンド分(200 generations)の使用枠が貰えます。

使用枠は最初にアカウントを作成したときの1回限りのボーナスであり、DALL·E 2のように補充されることはありませんが、1000 generationsを10ポンド(約1,642円)で購入する事ができます。

512 x 512サイズの画像を50step反復させて画像を生成すると1 generations消費との事なので、ディフォルト設定で200枚作成出来ると言う事ですね。

なお、1024 x 1024サイズを150step反復させた際は28.2 generations消費との事なので解像度を上げると消費が激しいです。

しかし、step数を増やすと細部が書き込まれるようになると言う触れ込みですが、私の経験則上で言うと、顔がぼやけている画像をstep数を増やして再生成させると、顔が綺麗になるのではなく背景がより細かく書き込まれるようになる等の見当違いの方向に行くケースが多く、50step以上増やす意味はあまり感じたことがありません。

オープンソースとして公開されたモデルと同じモデルを使っているのか否かは特に明言されていませんが、私がざっと使って見た限り、何らかの追加チューニングがされているような印象を受けています。(追記:9月10日時点では使用モデルが選べるようになっておりディフォルトがstable-diffusion-v1.5になっています。オープンソースとして公開されている版はstable-diffusion-v1.1, 1.2, 1.3, 1.4なのでやはりオープンソース版より新しいです。また、シードの指定や画像指定なども出来るようになっているので多機能です)

そのため、他サイトでStable Diffusionを使って見てどうしてもいい感じのイラストが生成できない場合は登録して試してみる価値はあるかもしれません。

2022年9月9日追記)画像を元に新規画像を生成する機能とPhotoshopからAPIを呼び出す機能が追加されたそうです。進化の速度が速いですね。

アイキャッチ画像はdreamstudio.aiのWebインタフェース画面

プロンプトエンジニアリングの基礎知識

今日は、初心者がテキストから画像を作成するAIを使って、より良い作品を作るための簡単な公式を提案します。これはStable Diffusionでテストされましたが、十分なアートデータで訓練されれば、どんなモデルでも使えるはずです。

このドキュメントを読み、これらの簡単なステップを適用した後、あなたは同じ労力でより良い画像を生成することができるようになるはずです。

1. 生のプロンプト

生のプロンプトとは、例えば、生成したいものを最もシンプルに記述する事です。

(1)Panda
(2)A warrior with a sword
(3)Skeleton

これはプロンプトの基本的な構成要素です。ほとんどの初心者は、生のプロンプトだけを使うことから始めますが、これは通常間違いです。このようにして生成された画像は、ランダムで無秩序になる傾向があるからです。ここでは、私が以前のプロンプトを実行して生成したいくつかの例を示します。

ご覧のように、これらの画像は風景が無造作に描かれていて、とても美的センスに溢れたものではありません。そこで、次のポイントです。

2. スタイル

スタイルは、プロンプトの重要な部分です。AIは、指定されたスタイルがない場合、通常、関連する画像で最も多く見たものを選択します。たとえば、風景画像を生成した場合、おそらくリアルな画像か油絵のような画像を生成するでしょう。スタイルは生のプロンプトの直後におかれ、画像に最も影響を与えるため、よく考えられたスタイルと生のプロンプトだけで十分な場合もあります。

最も良く使用されるスタイルには、以下のものがあります。

(1)Realistic(リアル)
(2)Oil painting(油絵)
(3)Pencil drawing(鉛筆画)
(4)Concept art(コンセプトアート)

これらのスタイルをどのように使うか、一つずつ検証して、その概要を説明します。

リアルな画像の場合、それをスタイルにする方法は様々ですが、ほとんどが似たような画像に仕上がります。ここでは、よく使われる写実的な画像にするテクニックを紹介します。

(1)a photo of + 生のプロンプト
(2)a photograph of + 生のプロンプト
(3)生のプロンプト, hyperrealistic
(4)生のプロンプト, realistic

もちろん、これらを組み合わせることで、よりリアルなイメージを得ることができます。

油絵を得るには、プロンプトに「an oil painting of(油絵の)」と追加するだけでよいのです。この場合、額縁内に収まった油絵が表示されることがありますが、これを修正するには、プロンプトを再実行するか、生のプロンプト + 「oil painting(油絵)」を使用します。

鉛筆画を作成するには、生のプロンプトに「a pencil drawing of(鉛筆画の)」を追加するか、プロンプトを生のプロンプト+「pencil drawing(鉛筆画)」とするだけです。

風景画(landscape art)も同様です。

3. アーティスト

自分のスタイルをより具体的に、あるいはイメージをより一貫したものにするために、プロンプトにアーティストの名前を使用することができます。例えば、非常に抽象的なイメージにしたい場合は、「Made by Pablo Picasso(パブロ・ピカソの作品)」または単に「Picasso(ピカソ)」と付け加えるとよいでしょう。

以下に、さまざまなスタイルのアーティストのリストを掲載しますが、新しいアートを発見するクールな方法として、私は常にさまざまなアーティストを検索することをお勧めします。

(1)肖像画(Portrait)
John Singer Sargent
Edgar Degas
Paul Cézanne
Jan van Eyck
Oil painting

(2)油絵(Oil painting)
Leonardo DaVinci
Vincent Van Gogh
Johannes Vermeer
Rembrandt

(3)Pencil/Pen drawing(鉛筆/ペン画)
Albrecht Dürer
Leonardo da Vinci
Michelangelo
Jean-Auguste-Dominique Ingres

(4)Landscape art(風景画)
Thomas Moran
Claude Monet
Alfred Bierstadt
Frederic Edwin Church

アーティストをミックスすることで、面白い作品ができる可能性があるので、ぜひ推奨します。

4. 仕上げの作業

この部分は、人によっては極端になり、この記事よりも長いプロンプトになることがあります。仕上げとは、プロンプトを思い通りに仕上げるために、最後に追加するものです。例えば、よりアーティスティックなイメージにしたい場合は、「trending on artstation」を追加します。よりリアルなライティングを追加したい場合は、「Unreal Engine」を追加します。何を加えても良いのですが、以下に例を挙げます。

Highly detailed(高精細), surrealism(シュールレアリズム), trending on art station(アートステーションの流行), triadic color scheme(トライアディック配色), smooth(スムーズ), sharp focus(シャープフォーカス), matte(マット), elegant(エレガント), the most beautiful image ever seen(今まで見た中で最も美しい画像), illustration(イラスト), digital paint(デジタルペイント), dark(ダーク), gloomy(陰鬱), octane render(オクタンレンダー), 8k, 4k, washed colors(ウォッシュドカラー), sharp(シャープ), dramatic lighting(ドラマチックライティング), beautiful(美しい), post processing(ポストプロセス), picture of the day(今日の一枚), ambient lighting(環境照明), epic composition(叙事詩的構図)

5.まとめ

プロンプトエンジニアリングは、画像がどのように見えるかをよりよく制御することができます。(正しい方法で行えば)あらゆる面で画質が向上します。この本記事を楽しんでいただけたのでしたら、まぁ、私の時間が無駄にならなくてよかったと思います。

もし、これを改善する方法があれば、ぜひdiscord(Graverman#0804)で教えてください。

3.Stable Diffusion本家サイトに掲載されているプロンプトガイド関連リンク

1)beta.dreamstudio.ai
Prompt Guide

2)twitter.com
@dailystablediff

タイトルとURLをコピーしました