これからイラスト生成AIを始めてみたい方向けの入門記事

入門/解説

1.これからイラスト生成AIを始めてみたい方向けの入門記事まとめ

・Stable diffusionなどのイラスト生成AIを何で動かすかを決めるため入門記事
・気軽に動かせるやり方は制限があり、制限が少ないやり方はセットアップが大変なる傾向
・初心者のうちは気軽に試せるものから順番に試して慣れていく事をお勧めします

2.イラスト生成AIを動かす前の判断材料

アイキャッチ画像はstable diffusionによる生成

イラスト生成AIを昨今のように身近にしたきっかけを作ったモデルはStable diffusionと言います。

Stable diffusionが何故、話題になったのかなど経緯の解説はデザイナーやイラストレーターさん向けStable diffusion入門として別記事で書いています。しかし、動かし方はphotoshopを持っている事が前提だったので、本記事は私の把握している現時点の最新の状況を元に初心者向けのイラスト生成AIの動かし方ガイドです。

イラスト生成AIの進化の速さ

まず、イラスト生成AIの世界は非常に変化が早く、三か月も経てば状況が一変します。

本記事は2023年9月時点の私の認識です。あっという間に古く状況にそぐわないものになってしまう可能性もあるので、読者の方が読んだ時点で本記事の更新日が古かったら内容が既に古くなっている可能性があるのでそれを前提に読んでください。

突然、公式サイトが凍結されたり移転する事もあり、そういった事件があると、今までに公開されていた入門記事や紹介記事等は全部書き直す必要がありますが、書き直しが追いつかない事は多いと思います。非常に変化が激しい分野なので、私が把握できていないだけで、下記以外にも良い選択肢が存在する可能性がある事はあらかじめご承知おきください。

9月時点で画像生成AIを動かす際に知っておくべきと感じるツールはFooocusだと思います。本記事で紹介しているツール群をユーザーに技術的な知識や基礎をある程度求める第一世代としたら、詳しい仕組みを知らなくても綺麗なイラストを生成できるようにしたFooocusは第二世代です。全くの初心者の方は「Fooocus:最新のイラスト生成AIを使って無料でSNS用のヘッダーを作成する方法」を読んで動かして画像生成AIを体験してみる事をお勧めします。

どのようなモデルがあるか?

本記事内で解説するのはStable diffusionというイラスト生成AIが爆発的に流行するきっかけを作ったモデルとその後継モデルを前提としています。

Stable diffusion以外にも様々なモデルは存在しますが、公式サイトで有料サービスを提供しているケースが多いので、使いたいモデルが既に決まっていて有料サービスとして展開されているのであれば、各公式サイトに直接行った方が情報が充実していると思います。

どのような動かし方があるか?

AIや人工知能と聞くと、正体不明で得体のしれない気がする人もいるかもしれませんが、実体は5Gバイトくらいの大きさのファイルです。Stable diffusionが学習した結果はファイルとして保存されているので、ファイル単体では動かす事が出来ません。

ファイルを読み込んで、イラスト生成の指示を受け付けるように動かすためには、ハードウェア(クラウドやパソコンやスマホ等)と何等かのソフトウェア(ブラウザや自作スクリプトやアプリなど)が必要になります。

Stable diffusionのファイルを取りこんでに完全にアプリ化したものなども公開されはじめているので、GPU搭載済みの高機能パソコンをお持ちの場合は、アプリを利用する事も選択肢の1つかもしれません。しかし、まだ制限が多いようなので本記事内では対象外とします。

何で動かすかをどうやって決めるか?

気軽に動かせるやり方は制限があり、制限が少ないやり方はセットアップが大変な傾向があります。

「何経由で使うか?」「どこで動かしたいか?」によって大別すると以下の4パターンかと思います。全くの初心者の方であれば、以下で解説する(1)huggingface spacesと(2)Google Colabを覚えれば良いと思います。

(3)と(4)は本ページでは自分のパソコンで動かす前提で解説予定なので、少し難しくて「Stable Diffusionを動かすパソコンを選ぶ際の基礎知識」などを理解した上でパソコンの設定が必要になります。

何経由で? ブラウザ ターミナル/コマンドライン
どこで? 無料サービスを使いたい
(セットアップ不要だが制限あり)
自分のパソコンで動かしたい
(要セットアップだが自由度高い)
特徴 気軽に体験 pythonでカスタマイズ 様々なモデルや拡張が扱える 画像以外も扱える
気軽さと自由度の兼ね合い 気軽度←ーーーーーーーーーーーーーーーーーーーーーーーーーーー→自由度
代表的なサービス等

(1)

huggingface spaces

(2)

Google Colab

(3)

AUTOMATIC1111

(4)

huggingface diffusers

(1)huggingface spaces

利点
・何もセットアップしなくてもブラウザから様々なモデルを比較的自由に動かせます。
・最新のモデルや手法などが作者によっていち早く公開されている事も多いです。
・私も何か新しいモデルがリリースされた際などはhuggingface spacesをチェックしてみる事は多いです。

弱点
・無料サービスなので混んでいる時があり、混んでいる時は辛抱が必要です。

(2)Google Colab

利点
・Gmailのアカウントがあれば使えるGoogleの無料のGPU付きWebサービスです。
・最新のモデルや手法などが作者、もしくは有志によっていち早くColab用のファイルが公開されている事も多いです。
・実行者が占有して動かせるので、spacesのように混んでいて中々動かせないと言う事はありません。

弱点
・直接、pythonのコードを見ながら実行する事になるのでエンジニアでないと敷居が高く感じられるかもしれません。
・昔に公開されたColab用のスクリプトは動かなくなってしまっている場合があります。

(3)AUTOMATIC1111

利点
・ブラウザ画面から様々な派生モデルやアウトペインティング等の拡張を気軽に使用する事ができます。
・使用者が多いため、最新のモデルや手法などが取りこまれる速度も速く、使用例なども豊富です。

弱点
・ある程度パソコンの仕組みに詳しくないと最新版を常に動かせるように維持するのは大変です。

(4)huggingface diffusers

利点
・画像生成AI以外にも音楽や文章など様々な情報を生成可能なAIが存在しますが、それらの使用感を統一しようとするライブラリです。
・各AIの開発元自身がスクリプトを提供しているケースも多く、一次提供元データとして参照する事ができます。

弱点
・完全にプログラミングの世界です。
・ある程度、Linuxに詳しくないと最新版を常に動かせるように維持するのは大変です。
・アウトペインティング用の仕組みはまだありません。

その他の留意事項

AUTOMATIC1111とhuggingface diffusersは同じモデルであっても、チェックポイントの保存形式が異なるという非互換性があります。

理論上は変換スクリプトで相互に変換する事は出来ますが、AUTOMATIC1111もhuggingface diffusersも開発速度が非常に早いので変換スクリプトの対応が間に合ってない状況に陥る事は割と良くあります。

初心者のうちは気軽に試せるものから順番に試していく事をお勧めします。

ある程度慣れてくると、状況に応じて使いわけるようになっていくと思います。

リンク

以下、幾つかリンクを張っておきます。

(1)Space

複数の人がSpaceとして色々なモデルを公開しているので、リンク先で例えば「Stable diffusion」とキーワードで探してみてください。混んでいるページは反応が遅いので遅ければ他のページを探してみましょう。

spaces

私が探して比較的空いていると思ったページは「無料で最新のイラスト生成AIが動かせて割と空いているWebページの一覧」でご紹介しています。

2)Colab

こちらも複数の人が色々なモデルを公開しているので、Googleで「Stable diffusion Colab」とキーワードで探してください。私が過去に作ったもののリンクを以下に張っておきます。

無料版ColabでStable Diffusion2.1を動かすためのシンプルなColabを公開
無料版ColabでWaifu Diffusion 1.4 Animeを動かすためのシンプルなColabの公開
話題の画像生成AIなら愛猫の絵をゴッホに無料で描いて貰う事が可能

3)AUTOMATIC1111

AUTOMATIC1111はブラウザ経由で利用するツールなので、外部サーバー上で動いているものにブラウザからアクセスして利用する事は可能です。しかし、外部サーバー上で動かすとファイルのアップロードやダウンロードが手間なので、本ページでは自分のパソコンで動かす前提で記述します。

Stable Diffusionを動かすためにパソコンやGPUの購入を考えている方は以下の記事を参考にしてください。
Stable Diffusionを動かすパソコンを選ぶ際の基礎知識
イラスト生成AIのStable DiffusionはどのGPUで実行するのが最速か?

AUTOMATIC1111を自分のパソコンにインストールしてみようと思った方は以下の記事を参考にしてください。
AUTOMATIC1111を自分のWindows 10パソコンにインストール/セットアップする手順

また、AUTOMATIC1111と同じブラウザ経由でStable Diffusionを操作可能なソフトウェアであるInvokeAIのインストール方法の解説、AUTOMATIC1111の比較は以下の記事を参考にしてください。
InvokeAIを自分のWindows 10パソコンにインストール/セットアップする手順

AUTOMATIC1111のgithub.comの公式リポジトリは以下です。
AUTOMATIC1111 / stable-diffusion-webui

AUTOMATIC1111の公式サイトが凍結された際の一次的な移転先公式サイトであるgitgud.ioは以下です。
AUTOMATIC1111/stable-diffusion-webui

4)diffusers

かなり技術よりな解説になるので、以下では公式サイトへのリンクだけ張っておきます。

huggingface / diffusers

 

5)その他のツール

Stable Diffusionの新VersionであるStable Diffusion XL(SDXL)が発表されました。それに伴い、ComfyUIというWebツールが注目を集め始めています。

タイトルとURLをコピーしました