画像生成人工知能のシェア分布

１．画像生成人工知能のシェア分布まとめ

・テキストから画像を生成する人工知能は直近、かなりの盛り上がっている
・Twitter上で言及される事の多いモデルはMidjourneyだがシェアは変動しそう
・自分がイメージしている画像を指示通りに作ってもらうのはやはり困難

アイキャッチ画像は画像を入力に与えて生成した画像群の中で唯一まともな画像が生成できた木が生える前の天空の城ラピュタ by stable diffusion

テキストから画像を生成する人工知能は直近、かなりの盛り上がりを見せており、技術よりではない一般のメディアなどでも目に付く事が多くなってきました。

日本だとMidjourneyが話題になる事が多いのですが、文章から画像を生成する人工知能の一覧でまとめたように、様々な種類のサービスが次々と発表されている状態です。そのため、Twitter上で言及される割合/ランキングを調べてみました。

必ずしもモデル名が言及されているわけではなく、#aiart という括りでツイートしている人もいますが、モデル名で見るとMidjourneyのシェアが思った以上に多かったです。dalle2は初期のクローズドベータユーザ厳選戦略が裏目に出たのか、予想外に大きな差がついていました。

オープンソースな事で注目を集めているstable diffusionは4位ですが、22日に公開されてからAI Artに関するツイート数自体が倍増しており、Colabや関連ツール等の公開も相次いでいるようなので、おそらく今後シェアはもっと増えると思います。

また、dalle2は毎月無料クレジットが付与されるので長期的には逆転もあるかもしれません。

イイネ等の注目を集めている画像は元からフォロワーが多い人が「使ってみた」系の投稿についているケースが多いです。

それゆえ、プロンプトエンジニアリングの参考になるような投稿はあまり見かけませんが、プロンプト生成をサポートするWebサービスなども公開されてきているようで、新たなエコシステム／業態が生まれつつあるのかな、という気もします。

しかしながら、自分がイメージしている画像を指示通りに作ってもらうのはやはり一筋縄ではいかないです。入力として参照画像を与えても変な方向に行く事が多く、実務的な使われ方としてはAIが生成した画像を人間が微修正する的な使われ方になる気がします。

以下、割と面白い方向に転んだジブリ映画場面のNG例ですが、形が崩れてしまうNG例の方が圧倒的に多いです。

普段着のゲド戦記

猫っぽい構造物になった巨神兵の化石

進撃の巨人っぽいトトロ

プロンプトエンジニアリング力は鍛えていきたいです。