1.人工知能に描いて貰ったイラストを人工知能に採点してもらうまとめ
・Stable Diffusionの学習データはドイツのLAIONという団体が収集した
・自イラストの除外を申請する事まだできないが将来的には対応予定
・LAIONデータセットの品質評価には人工知能が使われたがその性能は?
2.LAION-AIのaesthetic predictorとは?
Stable Diffusionを学習させる際に使われた元データはドイツのLAIONという団体がドイツの法律に基づいてインターネット上から収集したデータです。
LAION 5Bと名付けられたこのデータは58億の画像とテキストの組であり、データが膨大な事から人工知能を使って各画像を1~10でスコア付けしており、ある一定のスコアを得た画像データをサブセットとして抽出し、このサブセットデータがStable Diffusionの学習データとして使われています。
つまり、品質の高い画像を厳選して学習用データに使ってているのでStable Diffusionが生成する画像は品質が高いと言う事ですね。
余談ですが、LAIONは現在はオプトアウト(つまり、自分の描いたイラスト/撮った写真を使わないでください、という使用を拒否する届け出)やオプトイン(逆に自分の描いたイラスト/撮った写真を使って良いよと使用許諾する届け出)を受け付ける仕組みは用意していないそうですが、将来的に用意する計画と言う事なので気になっている方は公式サイトを定期的にチェックしておくと良いと思います。
さて、今回の記事は、この画像をスコア付けする際に使われた人工知能(LAION Aesthetics Predictor V1)が、実際の人間の美的感覚にどの程度マッチしているのかをざっと確かめてみようと言う試みです。
V1と言う部分を見てピンときた方もいるかもしれませんが、そう実はStable Diffusion用の画像を精査する際に使われたのはV1の改良版です。
しかし、改良版が出ている事に私が気づいてなかった且つ、今回評価して貰ったデータは本サイトの記事やアイキャッチ画像等の作成時に出来た派生画像+新たに作成中の+α画像なので、内容的には統一感なくごっちゃです。
いずれ、改良版+統計的なデータが取れそうな画像群で再テストしてみるつもりですが、今回はどういう画像が人工知能にとって評価が高くなり、逆に低くなりそうなのかをざっと俯瞰する感じでお読みください。
人工知能による評価が高かった画像
それでは、以下、2600超の画像群の中のトップ10の発表です。
なお、上位4画像のみがスコア8を超えたエリート画像です。
一位
お、悪くないですね。これはシードを試した「stable diffusionに同じ絵を描いて貰うためにはどうすれば良いか?」のアイキャッチ画像の一部にも採用している画像で、私も良い絵だと思いました。
二位
うーん、顔がちょっと崩れてしまってますが、それ以外の部分はかなり鮮明に映ってますよね。また、イラストだけでなくリアル系画像がちゃんと高評価できているところはグッドですね。
三位
うん、これは人工知能に風の谷のナウシカを描いて貰うシリーズの中でサイバーパンク的な雰囲気のプロンプトを試したときの画像ですね。良い絵ですがナウシカ感があまりないのでプロンプトそのものを没にしましたが、画像としては記憶に残っているので悪くはないです。
四位
えぇ~、これはインペインティングを試したStable Diffusionを使ってシシ神様をトトロに差し替えるの中で生成された何十もの差し替え画像のうちの1つですが、何故、これだけ点数8点代を取得できたんでしょう?背景部分が綺麗に出来ているからですかね?
五位
あ、これもナウシカを描いて貰うシリーズの中で出来た画像で記憶には残ってます。良い絵ですが腕の先端部分がおかしくなってたので没にしました。
六位
油絵チックな絵もちゃんと良くかけている画像は高評価できてますね。悪くない。
七位
リアル肖像画系。ジャスティン・ビーバー?タイタニックの頃のレオナルド・ディカプリオ?良いと思います。
八位
これもシードを試した際に注目した絵なので悪くない絵柄ですが、この絵柄シリーズはもうちょっと良い絵もあったような
九位
お、これもシードを試した際に注目した絵でアイキャッチ画像の一部にも採用している画像ですね。私と意見が一致してますね。
十位
うーん、インペインティングを試した際の没画像ですね。崩れてしまっているし、もっと良い絵はありそうですが、ポンポコは元絵の色彩が鮮やかだからか、他の差し替え絵も上位に来ているのが多かったです。
人工知能による評価が低かった画像
逆に、スコアが低かった絵を3点ほど
ビリ
え~、そんなに悪くはないカワイイ絵と思うのですが、文字が映りこんでいる画像は全体的に評価が低くなる傾向がありました。
ブービー
まぁ、全体的に崩れているので確かにスコアが低くてもおかしくはない
ブービー+1
うーん、これはそんなに低スコアでなくてもよさそうですが、たぶん、これは色ですね。色数が少ない画像も全体的にスコアが低くなっていそうでした。
まとめ
疑問を感じる評価も多少は混在してますが、V1でこれは悪くないかな、と思いました。引き続き、システマチックに大量データを作成した上で改良版が採点するスコアがどのようなものかを評価してみようと思っています。
3.人工知能に描いて貰ったイラストを人工知能に採点してもらう関連リンク
1)laion.ai
Large-scale Artificial Intelligence Open Network
2)github.com
LAION-Aesthetics V1