Leonardo.Aiで猫の画像を生成するとわりと高確率で尻尾がおかしくなっている。こういうのはネガティブプロンプトを入れてコントロールするんだろうな、と。まだ使ったことないけど。
だいたいどんな言葉を入れればいいのかわからない。でちょっと記事を探してリンクしたり、Community Feedにある画像を見せてもらってメモったりしてる、ネガティブプロンプトのメモ記事です。
ネガティブプロンプトについての記事
とにかくわからないので詳しく解説されてる記事を。MidjourneyもStable Diffusionも区別なくあげてみました。Leonardo.AiはStable Diffusionベースみたいなので、Stable Diffusion用も参考になるんじゃないかと思います。
どんな目的でネガティブプロンプトを使うのかや、基本的なネガティブプロンプトはこの3記事で学べます。
あと、ChatGPTにきいてみることもできそう。
猫の絵について
ネガティブプロンプトの「bad anatomy」は人体のみに使われますか?動物や猫の場合は?
“Bad anatomy”(悪い解剖学)というフレーズは、通常、人体の不正確または不自然な描写を指しますが、動物の体の描写に関しても同様に使われることがあります。ただし、より具体的に動物の解剖学的な誤りを指摘したい場合は、”bad animal anatomy”や”incorrect animal anatomy”といった表現を使うことができます。
猫の場合は、”bad cat anatomy”や”incorrect cat anatomy”というように種を指定することで、どのような解剖学的な誤りがあるかを明確にすることが可能です。これらの表現は、特にアートの批評や指導、またはAIによる画像生成の際のネガティブプロンプトとして使用されます。
でもさー。
本当にネガティブプロンプトに書くだけで直るの?
それってAIが不正確や不自然な描写がわかるってことでしょ?
だったら最初に画像生成するときに正確に描くはずじゃないの??
もしかして適当に出力してる?
と思いませんか。私は思いますよ。ネガティブプロンプトにちょっと書くだけで直るなら最初からそうしてるはずじゃないのって。
その証拠に(?)PhotoRealはネガティブプロンプト不要モデルですよ!!
ネガティブプロンプトを試してみた
何事もやってみなければわからん、てことで試してみました。
汎用として使えるモデルはたぶんプルダウンメニューにいつも入ってるやつで、その中で形が崩れがちなのは8つ。3D Animation Style、DreamShaper v7、Absolute Reality v1.6、Anime Pastel Dream、Deliberate 1.1、Leonardo Select、Leonardo Creative、Leonardo Signature。(SDXL 0.9は現在ベータ版ということで除外してます。)
これでネガティブプロンプトありなしで4枚ずつ画像を生成して比べてみました。
プロンプトは夕日を見つめる三毛猫、「a sleek calico cat sitting on a windowsill, watching the sunset」です。
ネガティブプロンプト1回目は「bad anatomy, bad animal anatomy, incorrect animal anatomy, bad cat anatomy, incorrect cat anatomy」。さっき教えてもらったやつ全部ですよ。同じことを5回言ってるようなもんです。結果として犬っぽくなったり、あまり効果がなかったりしました。
ネガティブプロンプト2回目は「bad animal anatomy」のみ。cat anatomyのcatに反応して猫っぽくなくなったやつがいるんじゃないか?と思ったからです。あと同じことを何度も入れると混乱するのかな、とも。
3D Animation Style
DreamShaper v7
Absolute Reality v1.6
Anime Pastel Dream
Deliberate 1.1
Leonardo Select
Leonardo Creative
Leonardo Signature
ネガティブプロンプトをいっぱい入れてみた
Community Feedにある画像を見ると、ネガティブプロンプトがいっぱい書いてあるものが見つかります。その画像はたしかに形が正確です(安定モデル使用ではありましたが)。いっぱい書けばさっきのあいつらも直るんだろうか。
ちょっと参考にさせていただいて、不要なものを消して、探しやすいように並べ替えて、ってやってみました。画像は動物だったんですが、animalとかが入っていないんですね。
これを入れてもう一回、画像生成してみますよ。
bad anatomy, bad eyes, bad proportions, blind, crossed eyes, dead eyes, Deformed belly, deformed, disconnected limbs, disfigured, double body, double face, double features, extra fingers, extra limb, extra limbs, floating limbs, incorrect posture, long body, long fingers, long neck, malformed hands, missing limb, mutation, mutated, mutated hands, mutated hands and fingers, mutated legs, no head, out of focus, poorly drawn face, poorly drawn hands, poorly-drawn face, two faces, two heads, too many fingers, ugly, ugly eyes
日本語訳:不自然な体格、悪い目、不自然なプロポーション、盲目、斜視、無表情な目、変形した腹、変形、切り離された手足、変形、二重の体、二重の顔、二重の特徴、余分な指、余分な手足、余分な手足、浮遊する手足、不正確な姿勢、長い体、長い指、長い首、不自然な手、欠けた手足、突然変異、変異した、変異した手、変異した手と指、変異した足、頭なし、ピントが合っていない、下手に描かれた顔、下手に描かれた手、下手に描かれた顔、二つの顔、二つの頭、指が多すぎる、醜い、醜い目
では、いざ!
3D Animation Style
DreamShaper v7
Absolute Reality v1.6
Anime Pastel Dream
Deliberate 1.1
Leonardo Select
Leonardo Creative
Leonardo Signature
安定のモデルにも入れてみた
さっきの大量のネガティブプロンプトを、安定モデルにも入れてみました。時々しっぽが変になることがあったけど、改善されているみたいですね。しっぽ見えない構図になってるのとかありますけど。
ここで気づいたんですが、Diffusion XLだけ長毛。
うーん、4枚全部しっぽが見えていて、イラスト調も混ぜてくれてるVision XLが好感度高いです。猫そのものはAlbedoBase XLのが可愛い気がしますが。w
あ、安定モデルならプロンプトひとつでもいけるかもしれなかったなー。今度試そう。
Leonardo Vision XL
Leonardo Diffusion XL
AlbedoBase XL
まとめ
今回、猫だけで試したのであまり参考にならないかもしれませんが、動物を描くなら安定のモデルがいいのかなーという結果になりました。
もしかして私のネガティブプロンプトがよくない可能性もありますが、テストした8つのモデルはあまり動物が得意じゃないかもという気がします。人物は違うのかもしれません。描く対象物によって得手不得手が(学習量の違い?)あるのかも。
※人物でも試してみました。【Leonardo.Ai】夕日を見つめるgirlたち
ネガティブにも普通のプロンプトにも言えると思うのですが、Alchemyで選べるStyleとか、Add Elementsとか、Image Guidanceとか、こういうもので画風はかなり調整できそうなのでプロンプトは少なくてOKになっていきそうですね。
安定モデル+画風は自身で調整、という方向に向かっているように思えます。
使い始めて二週間ですが、勝手な感想です。(^^)
コメント