モデルの比較はネット上に色々記事が上がっていますが、たいていは若くてきれいな女性の画像ですね。それも嫌いではないけど、私の心は若い女性を求めていない。
モデル比較をするなら、私が描きたいと思っていた絵に向いてるモデルはどれなのかっていうのを探りたい。で、「水彩、猫、夕日」を含めたプロンプトを用意しました。そして各モデルで作った画像を載せていきます。ただそれだけの記事です。
- プロンプト
- 各モデルの生成画像
- PhotoReal
- Leonardo Vision XL
- Leonardo Diffusion XL
- AlbedoBase XL
- RPG v5
- SDXL 0.9
- 3D Animation Style
- DreamShaper v7
- Absolute Reality v1.6
- Anime Pastel Dream
- DreamShaper v6
- DreamShaper v5
- Leonardo Diffusion
- RPG 4.0
- Deliberate 1.1
- Vintage Style Photography
- DreamShaper 3.2
- Leonardo Select
- Leonardo Creative
- Battle Axes
- Pixel Art
- Magic Items
- Chest Armor
- Crystal Deposits
- Magic Potions
- Character Portraits
- Isometric Scifi Buildings
- Spirit Creatures
- Shields
- Isometric Fantasy
- Cute Animal Characters
- Amulets
- Christmas Stickers
- Cute Characters
- Crystal Deposits Alternate
- Isometric Asteroid Tiles
- Leonardo Signature
- Alchemy V2(Leonardo Diffusion XL で試してみた)
- Communityから気になるモデル
プロンプト
プロンプトはこちら。ChatGPTに作ってもらった画像のプロンプトです。
watercolor painting of a sleek calico cat sitting on a windowsill, watching the sunset, its silhouette contrasting against the warm orange and pink hues of the sky
窓辺に座って夕日を見つめる滑らかな毛並みの三毛猫の水彩画。そのシルエットは、空の暖かなオレンジとピンクの色合いと対照をなしています。(ChatGPT訳)
ちなみにChatGPT(DALL-E3)の画像です。
「かわいい猫の絵を作ってください。」→ 4枚生成 →「3枚目の夕日と猫がすてきです。三毛猫に変えてみてくれますか?」 → この一枚が生成されました。
各モデルの生成画像
2023年10月23日現在の Platform Models の簡単な説明と生成画像のサンプルです。
1モデルに2種類、4枚ずつ生成してみました。(PhotoReal除く)
- Prompt Magic不使用、モデルの指示通りにプロンプト追加
- Prompt Magic使用(High Contrast ON、Prompt Strength 0.4)、モデルの指示通りにプロンプト追加
Prompt Magicの「?」にマウスオーバーで出る説明文をChatGPTに日本語訳してもらいました。
私たちのカスタムレンダリングパイプラインは、より高いプロンプトの遵守、高品質な画像忠実度を持ち、選択されたモデルでの出力を向上させることができます。これは高いGPUのオーバーヘッドのためトークンコストが増加します。
Prompt Magicはプロンプトをより強く反映させたいときに、0.1から0.8の間で設定します。
一部のモデルは Instance Prompt を指定しています。プロンプトに含めることでモデルが効力を発揮します。
このモデルが訓練されたデータセットとのスタイリスティックな一貫性をより良くするために、プロンプト内にインスタンスプロンプトを取り入れることを強くおすすめします。
Instance Prompt に加え、モデルの説明に追加を推奨するプロンプトとネガティブプロンプトがある場合は追加しています。
もう一つ、Styleが選べる(Leonardo Style か None)のですが、気をつけていなかったので統一していません。Noneしか選べないモデルもあります。
画像生成AIは人物や動物の構造を正しく出力するのが苦手らしく、尻尾や耳などがありえない感じになっていたりします。これはネガティブプロンプトやAIキャンバスなどを使って直していくことになります。
そもそも盾や斧を作るモデルに無理なプロンプトを提示してるので、参考になりにくい結果も見られますね。^^;
PhotoReal
Leonardo PhotoRealは、私たちの最新の革新的な技術で、超リアルな写真や人物の肖像を生成するための強力なパイプラインです。
Leonardo Vision XL
写真撮影とリアリズムの両方で優れている多目的なモデル。プロンプトを長くすることで、より良い結果が得られます。
Leonardo Diffusion XL
Leonardoモデルの次のフェーズ。短いプロンプトでも驚くべき出力が得られます。
AlbedoBase XL
CGのアーティスティックな出力に向かう優れた汎用モデル。alebdobondによる。
RPG v5
Anashelが再び素晴らしいモデルで戻ってきました。すべての種類のRPGキャラクターを専門としています。
SDXL 0.9
最新のStable Diffusionモデル。現在ベータ版です。
3D Animation Style
3Dの映画の雰囲気が得意で、色鮮やかな複雑なシーンが可能。ストーリーボードの時間です!
DreamShaper v7
Lykonが再びアップデートと共に戻ってきました。このモデルはさまざまなスタイルでの作成が得意です。
Absolute Reality v1.6
Lykonからのフォトリアリスティックなスタイルのモデル。あらゆる種類のフォトリアリズムが得意です。
Anime Pastel Dream
パステルのアニメスタイリング。PMv3とアニメのプリセットを使用して、信じられないほどの範囲を得る。Lykonによるモデル。
DreamShaper v6
非常に汎用性の高いモデルの新しいアップデート。人々と環境の両方で優れています。Lykonによる。
DreamShaper v5
フォトリアリズムとアニメの両方で優れている汎用モデル。ノイズオフセットトレーニングを含む。Lykonによる。
Leonardo Diffusion
驚異的なシェーディングとコントラストを持つモデル。写真とアーティスティックなスタイルの両方で優れています。cac0eによる。
RPG 4.0
このモデルは、RPGキャラクターの肖像を作成するのに最も適しており、高度なフォトリアルズムを持っています。Anashelによって作成されました。
Deliberate 1.1
XpucTによって作成された強力なモデル。フォトリアリズムとアーティスティックな作品の両方に適しています。
Vintage Style Photography
Instance Prompt:vintage style
このモデルは、フィルムカメラから撮影されたかのようなヴィンテージスタイルの幅広いイメージを生成することができます。
DreamShaper 3.2
このモデルはLykonによるもので、さまざまな肖像スタイルやアーティスティックな背景での作成が得意です。
Leonardo Select
SD2.1の強力なファインチューニング。高度なリアリズムを達成することができます。
Leonardo Creative
SD 2.1の別のファインチューニング。もう少しクリエイティブな解釈をミックスに加えます。
Battle Axes
Instance Prompt:Axe
このモデルを使用して、中世の戦闘斧から現代の伐採斧まで、さまざまな詳細な斧のデザインを生成します。
Pixel Art
Instance Prompt:pixel art
ヘッドショットでトレーニングされたピクセルアートモデル。しかし、あらゆる種類の主題で驚くほど柔軟です。
Magic Items
Instance Prompt:an item
武器、盾、ブーツ、本など、さまざまな魔法のアイテムを作成する。非常に汎用性があります。
Chest Armor
Instance Prompt:chest armor
このモデルで幅広いテーマでさまざまな胸の鎧を作成します。
Crystal Deposits
Instance Prompt:a crystal
クリスタルの堆積物を作成するためのモデル。アイテムや等角投影の環境として使用するのに適しています。
Magic Potions
Instance Prompt:a magic potion
半リアルな魔法の薬を作成するのに優れたモデル。プロンプトに “intricately detailed, 3d vray render” と追加して試してみてください。
Character Portraits
Instance Prompt:character portrait
一貫したスタイルでさまざまなクラスの素晴らしいRPGキャラクターを作成するためのモデル。
Isometric Scifi Buildings
Instance Prompt:isometric scifi
さまざまなテーマのSFの建物を作成するのが得意。プロンプトに “isometric” と追加して、等角投影のビューを確実にします。”3d vray render” も生成をよく誘導します。
Spirit Creatures
Instance Prompt:a creature
幻想的な妖精のような存在から神話のクリーチャーまで、ユニークでかわいらしいスピリットキャラクターを作成します。
Shields
Instance Prompt:a shield
さまざまな材料の種類を持つ印象的に変化に富んだ詳細な盾のデザインを作成します。
Isometric Fantasy
Instance Prompt:isometric fantasy
さまざまな等角投影のファンタジー環境を作成します。 “3d vray render, isometric” と追加して、6のガイダンススケールを使用してください。ネガティブプロンプトとして、”unclear, harsh, oversaturated, soft, blurry” と試してみてください。
Cute Animal Characters
Instance Prompt:a character
愛らしい動物キャラクターを作成するのに最適 – 愛らしい、遊び心のあるデザイン。
Amulets
Instance Prompt:an amulet
ユニークで複雑な護符、宝石、その他を作成します。プロンプトの用語を増やして、興味深い方向に誘導してみてください。
Christmas Stickers
Instance Prompt:a sticker
このモデルで、クリスマスのステッカーを楽しく作成します。かわいらしくてカラフルなものから、伝統的でエレガントなものまで。
Cute Characters
Instance Prompt:a character
かわいくて魅力的なゲームキャラクターを作成するのに最適。最良の結果を得るために、プロンプトに “character” という言葉を含めることを確認してください。
Crystal Deposits Alternate
Instance Prompt:1@t crystal
その創作物でややリアルな感じを持つ別のクリスタルの堆積物モデル。プロンプトに “object” と “3d vray render” を使用してみてください。
Isometric Asteroid Tiles
Instance Prompt:1@t isometric asteroid
等角投影の小惑星の環境タイルを作成するモデル。プロンプトに “3d vray render, unreal engine, beautiful, intricately detailed, trending on artstation, 8k” を追加してみてください。
※等角投影の繰り返し使えるパターンやブロックのことだそうです。2Dゲーム画面で使われるような?
Leonardo Signature
Leonardoプラットフォームのコアモデル。非常に強力で多様なファインチューニングが施されており、幅広い用途で非常に効果的です。
Stable Diffusion1.5
プルダウンメニューには入っているのにモデル一覧には出てこないやつ。たぶんオープンソースのやつですね。
そしてこの1.5と次の2.1は、モデルトレーニング機能で使うものなのだそうです。モデルの土台部分ですね。これに画像を学習させて自分のカスタムモデルを作ることができるそうです。
Stable Diffusion2.1
これもプルダウンメニューにしか出てこないやつ。モデルトレーニング機能で使う2.1ですね。
Alchemy V2(Leonardo Diffusion XL で試してみた)
Alchemy V2のプリセットも試してみました。左メニューのAlchemyをオンにして、プロンプト入力欄下の style選択プルダウンメニューから選びます。Alchemyがオフのときは、Leonardo Style か Noneしか選べません。新規の無料ユーザーは一日5回だけAlchemyが使えるので、3日くらいかかって試してます(笑)
……と思ったら、試用期間終わってしまったー!一週間だったのかな。10/29まで?
あなたの「Leonardo Alchemy」の試用期間が終了しました!
今すぐアップグレードして、優れた画像品質、精度、忠実度を引き続き活用しましょう!
✓PhotoReal – 超現実的な写真や生き生きとした肖像を生成
✓Prompt Magic V3 – より高い適合性と忠実度
✓Alchemy Pipeline – 高忠実度の生成と一貫性
✓Alchemy Presets – より短いプロンプトを可能にする強力なプリセット
Alchemyの力を最大限に活用しましょう
・Apprentice、Artisan、またはMaestroのプランのいずれかにアップグレードすることで、即座にAlchemyを使用し続けることができます
・無制限の高品質なAlchemyの生成とアップスケール
・Alchemyのその他のすべての利点を楽しむ
11/4にアップグレードしました、、、
Style比較に使ったモデルは Leonardo Diffusion XL(短いプロンプトでも驚くべき出力が得られます)です。
各Styleで言葉の意味がわからないもの、ピンとこないものをChatGPTにきいてみたので添えています。(アートの文脈でこの言葉はこう使われる事が多いです、っていう感じです。Leonardo Ai の機能解説ではありません)
種類は2023.10.28現在のものです。画材や色を指定しないでモデル比較もやってます。
Anime(アニメ)
Cinematic(シネマティック)
Creative(クリエイティブ)
Dynamic(ダイナミック)
アートや絵において「ダイナミック」とは、動きやエネルギーが感じられるスタイルを指すことが多いです。強いコントラスト、流れるような線、活発な色使いなど、視覚的にエネルギッシュな印象を受けるような作品にこのスタイルが当てはまります。
Environment(環境)
環境というスタイルは、自然や都市などの背景や風景を中心としたアートを指す可能性が高いです。これは森、山、海、建物、街並みなどの風景を表現する作品に特有のスタイルといえます。
General(一般)
アートや絵のスタイルとしての「一般」は、特定の特徴やテーマに縛られない、幅広いスタイルを指す可能性があります。つまり、何も特定のスタイルや技法にこだわらない、普遍的な作品を指す場合が多いでしょう。
Illustration(イラストレーション)
Photography(写真)
Raytraced(レイトレース)
概要: コンピュータグラフィックスの技術の一つで、光線を追跡して物体や環境との相互作用をシミュレートすることで、リアルな影や反射、屈折などの効果を再現する方法です。特に高品質な映像を作成する際に利用されます。
3D Render(3Dレンダリング)
Sketch B/W(スケッチ 白黒)
Sketch Color(スケッチ カラー)
Vibrant(バイブラント)
概要: 鮮やかな、活気のある、元気な、といった意味を持つ形容詞です。色彩が鮮明で魅力的であること、または活動やエネルギーが豊かであることを指すことが多いです。
None(なし)
Communityから気になるモデル
Community Models からも気になるモデルを試してみました。Prompt Magic使用(ON、0.4)と不使用で4枚ずつ。
Watercolor Childrens Paintings
Instance Prompt:A ilustration
このモデルを使用すると、水彩の子供の絵のスタイルで画像を生成することができます。
Illustration
Instance Prompt:Illustration
イラストレーション
続きはまた。
コメント
写実的(絵画的、写真に近い)、イラスト風、絵本風……
こんなにバラエティー豊かに描けるものなんですね。
その内、検索の言葉次第でもっと自由が利くようになるのかしらん?
ただ、人間の言葉の受け取り方が多様なように、AIも戸惑っている気がします。
例えば、「夢見る猫」といった曖昧な表現が、どう分析されて具体的な形を与えられるのか。
受け持った人の解釈に委ねられる部分が大きいので、万人が受け入れられる形に昇華するには取捨選択と想像が必要です。
全てを網羅する表現はありえない以上、多様化が見込まれ、その分、人間が生き延びる可能性が残されると思うのですが。
機械に任せる部分が大きくなるだけ人間の生き残る場所は狭まりますので、人にしかできない領域を探し出さないと、ゆくゆくは淘汰されることになりかねません……ブルブル……
コメントありがとうございます。
2ヶ月使ってみての感想ですが、新しい画材として付き合っていくといいのかなと思っています。
こういうふうに言葉を入れて、このモデルを使って、たくさん生成した中で良いものがあればそのシード値を使って(同じような計算をしてもらうことができる)さらに生成して、仕上げは自分で少し加工を加えたり、っていう「今までにない特殊な使い方の画材」だととらえています。
まずは自分の中にイメージがあることが大事で、それをどう伝えればそれに近いものが生成できるかっていう試行錯誤に時間がかかりそうです。自分のイメージ以上の素晴らしい世界を見せられてびっくりすることもあります(笑
AIで画像生成するには具体的な情報を与えるのがベストらしいので、夢見る猫を絵にすると具体的には何がどんなふうに描かれているのかを伝えてあげる必要があるのだそうです。
夢見る猫はどんな絵になるかな?と楽しむのももちろんいいんですけど。
あとね、この生成はアイデア出しに使うっていうことも考えられます。AIで膨大なアイデア出しができるので、それをもとに自身のタッチで描き起こすのもいいですよね。
近い将来、人間の仕事や生活は想像以上に変化するかもしれませんが、それなりにうまくやっていけるんじゃないかな?と私は思っています。