正確には画像生成をするのはDALL-E3なのだけど、ChatGPTの有料プランからシームレスな感じで使えます。ChatGPTに「こういう絵を描いて」って文章を入力すると、描かれた絵が表示されます。
AIで画像生成ができることにあらためて感動
きっかけ
前記事でまよいサイトまたリニューアルだわーとぼやき、そのまよいサイトの新しいヘッダーに使う画像を探そうとして、ふと思い出したんですよ。そういえばChatGPTで画像生成できるみたいなことをウェブで見かけたなーと。
画像が必要なときはだいたいUnsplashとかCanvaとかいらすとやとか、無料で使える画像を置いてるサイトにお世話になります。ただ、けっこう時間かけて探してもいいのがみつからないとか、Canvaだといいのは有料で使えないとか(無料プランなので)、結局妥協することも多いです。
試してみた結果(生成された画像)
それならせっかくChatGPTの有料プラン使ってるんだからそこで画像作ればいいよねってことで、作ってもらいました。「青空に雲が少し浮かんでいて、やわらかい平和な雰囲気。サイトのヘッダーに使いたいので横長で。水彩風のラフなタッチ。」と入力。結果を見て、追加の注文を入力したら、こんな感じでできました。
小さいのでわかりにくいですが、画像をクリックすると画像の詳細と使われたプロンプトを見ることができます。
じつはこれ、一回目の画像が出た後に「鉛筆の線が少し残っていてもっとラフな、宮崎駿の水彩のような感じでお願いできますか?」と入力したんです。そうしたら、宮崎駿の~というところは古典的なアニメーションの手描きのような雰囲気と解釈されたみたいですね。
ChatGPTの場合は著作権的にダメな注文を入れても「それはできません」と返されるそうです。
プロンプトはChatGPTが英訳してDALL-E3に伝えているんですが、たまにここが日本語のままになっていることがあり、そのときは指示がちゃんと伝わっていなかったりします。そのときは再度ChatGPTに「プロンプトを英訳して」って入力すれば解決します。
参考としてこの絵4枚のプロンプトと日本語訳(共にChatGPT)を載せておきます。
私のおおざっぱな発注から、こんなすてきな水彩画を作ってくれるなんて、単純に、うれしい。
どんな情報があれば絵を作りやすいですか?
絵を生成する際には、以下の詳細な情報があると作成がスムーズに進みます:
- 主題や内容: 何についての絵を生成したいのか具体的に説明してください。
- スタイル: アートのスタイルや技法(例:水彩、油絵、アニメ風、リアルな描写など)を指定してください。
- 色: 特定の色を使用したい場合や、色の雰囲気(例:暖かい、冷たい、明るい、暗いなど)を指定してください。
- 配置: 画像内のオブジェクトや要素の配置や位置関係に関する指示がある場合は、それを明示してください。
- 背景: 背景の詳細や、背景を含めたいか含めたくないかを指定してください。
- サイズと形状: 絵のアスペクト比や形状を指定することができます(例:正方形、横長、縦長など)。
- 感情や雰囲気: 画像が持つべき雰囲気や感情を説明してください(例:平和的、活気ある、悲しいなど)。
- 特定の要素: 絵に含めたい特定の要素やディテールがあれば、それを指定してください。
これらの情報が詳細に提供されると、より希望に近い画像を生成することができます。ただし、すべての情報を提供する必要はありません。ご希望の内容やスタイルに応じて、必要な情報を選んでください。
DALL-E3へのプロンプト、ルールとコツをきいてみた
DALL·Eにプロンプトを伝える際のルールやコツを以下にまとめました:
- 詳細な説明: DALL·Eは詳細な説明を好みます。具体的なシーンやアイテム、色、雰囲気などを具体的に記述すると、より期待通りの画像が生成されやすくなります。
- 画像のタイプの指定: 描画、写真、イラスト、カートゥーンなど、生成したい画像のタイプを指定すると良いでしょう。
- 多様性の確保: 人物を描写する際は、性別や出身地を明示的に記述することで、多様性のある画像を得られます。
- 公的な人物や特定の有名人の描写は避ける: 政治家や著名な公的人物の直接的な描写は避けるようにしましょう。
- 最近のアーティストのスタイルの参照を避ける: 最後の作品が100年以内に作成されたアーティスト(例: ピカソ、カーロ)のスタイルを直接参照するのは避け、代わりにアーティストの特徴を三つの形容詞や主要なアートムーブメント、使用された主要な媒体で説明すると良いでしょう。
- バイアスの排除: 特定の職業やシーンに関連する人物の描写にバイアスが生じないように注意しましょう。
- 複数のプロンプト: 複数のプロンプトを提供することで、異なるアプローチや視点からの画像を得ることができます。
これらのガイドラインを参考にして、DALL·Eにプロンプトを提供する際の品質や期待通りの結果を向上させることができます。
画像をどこに使うか
この画像はサイトのヘッダーに使おうとして作ってもらったものですが、画像ですから使い道は色々ありますよね。
その中でちょっと意外だったのは、ストックイラストで販売できるということでした。知識として知ってはいたんですが、実際にこのような画像が生成できて、それをストックイラストに登録していいんだという現実が自分ごとになって「これはすごい」って実感がわいてきました。
(あれ、これだともう画像を登録したみたいに聞こえますね^^;、もちろんこれからしますけど、これ書いてる時点ではまだ何もしてません。)
2020年に仕事をやめたあと、10ヶ月くらいストックイラストにせっせと投稿していた時期があったんですが、売れなくてアドビの費用すら回収できず、投稿をやめました。2021年11月にそれまで売れた分のお金を引き出して、そのまま放置していました。で先日久々にログインしてみたら、2年間分の売上が134ドルたまっていました。日本円に換算すると2万円。えっびっくり!(゚∀゚)
だったら今からでももっと画像を投稿しておけば、数年後にはまたお金が引き出せるじゃないですか!
解約したPayPalのアカウントまた作らなきゃ。^^;
参考までにAdobe Stockのリンクを。
PIXTAも可能なようです。
登録できるJPEG画像サイズですが、PIXTAは縦横の合計が 1301px 以上。Adobe Stockは最小解像度4MP(例:2000×2000 px)です。
ChatGPT(DALL-E3)では生成画像が 1792x1024px程度の大きさらしいので、PIXTAなら登録可能です。他の画像生成AIでは生成した画像のサイズ変更も可能(↓のLeonardo.Aiなど)なのでAdobe Stockにもいけると思います。
画像生成AIはたくさんある
ChatGPTから使えるDALL-E3の他にも、使ってみたいなと思うのは「Midjourney」「Leonardo.Ai」です。こちらの記事がわかりやすいです。
このブログのオーナーさんはいろんな画像生成AIを使い倒してお仕事をしていらっしゃるそうで、これの他にも解説記事が豊富です。学びの多いサイトです。
さてさて、正直なことを言えば「Midjourney」は有料でちょっとお財布が痛いので、まずは無料の「Leonardo.Ai」を使ってみようと思います。
画像生成AIは、夢のような画材です
私のような、絵に憧れを持っているんだけど自分で描けない、描けるようになるための努力ができないという人間には、画像生成AIは究極の画材だと思います。
この画材を使うためには、的確なプロンプトを作るための勉強が必要です。
いろんなジャンルの絵を生成したければ、美術史や絵の技法などたくさん勉強が必要だと思います。でもそれくらいなら頑張れると思います。本当に「描くこと」が好きでなければできないであろう、紙と鉛筆のスケッチで目と手と脳を育て続ける訓練が苦痛な私でも、プロンプトのための勉強と実験ならできそうな気がします。
私が「いつかこんな絵を描きたい」と思っていた想像の世界、画像生成AIを使えば作れるかもしれないんですから。
なんか、世界が違って見えてきました。w
猫のイラストも生成してもらいました
せっかくなので最後に、過去3つの記事につけたアイキャッチの猫の画像(これもさっき生成してもらいました)も、プロンプトとともに載せておきます。かわいい。
ではまた~
コメント