ななぶろ

-お役立ち情報を気楽に紹介するブログ-

AIに「描いて」とお願いする魔法の言葉:プロンプトとパラメータで理想の画像を生成する方法

www.amazon.co.jp

AIに「描いて」とお願いする魔法の言葉:プロンプトとパラメータで理想の画像を生成する方法

はじめに

「頭の中にはっきりとしたイメージがあるのに、絵に描けない…」そんな悩み、ありませんか?

もし、あなたが思い描くアニメキャラクター、息をのむような風景、あるいはオリジナルのキャラクターを、AIが一瞬であなたの目の前に具現化できるとしたら、どうでしょう?

まるで魔法のようですが、これらは生成AI(Generative AI)を使えば、誰でも簡単に実現できる時代になりました。特に「Stable Diffusion」のような画像生成AIは、あなたの言葉を読み解き、唯一無二のビジュアルアートを生み出してくれます。

「でも、AIに絵を描かせるってどうやるの?」「なぜか思った通りの絵にならないんだけど…」そう感じている方もいるかもしれません。

この記事では、そんなあなたの疑問を解決します。生成AIにあなたのイメージを正確に伝えるための「プロンプト(呪文)」と、画像をコントロールするための「パラメータ」について、初心者の方でもすぐに実践できるよう、徹底的に解説していきます。

さあ、AIとともにあなたの創造性を解き放ち、狙い通りの画像を一緒に作り出しましょう!

1. プロンプトの基本と書き方

生成AIにおいて、最も重要なのが「プロンプト」です。これはAIに対する「指示書」や「呪文」のようなもので、あなたがどんな画像を生成したいかをAIに伝えるための言葉になります。

プロンプトは大きく分けて、ポジティブプロンプトとネガティブプロンプトの2種類があります。

ポジティブプロンプト:「描いてほしいもの」を伝える言葉

AIに生成してほしい要素を具体的に記述します。キーワードを「,」(カンマ)で区切って並べるのが一般的です。

💡 ポイント1:具体的に、詳細に描写する

漠然とした言葉より、具体的な言葉の方がAIはイメージを正確に捉えます。

悪い例: cat 良い例: a fluffy ginger cat, sitting on a sunlit windowsill, looking outside, cozy atmosphere (ふさふさした茶トラの猫、日当たりの良い窓辺に座って、外を見ている、居心地の良い雰囲気)

💡 ポイント2:画質やクオリティを上げる「魔法のキーワード」

画像をより高品質にするための汎用的なキーワードがあります。これらは必ず含めるようにしましょう。

masterpiece(傑作) best quality(最高品質) ultra detailed(超詳細) 8k(8K解像度) photorealistic(写真のようにリアルな) - 特に実写系の場合 sharp focus(シャープな焦点) beautifully lit(美しく照らされた) cinematic lighting(映画のような照明)

💡 ポイント3:画風やスタイルを指定する

AIにどんな絵柄で描いてほしいかを伝えることもできます。

anime style(アニメ風) watercolor painting(水彩画) oil painting(油絵) pixel art(ピクセルアート) Studio Ghibli style(スタジオジブリ風) Makoto Shinkai style(新海誠風)

ネガティブプロンプト:「描きたくないもの」を伝える言葉

AIに生成してほしくない、排除したい要素を記述します。これにより、画像の品質低下や不自然な描写を防ぐことができます。

low quality(低品質) bad quality(悪い品質) worst quality(最低品質) blurry(ぼやけた) fuzzy(不明瞭な) pixelated(ピクセル化した) jpeg artifacts(JPEGのノイズ) bad anatomy(解剖学的に誤り) - 特に人物や動物を生成する場合に重要 extra limbs(余分な手足) deformed(変形した) text(テキスト) watermark(透かし)

2. 主要パラメータの役割と設定のコツ

プロンプトでAIに指示を出したら、次に重要なのが「パラメータ」の調整です。これらは画像を生成する際の様々な要素をコントロールする「調整ツマミ」のようなものです。

① Sampler(サンプラー)

画像を生成する際の「計算方法」を決めるものです。これによって画像の画風や生成速度が変わることがあります。

推奨設定: DPM++ SDE Karras または DPM++ 2M SDE Karras

多くのモデルで安定した高品質な結果が得られやすいサンプラーです。

② Steps(ステップ数)

画像を生成する際の「反復回数」です。AIが画像をどれだけ詳しく、時間をかけて生成するかを決定します。

推奨設定: 20〜30

少なすぎると画像が粗く、多すぎるとかえって不自然になったり、無駄に時間がかかったりすることがあります。この範囲がバランスが良いです。

③ CFG scale(プロンプトの忠実度)

AIがプロンプトにどれだけ「忠実」に画像を生成するかを決めます。

推奨設定: 5〜7

値が低い(例: 3以下): AIの自由度が高くなり、プロンプトから離れた画像が生成されやすくなります。 値が高い(例: 8以上): AIはプロンプトに厳密に従おうとしますが、不自然な画像になったり、ディテールが過剰になったりすることがあります。

④ Resolution(画像サイズ)

生成される画像の基本的な解像度です。

推奨設定: SDXL系のモデル(例: HassakuXL)であれば、1024x1024が基本です。

これより低いと、モデル本来の性能が引き出せず、画像のクオリティが損なわれる可能性が高まります。

PCのVRAM(GPUメモリ)消費に直結するため、VRAMが少ない場合は少し小さめのサイズ(例: 896x1152など)から試しましょう。

⑤ Seed(シード値)

画像の「種」となる数値です。同じプロンプト、同じパラメータ、そして同じシード値を使えば、ほぼ同じ画像が再現されます。

気に入った画像が生成されたら、そのシード値をメモしておきましょう。後で微調整したり、似たような画像を生成したりする際に非常に役立ちます。

  1. さらに高画質へ!「Hires. fix」と詳細パラメータ

「Hires. fix」(ハイレゾ・フィックス)は、まず低解像度で画像を生成し、その後にその画像をベースとして高解像度化する技術です。これにより、VRAM消費を抑えつつ、より高品質な画像を生成できます。

① Denoising strength(ノイズ除去強度)

高解像度化の際に、元の低解像度画像をどれくらい「変更」してアップスケールするかを決めます。

推奨設定: 0.5〜0.7

値が低い(例: 0.3以下): 元の画像の細部を忠実に保ちつつ拡大しますが、ぼやけが残る可能性があります。 値が高い(例: 0.8以上): 元の画像から大きく変化させ、新しいディテールを追加しようとしますが、画像が不自然になったり、まったく別のものになったりする場合があります。

② Hires steps(高解像度ステップ数)

高解像度化の段階で、画像をどれくらいのステップ数で「再構築」するかを決めます。

推奨設定: 10〜30

高すぎると処理時間が長くなり、低すぎるとディテールの追加が不十分になることがあります。Denoising strengthとのバランスが重要です。

③ Upscaler(アップスケーラー)

高解像度化の際に使用する「拡大アルゴリズム」です。画像のタイプに合わせて適切なものを選択しましょう。

R-ESRGAN 4x+ Anime6B:

アニメやイラスト、マンガなど、2Dアートワークに特化しています。線画のシャープさや色の鮮やかさを損なわずにアップスケールするのに優れています。HassakuXLなどアニメ・イラスト系モデルを使う場合は特におすすめ。

R-ESRGAN 4x+:

写真やリアルなCG、写実的なイラストなど、汎用的なアップスケーラーです。自然な質感やシャープなディテールを維持しながら拡大します。Latent (nearest-exact) など:

モデルによっては、より高解像度化に適したものもあります。いくつか試して、最適なものを見つけるのが良いでしょう。

  1. プロンプトとパラメータの実践例:理想の画像を生成してみよう!

それでは、ここまで学んだことを踏まえて、実際に画像を生成してみましょう。今回は、人気のあるアニメ・イラスト系モデル「HassakuXL」を例に挙げます。

プロンプト例:水彩画風の美しい女の子のポートレート

[ポジティブプロンプト] (masterpiece:1.2), best quality, ultra detailed, (watercolor painting:1.3), beautiful young girl, long flowing hair, delicate expression, soft lighting, vibrant colors, paper texture, forest background, looking at viewer, from waist up, natural light, high resolution, 8k

[ネガティブプロンプト] (low quality, bad quality, worst quality:1.4), blurry, fuzzy, pixelated, jpeg artifacts, ugly, poorly drawn, disfigured, malformed, extra limbs, fewer limbs, bad anatomy, text, watermark, photorealistic, realistic, 3d, cgi, render, sharp focus

パラメータ設定例(HassakuXL向け) Sampler: DPM++ SDE Karras Steps: 25 CFG scale: 6 Resolution: 1024x1024 Denoising strength (Hires. fix使用時): 0.6 Hires steps (Hires. fix使用時): 20 Upscaler (Hires. fix使用時): R-ESRGAN 4x+ Anime6B Upscale by (Hires. fix使用時): 1.5 または 2 Clip skip: 2

実施例とプロンプト&パラメータ

Positive Prompt: Japanese temple, 1girl, fox tail, white hair, long hair, animal ears, yellow eyes, parted lips, looking at viewer, sundress, outdoors, night, wind, full body, kimono high-res, best quality:1.2, masterpiece:1.2, ultra detailed:1.2, highly detailed, 4k, fine art, cinematic lighting, dark

Negative prompt: low quality, bad quality, worst quality, blurry, fuzzy, pixelated, ugly, disfigured, malformed, extra limbs, fewer limbs, text, signature, watermark

Settings: Steps: 30, Sampler: DPM++ SDE, Schedule type: Karras, CFG scale: 7, Seed: 3343393831, Size: 1536x1536, Model hash: 847403d47a, Model: hassakuXLIllustrious_v21fix, Clip skip: 2, Version: f1.7.0-v1.10.1RC-latest-2190-g8731f1e9

Positive Prompt: Japanese temple, 1girl, fox tail, white hair, long hair, animal ears, yellow eyes, parted lips, looking at viewer, sundress, outdoors, night, wind, full body, kimono high-res, best quality:1.2, masterpiece:1.2, ultra detailed:1.2, highly detailed, 4k, fine art, cinematic lighting, dark

Negative prompt: low quality, bad quality, worst quality, blurry, fuzzy, pixelated, ugly, disfigured, malformed, extra limbs, fewer limbs, text, signature, watermark

Settings: Steps: 30, Sampler: DPM++ SDE, Schedule type: Karras, CFG scale: 7, Seed: 3343393831, Size: 1024x1024, Model hash: 847403d47a, Model: hassakuXLIllustrious_v21fix, Clip skip: 2, Version: f1.7.0-v1.10.1RC-latest-2190-g8731f1e9

まとめ:あなたもAIアートの冒険家になろう!

AIによる画像生成は、まるで未開の土地を探索する冒険のようです。プロンプトとパラメータを理解し、適切に調整することで、AIはあなたの想像力をはるかに超える作品を生み出す可能性を秘めています。

今回ご紹介したプロンプトやパラメータはあくまで一例です。重要なのは、「試行錯誤」すること。さまざまな言葉や数値を入力し、AIがどのように反応するか観察するうちに、あなただけの「黄金レシピ」が見つかるはずです。

さあ、あなたも今日から生成AIアートのクリエイターとして、無限の創造性を解き放ってみませんか? この記事が、あなたのAIアートライフの一助となれば幸いです。

ぜひ、今回の設定を参考に、あなたが生成した画像をSNSなどでシェアしてみてくださいね!