Stable Diffusionで画像生成するときのいくつかのパラメータの値を変えて、生成される画像の見た目がどう変わるか調べた。
結論
大雑把に試した結果、個人的には以下の見解となった。
パラメータ | 備考 |
---|---|
Steps | 20以上で十分。 |
Clip skip | 基本は1固定。2以上で大きく変わるので、粗い調整要素。 |
CFG scale | 中程度の調整要素。 |
Variation strength | 細かい調整要素。0.05から変わってくる印象。 |
Upscaler | 個人的にはLatent系がよさげ。そのなかでLatent(antialiased)がよさげ。 |
Upscaler, Hire steps | 0固定。1以上で意味不明な画像になる。 |
Upscaler, Denoising strength | 基本は0.7。値が低いほどぼやける、値が大きいほどシャープになる。 |
環境
- stable-diffusion-webui
- Model: AOM3A1B
- Embedding: EasyNegative
基本設定
パラメータ | 設定 |
---|---|
Prompt | 1girl,full body,Bohemian,flowy,loose-fitting clothes,often with a mix of patterns and textures,such as maxi dresses,tassels |
Negative prompt | EasyNegative, extra fingers,fewer fingers,nsfw |
Sampler(Scheduler) | DPM++ 2M Karras, DPM++ SDE Karras |
Width/Height | 512 |
Seed | 1 |
Steps | 20 |
Clip skip | 1 |
CFG Scale | 7 |
Variation strength | 0 |
Upscaler | Latent |
Upscaler, Hires steps | 0 |
Upscaler, Denoising strength | 0.7 |
Upscale by | 2 |
比較
Steps
推論させる回数。10だと多少弱い。20~30あたりで安定。
Clip skip
低い値ほどpromptに忠実になる。粗い調整用。
CFG Scale
低い値ほどpromptに忠実になる。中程度の調整用。
Variation strength
低い値ほどpromptに忠実になる。細かい調整用。
Upscaler
どれを選ぶかは好みによる。
Upscaler, Hires steps
1以上はまったく意味のないでたらめな画像になった。
Upscaler, Denoising strength
値が低いほどぼやける、値が大きいほどシャープになる。