Stable Diffusionの画像生成パラメータ比較

Stable Diffusionで画像生成するときのいくつかのパラメータの値を変えて、生成される画像の見た目がどう変わるか調べた。

結論

大雑把に試した結果、個人的には以下の見解となった。

パラメータ 備考
Steps 20以上で十分。
Clip skip 基本は1固定。2以上で大きく変わるので、粗い調整要素。
CFG scale 中程度の調整要素。
Variation strength 細かい調整要素。0.05から変わってくる印象。
Upscaler 個人的にはLatent系がよさげ。そのなかでLatent(antialiased)がよさげ。
Upscaler, Hire steps 0固定。1以上で意味不明な画像になる。
Upscaler, Denoising strength 基本は0.7。値が低いほどぼやける、値が大きいほどシャープになる。

環境

基本設定

パラメータ 設定
Prompt 1girl,full body,Bohemian,flowy,loose-fitting clothes,often with a mix of patterns and textures,such as maxi dresses,tassels
Negative prompt EasyNegative, extra fingers,fewer fingers,nsfw
Sampler(Scheduler) DPM++ 2M Karras, DPM++ SDE Karras
Width/Height 512
Seed 1
Steps 20
Clip skip 1
CFG Scale 7
Variation strength 0
Upscaler Latent
Upscaler, Hires steps 0
Upscaler, Denoising strength 0.7
Upscale by 2

比較

Steps

推論させる回数。10だと多少弱い。20~30あたりで安定。

Clip skip

低い値ほどpromptに忠実になる。粗い調整用。

CFG Scale

低い値ほどpromptに忠実になる。中程度の調整用。

Variation strength

低い値ほどpromptに忠実になる。細かい調整用。

Upscaler

どれを選ぶかは好みによる。

Upscaler, Hires steps

1以上はまったく意味のないでたらめな画像になった。

Upscaler, Denoising strength

値が低いほどぼやける、値が大きいほどシャープになる。