雑記 for me

Stable Diffusionの画像生成パラメータ比較

Stable Diffusion

結論
環境
基本設定
比較

Stable Diffusionで画像生成するときのいくつかのパラメータの値を変えて、生成される画像の見た目がどう変わるか調べた。

結論

大雑把に試した結果、個人的には以下の見解となった。

パラメータ	備考
Steps	20以上で十分。
Clip skip	基本は1固定。2以上で大きく変わるので、粗い調整要素。
CFG scale	中程度の調整要素。
Variation strength	細かい調整要素。0.05から変わってくる印象。
Upscaler	個人的にはLatent系がよさげ。そのなかでLatent(antialiased)がよさげ。
Upscaler, Hire steps	0固定。1以上で意味不明な画像になる。
Upscaler, Denoising strength	基本は0.7。値が低いほどぼやける、値が大きいほどシャープになる。

環境

基本設定

パラメータ	設定
Prompt	1girl,full body,Bohemian,flowy,loose-fitting clothes,often with a mix of patterns and textures,such as maxi dresses,tassels
Negative prompt	EasyNegative, extra fingers,fewer fingers,nsfw
Sampler(Scheduler)	DPM++ 2M Karras, DPM++ SDE Karras
Width/Height	512
Seed	1
Steps	20
Clip skip	1
CFG Scale	7
Variation strength	0
Upscaler	Latent
Upscaler, Hires steps	0
Upscaler, Denoising strength	0.7
Upscale by	2

比較

Steps

推論させる回数。10だと多少弱い。20～30あたりで安定。

Clip skip

低い値ほどpromptに忠実になる。粗い調整用。

CFG Scale

低い値ほどpromptに忠実になる。中程度の調整用。

Variation strength

低い値ほどpromptに忠実になる。細かい調整用。

Upscaler

どれを選ぶかは好みによる。

Upscaler, Hires steps

1以上はまったく意味のないでたらめな画像になった。

Upscaler, Denoising strength

値が低いほどぼやける、値が大きいほどシャープになる。