引言

大家好,我是老猿,一个在IT圈混了十几年的码农,顺便爱上了AI绘画这个坑。说起来,2023年我第一次接触Stable Diffusion的时候,那叫一个惨烈。下载了个Automatic1111的WebUI,兴冲冲输入“画个猫”,结果出来一坨毛球加抽象背景,气得我直呼“AI你懂不懂艺术”。后来,我花了半年时间,边敲代码边死磕提示词(prompt),从每天生成几十张废图,到现在能轻松搞出专业级壁纸,甚至帮公司做些概念设计图。Stable Diffusion不是魔法,它的核心就是提示词——你得像导演一样,告诉AI“拍什么、怎么拍、别拍歪”。

为什么写这篇?因为CSDN上Stable Diffusion的教程不少,但大多是英文翻译的干货,读着像教科书,没啥人情味。2025年了,Stable Diffusion XL(SDXL)已经迭代到3.0,ComfyUI和InvokeAI这些工具也火了,新手还是老踩坑:提示词写得像购物清单,生成图要么模糊要么多手多脚。今天,我就用大白话,从基础到进阶,全方位聊聊提示词的使用方法。目标是让你读完就能上手,生成第一张满意图。文章会带大量示例、表格和我的亲身吐槽,长度拉长点,因为详尽才能帮你少走弯路。走起!

第一章:打好基础——提示词的“ABC”

Stable Diffusion是什么?为什么提示词这么重要?

Stable Diffusion是个开源的文本到图像生成模型,由Stability AI团队搞出来的。简单说,它用扩散模型(Diffusion Model)从噪声中“还原”图片,核心输入就是你的提示词。2025年,它已经支持SDXL 3.0,能生成更高分辨率(1024x1024默认),兼容更多LoRA插件,但本质没变:垃圾进,垃圾出(GIGO原则)。

提示词不是随口说说,它是AI的“剧本”。AI训练数据是海量图片+描述,英文效果最好(因为数据集偏英文),但中文也行——用DeepL或Google Translate辅助翻译。为什么重要?因为一个好提示能让AI从万千可能性中挑出你的脑洞。坏提示呢?就跟点外卖不写备注,结果上来一盘麻辣烫变宫保鸡丁。

我的第一课:别急着生成,先学结构。一个好提示像洋葱,一层一层剥开。

提示词的基本结构:主体+细节+风格

标准结构是“谁/什么 + 怎么做 + 哪里 + 什么风格”。别一次性堆太多,50-75个词起步(token,不是字;一个词可能多个token)。

  • 主体(Subject):核心对象。例:“一只懒洋洋的橘猫”。
  • 动作/姿势(Action/Pose):加动态。例:“蜷缩在沙发上打盹”。
  • 环境(Setting):背景。例:“温暖的客厅,壁炉边”。
  • 细节(Details):颜色、光影。例:“夕阳余晖洒在毛茸茸的身上”。
  • 风格(Style):艺术调性。例:“写实摄影风格”。
示例1:从简单到复杂
  • 简单版:a cat(生成:随机猫,可能是卡通或抽象)。
  • 基础版:a lazy orange cat sleeping on a sofa(生成:橘猫沙发睡,基本形似)。
  • 完整版:a lazy orange cat sleeping on a cozy sofa in a warm living room, sunlight filtering through windows, photorealistic, highly detailed(生成:毛绒绒橘猫,阳光斑驳,照片级真实)。

负面提示(Negative Prompt):这是“剧本的反面”,告诉AI“别加这个”。常见坑:AI爱生成畸形手、多肢体、低质图。起步用这个通用负面:blurry, low quality, deformed, ugly, extra limbs, bad anatomy, watermark。2025年SDXL模型内置了些NSFW过滤,但负面还是必备。

我的亲测:第一次画人像,忘了负面,结果AI给我整出个三眼美女。加了extra eyes, mutated hands后,瞬间正常。记住:负面别太长,10-20词够。

提示词长度与token限制

Stable Diffusion用CLIP模型解析提示,v1限75 token,SDXL放宽到150,但A1111 WebUI会自动分chunk(用BREAK分隔)。太短=模糊,太长=AI忽略后半段。

小Tips:

  • 用英文:cat比“猫”token少。
  • 测试工具:Prompt Hero或Civitai的提示生成器,帮你预览token。
  • 迭代法:先写主体,生成4张图看效果,再加细节。

这一章练手:去下载A1111(GitHub搜Automatic1111),设置Steps=20, CFG=7,生成上面示例。花半小时,你就入门了。(

第二章:权重魔法——让AI“听重点”

提示词不是平等的,有些词得“喊大声”。权重(Weighting)就是这个工具,像音量旋钮。Stable Diffusion用括号或数字控制:AI会根据权重调整生成概率。

权重语法详解

在A1111等界面,用(keyword:factor)格式。factor>1强调,<1弱化。默认1.0。

  • 括号简写:
    • (keyword) = (keyword:1.1) 轻微强调。
    • ((keyword)) = (keyword:1.21) 更强。
    • (((keyword))) = 层层叠加,但别滥用,容易过曝。
    • [keyword] = (keyword:0.9) 弱化。
    • [[keyword]] = (keyword:0.81)。
  • 精确数字:(red apple:1.5) 让苹果超红。
  • 负面权重:负面里也行,如(blurry:1.2) 更狠排除模糊。

表格1:权重效果对比

提示词示例

无权重生成

加权重(cat:1.3)生成

弱化[background:0.8]生成

cat in forest

猫小,森林抢镜

猫大而突出,森林模糊

猫清晰,森林淡化不干扰

girl with hat

帽子普通

(hat:1.5)帽子闪亮细节多

[crowd:0.7]人群少,焦点在女孩

示例2:权重实战

基础:a dragon flying over mountains, sunset(生成:龙小,山多)。

加权:((dragon:1.4)), flying over mountains, (sunset:1.2), epic fantasy(生成:巨龙霸屏,夕阳金光四射)。

我的经历:画“蒸汽朋克城市”,原版山寨味重,加(steampunk gears:1.3), [modern cars:0.6),瞬间变身维多利亚时代+未来感,客户直呼内行。

进阶权重:混合与融合

  • AND/OR:cat AND dog 融合特征(猫狗混血萌物)。
  • 步进融合:[cat:dog:0.5] 在生成步数50%处从猫变狗(动态变形)。
  • 随机变体:用{option1|option2} 如{red|blue} apple,每张图随机色。

坑点:权重太高(>2)易崩图,生成噪点。解决:CFG Scale调低到5-7(CFG控制提示 adherence,7平衡创意与严格)。

这一章核心:多实验!用XYZ Plot扩展(A1111插件)批量测试权重,省时省力。

第三章:风格借力——变身AI毕加索

风格是提示词的“调味料”,让图从平淡变惊艳。AI训练过无数艺术品,你借用大师名或关键词,就能“山寨”出神作。2025年,SDXL对风格更敏感,新增些cyberpunk和bioluminescent效果。

常见风格关键词

分门别类,挑着用。

表格2:风格关键词大全

类别

关键词示例

效果描述

示例提示

写实

photorealistic, hyperrealistic, 8k

照片级,细节爆棚

portrait of a woman, photorealistic, sharp focus

卡通/动漫

anime, cartoon, Studio Ghibli

萌系,柔和线条

cat in forest, anime style, vibrant colors

油画/传统

oil painting, watercolor, Van Gogh

笔触感强,艺术味

landscape, in style of Van Gogh, swirling skies

科幻/奇幻

cyberpunk, steampunk, epic fantasy

未来/蒸汽机时代

city at night, cyberpunk, neon lights

抽象/现代

minimalist, surreal, Picasso

几何/梦幻变形

abstract face, in style of Picasso, cubism

艺术家引用:谁的风格用谁

AI认艺术家名,但别堆砌(易冲突)。热门2025榜:

  • Greg Rutkowski:奇幻写实,细节王。(by Greg Rutkowski)
  • Alphonse Mucha:艺术 Nouveau,花纹美女。
  • Frank Frazetta:蛮荒英雄,肌肉感爆表。
  • Dan McCarthy:科幻雕塑,hyperrealistic。
  • 新晋:Beeple(数字艺术,NFT风)。
示例3:风格变换

基础:a warrior on cliff(生成:普通人影)。

加风格:a fierce warrior on a jagged cliff, dramatic sunset, in the style of Frank Frazetta, hyper-detailed, cinematic lighting(生成:肌肉战士,夕阳拉影,史诗感拉满)。

负面:lowres, cartoonish(避卡通化)。

我的吐槽:试过Picasso and Monet,AI给我抽象花海+几何脸,笑喷。建议:单艺术家+1-2风格词。测试法:单独输入艺术家名,看AI输出啥(Civitai有预览)。

2025新趋势:混合风格与Embeddings

Embeddings是“词包”,如“Style-Empire”加暗黑帝国风。LoRA模型(低秩适配)更火,下载Civitai的cyberpunk LoRA,在提示加<lora:cyberpunk:0.8>。我用这个画“赛博猫”,橘猫变霓虹战士,酷毙。

这一章练手:挑个风格,生成10张,挑最好的一张当头像。

第四章:环境与细节——画龙点睛的秘籍

主体有了,风格定了,接下来是“肉”——环境、光影、氛围。这些让图活起来,像从2D变3D。

分层描述:从前景到远景

  • 前景(Foreground):主体细节,如fur detailed, whiskers twitching。
  • 中景(Midground):互动元素,leaves rustling in wind。
  • 背景(Background):大环境,misty forest at dawn。
  • 光影(Lighting):灵魂。golden hour(暖光)、volumetric god rays(神光)、dramatic chiaroscuro(明暗对比)。
示例4:光影魔力

基础:girl in room。

加光:a young girl reading book in attic room, candlelight flickering, shadows dancing on walls, warm tones, photorealistic(生成:烛光摇曳,氛围温馨)。

颜色:vibrant greens(鲜绿)、muted blues(低饱和蓝)。

氛围:serene(宁静)、ominous(阴森)。

表格3:光影关键词

光源

关键词

效果

示例

自然

golden hour, soft dawn

温暖柔和

sunset beach, golden hour lighting

人工

neon glow, studio flash

高对比

cyber city, neon lights reflecting on wet streets

奇幻

bioluminescent, ethereal glow

梦幻发光

forest fairy, bioluminescent mushrooms

细节堆叠:别忽略小事

加highly detailed, intricate textures, sharp focus提升质感。2025 SDXL爱ray tracing(光追),加这个模拟真实反射。

坑:细节太多AI崩,解决:权重分级,如(detailed face:1.2), [background clutter:0.7)。

我的案例:画“雨中街头”,原版湿漉漉但平淡,加raindrops on window, reflections in puddles, moody atmosphere,瞬间变电影海报。

第五章:参数调优——提示词的“硬件加速”

提示词是软件,参数是硬件。调不对,画虎不成反类犬。

核心参数详解

  • Steps:扩散步数,20-50起步(多=细致但慢)。新手20够。
  • CFG Scale:提示 adherence,7-12(低=创意,高=严格)。我爱8,平衡。
  • Sampler:采样器。Euler a(快创意)、DPM++ 2M Karras(质高,2025推荐)。
  • Seed:随机种子,固定=重复图。改提示微调。
  • Resolution:SDXL默认1024x1024,高=需GPU强。

表格4:参数推荐

场景

Steps

CFG

Sampler

Seed固定?

快速草图

15-25

5-7

Euler a

高质艺术

40-60

8-10

DPM++ 2M

写实人像

30-50

7-9

UniPC

示例:同提示,Steps=10 vs 50:前者模糊,后者丝滑。

我的心得:用ComfyUI(2025主流),节点化调参,效率翻倍。

第六章:高级玩法——从玩家到黑客

基础稳了,进高级:这些技巧让AI听你的“暗语”。

1. 种子与变体

Seed固定,改一词生成家族图。--seed 42命令行用。

2. 混合提示与野卡

{red|blue|green} dragon 随机色龙。AND融合:viking AND samurai =武士维京。

3. LoRA与Embeddings

LoRA:微调模型,加特定风格。Civitai下载,提示<lora:anime:0.7>。

Embeddings:词包,如“BadDream”加噩梦风。

示例5:LoRA实战

基础:girl portrait。

加LoRA:girl portrait, <lora:cyberpunk_girl:1.0>, neon hair(生成:赛博少女,霓虹妆)。

4. ControlNet与区域提示

ControlNet(插件):用边缘图/姿势图控制。区域提示:Regional Prompter扩展,分区写提示,如左上moon,右下stars。

5. Inpainting/Outpainting

Inpainting:局部重绘,刷黑区改提示。Outpainting:扩展画布,生成外延。

我的黑科技:用ControlNet画“历史人物现代版”,姿势图=古画,提示=“Einstein in spacesuit”,结果:爱因斯坦太空漫步,笑死。

6. 2025新宠:Prompt Blending与CLIPCLIP

Guidance调风格 vs 组成。Blending:多提示层叠,如layer1: cyberpunk, layer2: watercolor。

坑:高级易卡GPU,降分辨率练手。

第七章:常见坑与解决方案——别让AI坑你

新手99%踩坑,这里汇总。

坑1:生成畸形(多手、多眼)

解:负面加extra limbs, mutated hands, poorly drawn face。用A1111的Adetailer扩展自动修脸。

坑2:风格冲突

解:权重分明,如(style1:1.2), [style2:0.5)。测试单风格。

坑3:颜色偏差(AI偏西方)

解:指定asian features, chinese ink style。用LoRA补文化偏差。

坑4:低质噪点

解:Steps>30, Sampler=DPM++, 加masterpiece, best quality。

表格5:常见问题速查

问题

原因

解法

示例负面

模糊

Steps低

Steps=50

blurry, lowres

畸形

无负面

加解剖词

deformed, ugly

颜色错

偏见

指定民族

watermark, text

我的血泪:画中国风,AI总加金发。加east asian, traditional hanfu后OK。

第八章:案例研究——从菜鸟到神作的实战

理论够了,来真刀真枪。四个案例,逐步递进。

案例1:基础风景(新手级)

目标:宁静湖泊。

提示:a serene mountain lake at dawn, mist rising from water, pine trees on shore, soft pink sky, photorealistic, highly detailed, sharp focus。

负面:blurry, overexposed, people。

参数:Steps=30, CFG=8, Sampler=Euler a。

生成:雾气缭绕,粉霞映水。迭代:加(reflection:1.2),水面更镜面。

我的用:手机壁纸,赞无数。

案例2:人物肖像(中级,权重+风格)

目标:赛博朋克女孩。

提示:portrait of a young asian woman with neon blue hair, cyberpunk makeup, rainy city background, (detailed eyes:1.3), in style of Alphonse Mucha, hyperrealistic, 8k。

负面:deformed face, extra fingers, low quality。

参数:Steps=40, CFG=9, Seed=123。

生成:蓝发少女,霓虹反射眼眸。加LoRAcyber:0.8,更未来。

亲测:帮女友画,浪漫+1。

案例3:奇幻场景(高级,混合+ControlNet)

目标:龙骑士战斗。

提示:epic battle, knight riding dragon over volcano, lava flows, dramatic storm, ((dragon wings:1.4)), in style of Frank Frazetta, cinematic, volumetric lighting。

负面:cartoon, blurry motion。

用ControlNet:姿势图=骑士骑马,适配龙。

参数:Steps=50, CFG=10, Sampler=DPM++。

生成:熔岩喷发,翅膀张开。融合{fire|ice} breath,随机吐息。

我用:D&D游戏封面,哥们抢着要。

案例4:抽象艺术(高手,Blending+Inpainting)

目标:梦幻城市。

基础提示:surreal cityscape, floating buildings, purple skies, by Salvador Dali。

Outpainting扩展边缘,加neon rivers flowing upward。

Inpainting修中心塔:刷黑,提示crystal spire glowing。

参数:Steps=60, CFG=7(创意高)。

生成:达利风浮城,晶塔闪耀。2025 SDXL光追让河流超真实。

心得:从草图迭代3轮,神作出炉。每个案例生成20张,挑1张。总时:2小时。见效吧?

第九章:资源推荐——2025工具箱

  • 界面:A1111(经典)、ComfyUI(节点党福音)、InvokeAI(简洁)。
  • 模型:Hugging Face SDXL 3.0,Civitai LoRA库。
  • 提示工具:Promptomania(构建器)、Lexica.art(搜索灵感)。
  • 社区:Reddit r/StableDiffusion,Discord Stability AI,CSDN AI版块。
  • 书籍/教程:Prompt Engineering Guide(V7 Labs,2025版),YouTube “Olivio Sarikas”频道。

更新:2025 Portkey Prompt Playground,实时测试+版本控制,免费试用。

结语:行动起来,AI等你指挥

写了这么多,手都敲麻了,但Stable Diffusion的乐趣就在迭代:失败图是老师,神作是奖励。从“一个猫”到“赛博橘猫征服纽约”,全靠提示词的魔力。2025年,AI更智能,但你得更聪明。多练,分享评论区你的作品,我来点评。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐