10 分钟吃透!Stable Diffusion 提示词:从 0 到 1 生成高质量图片
本文是一篇关于StableDiffusion(SD)AI绘画提示词使用的详细指南。作者老猿作为IT从业者分享了自己从入门到精通的经验,重点讲解了提示词的结构设计、权重控制、风格选择等核心技巧。文章通过大量实例演示了如何从简单描述逐步完善为专业级提示,包括主体、环境、光影等要素的构建方法。同时介绍了负面提示、参数调优等实用技术,并针对常见问题提供了解决方案。作者还分享了高级玩法如LoRA模型、Con
引言
大家好,我是老猿,一个在IT圈混了十几年的码农,顺便爱上了AI绘画这个坑。说起来,2023年我第一次接触Stable Diffusion的时候,那叫一个惨烈。下载了个Automatic1111的WebUI,兴冲冲输入“画个猫”,结果出来一坨毛球加抽象背景,气得我直呼“AI你懂不懂艺术”。后来,我花了半年时间,边敲代码边死磕提示词(prompt),从每天生成几十张废图,到现在能轻松搞出专业级壁纸,甚至帮公司做些概念设计图。Stable Diffusion不是魔法,它的核心就是提示词——你得像导演一样,告诉AI“拍什么、怎么拍、别拍歪”。
为什么写这篇?因为CSDN上Stable Diffusion的教程不少,但大多是英文翻译的干货,读着像教科书,没啥人情味。2025年了,Stable Diffusion XL(SDXL)已经迭代到3.0,ComfyUI和InvokeAI这些工具也火了,新手还是老踩坑:提示词写得像购物清单,生成图要么模糊要么多手多脚。今天,我就用大白话,从基础到进阶,全方位聊聊提示词的使用方法。目标是让你读完就能上手,生成第一张满意图。文章会带大量示例、表格和我的亲身吐槽,长度拉长点,因为详尽才能帮你少走弯路。走起!
第一章:打好基础——提示词的“ABC”
Stable Diffusion是什么?为什么提示词这么重要?
Stable Diffusion是个开源的文本到图像生成模型,由Stability AI团队搞出来的。简单说,它用扩散模型(Diffusion Model)从噪声中“还原”图片,核心输入就是你的提示词。2025年,它已经支持SDXL 3.0,能生成更高分辨率(1024x1024默认),兼容更多LoRA插件,但本质没变:垃圾进,垃圾出(GIGO原则)。
提示词不是随口说说,它是AI的“剧本”。AI训练数据是海量图片+描述,英文效果最好(因为数据集偏英文),但中文也行——用DeepL或Google Translate辅助翻译。为什么重要?因为一个好提示能让AI从万千可能性中挑出你的脑洞。坏提示呢?就跟点外卖不写备注,结果上来一盘麻辣烫变宫保鸡丁。
我的第一课:别急着生成,先学结构。一个好提示像洋葱,一层一层剥开。
提示词的基本结构:主体+细节+风格
标准结构是“谁/什么 + 怎么做 + 哪里 + 什么风格”。别一次性堆太多,50-75个词起步(token,不是字;一个词可能多个token)。
- 主体(Subject):核心对象。例:“一只懒洋洋的橘猫”。
- 动作/姿势(Action/Pose):加动态。例:“蜷缩在沙发上打盹”。
- 环境(Setting):背景。例:“温暖的客厅,壁炉边”。
- 细节(Details):颜色、光影。例:“夕阳余晖洒在毛茸茸的身上”。
- 风格(Style):艺术调性。例:“写实摄影风格”。
示例1:从简单到复杂
- 简单版:a cat(生成:随机猫,可能是卡通或抽象)。
- 基础版:a lazy orange cat sleeping on a sofa(生成:橘猫沙发睡,基本形似)。
- 完整版:a lazy orange cat sleeping on a cozy sofa in a warm living room, sunlight filtering through windows, photorealistic, highly detailed(生成:毛绒绒橘猫,阳光斑驳,照片级真实)。

负面提示(Negative Prompt):这是“剧本的反面”,告诉AI“别加这个”。常见坑:AI爱生成畸形手、多肢体、低质图。起步用这个通用负面:blurry, low quality, deformed, ugly, extra limbs, bad anatomy, watermark。2025年SDXL模型内置了些NSFW过滤,但负面还是必备。
我的亲测:第一次画人像,忘了负面,结果AI给我整出个三眼美女。加了extra eyes, mutated hands后,瞬间正常。记住:负面别太长,10-20词够。
提示词长度与token限制
Stable Diffusion用CLIP模型解析提示,v1限75 token,SDXL放宽到150,但A1111 WebUI会自动分chunk(用BREAK分隔)。太短=模糊,太长=AI忽略后半段。
小Tips:
- 用英文:cat比“猫”token少。
- 测试工具:Prompt Hero或Civitai的提示生成器,帮你预览token。
- 迭代法:先写主体,生成4张图看效果,再加细节。
这一章练手:去下载A1111(GitHub搜Automatic1111),设置Steps=20, CFG=7,生成上面示例。花半小时,你就入门了。(
第二章:权重魔法——让AI“听重点”
提示词不是平等的,有些词得“喊大声”。权重(Weighting)就是这个工具,像音量旋钮。Stable Diffusion用括号或数字控制:AI会根据权重调整生成概率。
权重语法详解
在A1111等界面,用(keyword:factor)格式。factor>1强调,<1弱化。默认1.0。
- 括号简写:
- (keyword) = (keyword:1.1) 轻微强调。
- ((keyword)) = (keyword:1.21) 更强。
- (((keyword))) = 层层叠加,但别滥用,容易过曝。
- [keyword] = (keyword:0.9) 弱化。
- [[keyword]] = (keyword:0.81)。
- 精确数字:(red apple:1.5) 让苹果超红。
- 负面权重:负面里也行,如(blurry:1.2) 更狠排除模糊。
表格1:权重效果对比
|
提示词示例 |
无权重生成 |
加权重(cat:1.3)生成 |
弱化[background:0.8]生成 |
|---|---|---|---|
|
cat in forest |
猫小,森林抢镜 |
猫大而突出,森林模糊 |
猫清晰,森林淡化不干扰 |
|
girl with hat |
帽子普通 |
(hat:1.5)帽子闪亮细节多 |
[crowd:0.7]人群少,焦点在女孩 |
示例2:权重实战
基础:a dragon flying over mountains, sunset(生成:龙小,山多)。
加权:((dragon:1.4)), flying over mountains, (sunset:1.2), epic fantasy(生成:巨龙霸屏,夕阳金光四射)。
我的经历:画“蒸汽朋克城市”,原版山寨味重,加(steampunk gears:1.3), [modern cars:0.6),瞬间变身维多利亚时代+未来感,客户直呼内行。
进阶权重:混合与融合
- AND/OR:cat AND dog 融合特征(猫狗混血萌物)。
- 步进融合:[cat:dog:0.5] 在生成步数50%处从猫变狗(动态变形)。
- 随机变体:用{option1|option2} 如{red|blue} apple,每张图随机色。
坑点:权重太高(>2)易崩图,生成噪点。解决:CFG Scale调低到5-7(CFG控制提示 adherence,7平衡创意与严格)。
这一章核心:多实验!用XYZ Plot扩展(A1111插件)批量测试权重,省时省力。
第三章:风格借力——变身AI毕加索
风格是提示词的“调味料”,让图从平淡变惊艳。AI训练过无数艺术品,你借用大师名或关键词,就能“山寨”出神作。2025年,SDXL对风格更敏感,新增些cyberpunk和bioluminescent效果。
常见风格关键词
分门别类,挑着用。
表格2:风格关键词大全
|
类别 |
关键词示例 |
效果描述 |
示例提示 |
|---|---|---|---|
|
写实 |
photorealistic, hyperrealistic, 8k |
照片级,细节爆棚 |
portrait of a woman, photorealistic, sharp focus |
|
卡通/动漫 |
anime, cartoon, Studio Ghibli |
萌系,柔和线条 |
cat in forest, anime style, vibrant colors |
|
油画/传统 |
oil painting, watercolor, Van Gogh |
笔触感强,艺术味 |
landscape, in style of Van Gogh, swirling skies |
|
科幻/奇幻 |
cyberpunk, steampunk, epic fantasy |
未来/蒸汽机时代 |
city at night, cyberpunk, neon lights |
|
抽象/现代 |
minimalist, surreal, Picasso |
几何/梦幻变形 |
abstract face, in style of Picasso, cubism |
艺术家引用:谁的风格用谁
AI认艺术家名,但别堆砌(易冲突)。热门2025榜:
- Greg Rutkowski:奇幻写实,细节王。(by Greg Rutkowski)
- Alphonse Mucha:艺术 Nouveau,花纹美女。
- Frank Frazetta:蛮荒英雄,肌肉感爆表。
- Dan McCarthy:科幻雕塑,hyperrealistic。
- 新晋:Beeple(数字艺术,NFT风)。
示例3:风格变换
基础:a warrior on cliff(生成:普通人影)。
加风格:a fierce warrior on a jagged cliff, dramatic sunset, in the style of Frank Frazetta, hyper-detailed, cinematic lighting(生成:肌肉战士,夕阳拉影,史诗感拉满)。
负面:lowres, cartoonish(避卡通化)。
我的吐槽:试过Picasso and Monet,AI给我抽象花海+几何脸,笑喷。建议:单艺术家+1-2风格词。测试法:单独输入艺术家名,看AI输出啥(Civitai有预览)。

2025新趋势:混合风格与Embeddings
Embeddings是“词包”,如“Style-Empire”加暗黑帝国风。LoRA模型(低秩适配)更火,下载Civitai的cyberpunk LoRA,在提示加<lora:cyberpunk:0.8>。我用这个画“赛博猫”,橘猫变霓虹战士,酷毙。
这一章练手:挑个风格,生成10张,挑最好的一张当头像。
第四章:环境与细节——画龙点睛的秘籍
主体有了,风格定了,接下来是“肉”——环境、光影、氛围。这些让图活起来,像从2D变3D。
分层描述:从前景到远景
- 前景(Foreground):主体细节,如fur detailed, whiskers twitching。
- 中景(Midground):互动元素,leaves rustling in wind。
- 背景(Background):大环境,misty forest at dawn。
- 光影(Lighting):灵魂。golden hour(暖光)、volumetric god rays(神光)、dramatic chiaroscuro(明暗对比)。
示例4:光影魔力
基础:girl in room。
加光:a young girl reading book in attic room, candlelight flickering, shadows dancing on walls, warm tones, photorealistic(生成:烛光摇曳,氛围温馨)。
颜色:vibrant greens(鲜绿)、muted blues(低饱和蓝)。
氛围:serene(宁静)、ominous(阴森)。

表格3:光影关键词
|
光源 |
关键词 |
效果 |
示例 |
|---|---|---|---|
|
自然 |
golden hour, soft dawn |
温暖柔和 |
sunset beach, golden hour lighting |
|
人工 |
neon glow, studio flash |
高对比 |
cyber city, neon lights reflecting on wet streets |
|
奇幻 |
bioluminescent, ethereal glow |
梦幻发光 |
forest fairy, bioluminescent mushrooms |
细节堆叠:别忽略小事
加highly detailed, intricate textures, sharp focus提升质感。2025 SDXL爱ray tracing(光追),加这个模拟真实反射。
坑:细节太多AI崩,解决:权重分级,如(detailed face:1.2), [background clutter:0.7)。
我的案例:画“雨中街头”,原版湿漉漉但平淡,加raindrops on window, reflections in puddles, moody atmosphere,瞬间变电影海报。
第五章:参数调优——提示词的“硬件加速”
提示词是软件,参数是硬件。调不对,画虎不成反类犬。
核心参数详解
- Steps:扩散步数,20-50起步(多=细致但慢)。新手20够。
- CFG Scale:提示 adherence,7-12(低=创意,高=严格)。我爱8,平衡。
- Sampler:采样器。Euler a(快创意)、DPM++ 2M Karras(质高,2025推荐)。
- Seed:随机种子,固定=重复图。改提示微调。
- Resolution:SDXL默认1024x1024,高=需GPU强。
表格4:参数推荐
|
场景 |
Steps |
CFG |
Sampler |
Seed固定? |
|---|---|---|---|---|
|
快速草图 |
15-25 |
5-7 |
Euler a |
否 |
|
高质艺术 |
40-60 |
8-10 |
DPM++ 2M |
是 |
|
写实人像 |
30-50 |
7-9 |
UniPC |
是 |
示例:同提示,Steps=10 vs 50:前者模糊,后者丝滑。
我的心得:用ComfyUI(2025主流),节点化调参,效率翻倍。
第六章:高级玩法——从玩家到黑客
基础稳了,进高级:这些技巧让AI听你的“暗语”。
1. 种子与变体
Seed固定,改一词生成家族图。--seed 42命令行用。
2. 混合提示与野卡
{red|blue|green} dragon 随机色龙。AND融合:viking AND samurai =武士维京。
3. LoRA与Embeddings
LoRA:微调模型,加特定风格。Civitai下载,提示<lora:anime:0.7>。
Embeddings:词包,如“BadDream”加噩梦风。
示例5:LoRA实战
基础:girl portrait。
加LoRA:girl portrait, <lora:cyberpunk_girl:1.0>, neon hair(生成:赛博少女,霓虹妆)。
4. ControlNet与区域提示
ControlNet(插件):用边缘图/姿势图控制。区域提示:Regional Prompter扩展,分区写提示,如左上moon,右下stars。
5. Inpainting/Outpainting
Inpainting:局部重绘,刷黑区改提示。Outpainting:扩展画布,生成外延。
我的黑科技:用ControlNet画“历史人物现代版”,姿势图=古画,提示=“Einstein in spacesuit”,结果:爱因斯坦太空漫步,笑死。
6. 2025新宠:Prompt Blending与CLIPCLIP
Guidance调风格 vs 组成。Blending:多提示层叠,如layer1: cyberpunk, layer2: watercolor。
坑:高级易卡GPU,降分辨率练手。
第七章:常见坑与解决方案——别让AI坑你
新手99%踩坑,这里汇总。
坑1:生成畸形(多手、多眼)
解:负面加extra limbs, mutated hands, poorly drawn face。用A1111的Adetailer扩展自动修脸。
坑2:风格冲突
解:权重分明,如(style1:1.2), [style2:0.5)。测试单风格。
坑3:颜色偏差(AI偏西方)
解:指定asian features, chinese ink style。用LoRA补文化偏差。
坑4:低质噪点
解:Steps>30, Sampler=DPM++, 加masterpiece, best quality。
表格5:常见问题速查
|
问题 |
原因 |
解法 |
示例负面 |
|---|---|---|---|
|
模糊 |
Steps低 |
Steps=50 |
blurry, lowres |
|
畸形 |
无负面 |
加解剖词 |
deformed, ugly |
|
颜色错 |
偏见 |
指定民族 |
watermark, text |
我的血泪:画中国风,AI总加金发。加east asian, traditional hanfu后OK。
第八章:案例研究——从菜鸟到神作的实战
理论够了,来真刀真枪。四个案例,逐步递进。
案例1:基础风景(新手级)
目标:宁静湖泊。
提示:a serene mountain lake at dawn, mist rising from water, pine trees on shore, soft pink sky, photorealistic, highly detailed, sharp focus。
负面:blurry, overexposed, people。
参数:Steps=30, CFG=8, Sampler=Euler a。
生成:雾气缭绕,粉霞映水。迭代:加(reflection:1.2),水面更镜面。
我的用:手机壁纸,赞无数。

案例2:人物肖像(中级,权重+风格)
目标:赛博朋克女孩。
提示:portrait of a young asian woman with neon blue hair, cyberpunk makeup, rainy city background, (detailed eyes:1.3), in style of Alphonse Mucha, hyperrealistic, 8k。
负面:deformed face, extra fingers, low quality。
参数:Steps=40, CFG=9, Seed=123。
生成:蓝发少女,霓虹反射眼眸。加LoRAcyber:0.8,更未来。
亲测:帮女友画,浪漫+1。

案例3:奇幻场景(高级,混合+ControlNet)
目标:龙骑士战斗。
提示:epic battle, knight riding dragon over volcano, lava flows, dramatic storm, ((dragon wings:1.4)), in style of Frank Frazetta, cinematic, volumetric lighting。
负面:cartoon, blurry motion。
用ControlNet:姿势图=骑士骑马,适配龙。
参数:Steps=50, CFG=10, Sampler=DPM++。
生成:熔岩喷发,翅膀张开。融合{fire|ice} breath,随机吐息。
我用:D&D游戏封面,哥们抢着要。

案例4:抽象艺术(高手,Blending+Inpainting)
目标:梦幻城市。
基础提示:surreal cityscape, floating buildings, purple skies, by Salvador Dali。
Outpainting扩展边缘,加neon rivers flowing upward。
Inpainting修中心塔:刷黑,提示crystal spire glowing。
参数:Steps=60, CFG=7(创意高)。
生成:达利风浮城,晶塔闪耀。2025 SDXL光追让河流超真实。
心得:从草图迭代3轮,神作出炉。每个案例生成20张,挑1张。总时:2小时。见效吧?

第九章:资源推荐——2025工具箱
- 界面:A1111(经典)、ComfyUI(节点党福音)、InvokeAI(简洁)。
- 模型:Hugging Face SDXL 3.0,Civitai LoRA库。
- 提示工具:Promptomania(构建器)、Lexica.art(搜索灵感)。
- 社区:Reddit r/StableDiffusion,Discord Stability AI,CSDN AI版块。
- 书籍/教程:Prompt Engineering Guide(V7 Labs,2025版),YouTube “Olivio Sarikas”频道。
更新:2025 Portkey Prompt Playground,实时测试+版本控制,免费试用。
结语:行动起来,AI等你指挥
写了这么多,手都敲麻了,但Stable Diffusion的乐趣就在迭代:失败图是老师,神作是奖励。从“一个猫”到“赛博橘猫征服纽约”,全靠提示词的魔力。2025年,AI更智能,但你得更聪明。多练,分享评论区你的作品,我来点评。
更多推荐


所有评论(0)