在这里插入图片描述

在AI编程席卷整个软件开发行业的今天,几乎每一位开发者都体验过那种瞬间完成代码编写的快感。从简单的函数实现到完整的功能模块,AI工具都能快速给出可运行的结果,这种开发模式被形象地称为Vibe Coding。凭借高效、便捷的特性,它迅速成为技术圈的热门趋势,无数团队和个人纷纷投入其中,期待用AI大幅提升开发效率,缩短项目周期。

但现实却给了所有人一记清醒的耳光。行业调研数据显示,高达90%到95%的AI编码项目无法从试点阶段进入生产环境,多数项目在短短两周内就陷入停滞甚至直接废弃。这些项目不是不能运行,而是陷入了可怕的规模化陷阱,代码能跑却没人敢修改,能实现基础功能却无法支撑长期维护和迭代。当AI编程的蜜月期彻底结束,一个全新的开发理念开始登上舞台,它就是Spec-Driven Development,简称SDD,也就是规范驱动开发。

很多人会疑惑,同样是借助AI开发,为什么Vibe Coding会遭遇如此严重的滑铁卢,SDD又凭什么成为拯救AI编码项目的关键。想要弄清楚这个问题,我们必须先回到Vibe Coding的本质,看清它从风靡全网到暴露缺陷的完整过程。
在这里插入图片描述

一、Vibe Coding的狂欢与落幕,快开发背后的致命隐患

Vibe Coding这个概念的诞生,源于人工智能领域知名专家Andrej Karpathy的一条推文。这条内容简单直接,核心观点就是开发者不用过度纠结细节和逻辑,直接让AI根据模糊意图编写代码,只要能正常运行就可以。这种反传统的开发理念,瞬间点燃了整个技术圈的热情,短短时间内获得海量转发和认同。

在很多人看来,Vibe Coding完美契合了快速原型开发的需求。过去开发一个原型,需要开发者梳理需求、设计架构、编写代码、调试修复,整个过程耗时费力。而Vibe Coding把复杂的思考过程简化,开发者只需要给出大致想法,AI就能快速输出可执行代码,几分钟甚至几秒钟就能看到效果。对于追求速度的初创团队、个人开发者以及需要快速验证想法的项目来说,这种模式无疑是理想选择。

但随着应用场景的不断拓展,Vibe Coding的致命缺陷开始暴露无遗。多家权威机构的调研数据,揭开了AI编码项目的残酷真相。麦肯锡的报告指出,超过六成的企业表示,AI生成的代码在原型阶段表现优异,却完全无法满足生产环境的可维护性要求。高德纳的调研则显示,只有不到一成的技术决策者,会完全信任AI智能体输出的结果。

问题的核心不在于AI写不出能运行的代码,而在于Vibe Coding从根源上缺少关键环节。它的运行逻辑是输入模糊意图,输出可执行代码,AI只知道要实现什么功能,却不知道为什么要这样实现,更不清楚代码背后的业务逻辑、约束条件和扩展需求。

当项目规模停留在单个文件、单个功能时,这种模糊性带来的影响微乎其微。可一旦项目复杂度提升,涉及多个模块联动、多层架构设计、长期功能迭代时,模糊意图催生的就是模糊代码。这些代码没有清晰的设计思路,没有统一的规范标准,没有完整的逻辑说明,看似能正常运行,实则暗藏无数隐患。

开发者在维护和修改时,根本无法理解每一段代码的设计初衷,不知道修改一处代码会引发怎样的连锁反应。久而久之,没人敢轻易改动代码,没人敢新增功能,没人敢修复潜在漏洞,项目就此陷入停滞。这就是Vibe Coding无法跨越的规模化陷阱,也是95%的AI编码项目快速消亡的根本原因。

在这样的行业背景下,规范驱动开发SDD应运而生。它不是对Vibe Coding的全盘否定,而是对AI开发模式的补全和升级,让AI编码从单纯的快速原型开发,走向可规模化、可维护、可迭代的工程化开发道路。

二、规范驱动开发,让AI编码从随性走向规范

Spec-Driven Development的核心思想并不新颖,先编写规范,再编写代码,这是软件工程领域传承多年的基本原则。但在AI时代,这个理念被赋予了全新的价值和意义。

传统开发模式中的规范,更多是面向开发者的文档,用于统一开发思路、明确需求边界,作用是辅助人工开发。而SDD模式下的规范,不再是单纯给人阅读的说明文档,而是直接喂给AI的执行指令。它清晰定义项目的需求、目标、架构、约束、接口、测试标准等所有关键信息,让AI不再依靠模糊意图猜测开发需求,而是按照精准、完整的规范执行代码编写。

简单来说,Vibe Coding是让AI自由发挥,写出能跑的代码,SDD是给AI明确规则,写出好用、好改、好维护的代码。两者的核心区别,就像随意搭建的临时小屋和严格按照图纸施工的稳固建筑,前者能短期使用,却经不起时间和规模的考验,后者虽然前期需要投入更多精力规划,却能长期稳定运行,支持持续扩展。

从2025年下半年到2026年初,SDD作为AI工程化领域最核心的趋势,吸引了众多企业和开发者的关注,市场上也随之涌现出多个专业框架。这些框架基于不同的设计哲学,面向不同的应用场景,各有优势和局限,其中最具代表性的有五个,分别是GitHub Spec Kit、OpenSpec、Superpowers、AWS Kiro和Tessl。想要用好SDD,首先就要选对适合自己的框架。

三、五大SDD框架深度横评,找到适合自己的开发工具

1. GitHub Spec Kit,官方标准的野心与负担

GitHub Spec Kit是GitHub在2025年8月推出的官方SDD工具包,采用MIT开源许可,发布后迅速收获五万多Star,成为行业内关注度最高的框架之一。

它的核心是一套完整的四阶段流水线,第一阶段是Specify,由开发者描述项目目标和用户旅程,AI智能体自动起草详细的规格文档。第二阶段是Plan,开发者声明架构、技术栈和约束条件,AI生成对应的技术方案。第三阶段是Tasks,AI把整体工作拆解成细小、可独立验证的任务单元。第四阶段是Implement,按照任务逐步实现代码并完成验证。

作为GitHub官方推出的工具,Spec Kit的优势十分突出。它拥有官方背书,兼容性极强,能够适配Copilot、Claude Code、Gemini CLI、Cursor等17种以上主流AI工具,同时跨平台支持Unix Shell和Windows PowerShell,满足不同开发者的使用习惯。

但优势背后,也存在明显的问题。Martin Fowler团队的专家在深度评测中明确指出,Spec Kit在运行过程中会生成大量重复的Markdown文件,审查体验极差,很多开发者表示宁愿直接审查代码,也不想面对这些繁琐的文档。此外,社区对其维护活跃度的质疑也不断出现,影响了大型团队的长期使用信心。

综合来看,GitHub Spec Kit更适合大型团队的新项目启动,以及需要建立标准化开发流程的企业环境。

2. OpenSpec,轻量高效的棕地项目优先方案

与Spec Kit的重型标准化路线不同,OpenSpec由Fission-AI开发,走的是轻量级、轻量化的路线,核心设计哲学是Brownfield-First,也就是棕地项目优先。

在实际开发场景中,大多数团队面对的不是从零开始的绿地新项目,而是已经拥有数万行甚至更多代码的棕地项目,这类项目的核心需求是持续演进和优化,而非重新搭建。OpenSpec正是针对这一痛点设计,它的Spec文件可以和代码存储在同一个仓库中,按照项目能力进行组织,上下文信息不会因为聊天会话结束而丢失,完美适配已有代码库的开发需求。

它的工作流简洁清晰,发起变更,创建提案、规格、设计、任务等相关产物,实现具体任务,归档并合并Spec文件,全程没有复杂的流程和冗余的文件。同时,OpenSpec使用门槛极低,不需要API密钥,不需要MCP协议,安装完成就能直接使用,支持20种以上开发工具,灵活度极高。

不过轻量灵活也带来了一定的短板,OpenSpec缺乏强制约束机制,完全依靠团队的自律性。对于开发规范严谨、自律性强的团队来说,它是高效工具,但对于纪律性不足的团队,可选的规范等同于没有规范,无法发挥SDD的真正价值。

OpenSpec的适用场景非常明确,就是已有代码库的持续演进,以及追求快速迭代的中小团队。

3. Superpowers,Claude生态的全栈工作流引擎

Superpowers是由Best Practical Solutions创始人Jesse Vincent打造,专门为Claude Code设计的技能框架,它不只是一个简单的Spec工具,而是一套完整的开发工作流引擎。

它的核心机制极具特色,首先是可组合技能,技能可以自动激活,全程引导开发流程,规范开发者的操作步骤。其次是Spec提取与审查,自动从对话中提取规范内容,分段展示给开发者审阅确认,避免信息遗漏和理解偏差。最重要的是,它强制推行TDD测试驱动开发,严格遵循红黄绿重构循环,先编写失败的测试用例,看到测试失败,再编写最少代码让测试通过,最后进行代码重构,从根源上保障代码质量。

此外,Superpowers还采用双阶段审查模式,每个子任务完成后,先检查规范合规性,再检查代码质量,双重保障开发结果。同时支持子智能体调度,自动创建git worktree,把任务并行分发给子智能体,提升开发效率。

为了验证框架的有效性,开发者还利用说服力原则进行测试,结果证明Claude Code会严格遵守Skills设定的规则,把它当作权威参考,而非可选建议。

但Superpowers的局限性也很明显,它深度绑定Claude Code生态,不支持其他AI工具,使用场景相对受限。它更适合Claude Code的重度用户,以及对代码质量有极高要求的个人开发者和小型团队。

4. AWS Kiro,IDE集成的极简务实选择

AWS Kiro是AWS推出的AI编码IDE,它把SDD流程直接嵌入开发环境,走极简务实的路线,是所有主流框架中最轻量的SDD实现。

对比Spec Kit生成大量文档的繁琐设计,Kiro全程只生成三个Markdown文件,分别是需求文档、设计文档和任务文档,精简到极致,避免了审查过载的问题。它的工作流只有三步,需求梳理,设计规划,任务执行,每一步都由AI生成内容,开发者负责审查确认,学习成本极低。

Kiro最大的优势在于原生集成VS Code开发环境,完全贴合开发者的日常使用习惯,不需要额外适应新的操作界面。它的规范文件相当于超级提示词,直接作为AI的执行上下文,简洁高效,能快速落地SDD理念。

但极简设计也带来了一定的弊端,Martin Fowler团队指出,Kiro的固定工作流对小型修复任务显得过度设计。比如只是修改一个CSS颜色,也要走完需求、设计、任务的完整流程,反而降低了开发效率,增加了不必要的繁琐步骤。

AWS Kiro适合AWS生态的用户,以及偏好IDE集成体验、追求极简开发流程的团队。

5. Tessl,规范即源代码的激进实验

Tessl是所有SDD框架中最特殊、最激进的一个,它大胆尝试Spec-as-Source路线,也就是规范即源代码,彻底颠覆传统开发模式。

在传统开发模式中,开发者优先编写代码,文档往往被忽略,随缘补充。在SDD模式中,开发者先编写规范,再根据规范编写代码。而Tessl更进一步,直接规定开发者只需要编辑规范,所有代码都由AI自动生成,规范成为项目的核心源文件,代码只是规范的附属产物。

这种模式足够激进,也充满争议。Martin Fowler把它和2000年代的模型驱动开发MDD对比,当年的模型驱动开发承诺绘制UML图就能生成代码,最终因为抽象层级过于笨重而失败。大语言模型虽然解决了模型驱动开发的部分约束问题,却引入了非确定性风险,用专家的评价来说,Tessl可能兼具了灵活性不足和非确定性的双重缺点。

目前Tessl还处于试验阶段,社区活跃度较低,适用场景非常有限,只适合愿意尝试前沿技术、敢于押注未来的早期采用者。

为了更清晰地对比五大框架的差异,我们可以从多个维度总结,Spec Kit是重量标准化,兼容多工具,学习成本中等,适合大型新建项目,约束性强。OpenSpec是轻量灵活,兼容多工具,学习成本低,适合中小型已有项目,约束性弱。Superpowers聚焦TDD加技能组合,仅支持Claude Code,学习成本中高,适合追求质量的中型项目,约束性强。Kiro是IDE原生极简,学习成本低,适合各类规模项目,约束性中等。Tessl是规范即源代码,专属平台,学习成本高,仅适合实验性项目,约束性极强。

四、理性看待SDD,专家警告与真实数据的双面启示

当SDD成为行业热门趋势,无数人开始追捧这种全新的开发模式时,行业内也出现了理性的声音。Martin Fowler团队的Birgitta Böckeler发布了一篇深度分析文章,用德语词Verschlimmbesserung形容SDD,这个词的意思是越改越坏的改进,给狂热的行业泼了一盆冷水。

Birgitta Böckeler把SDD分为三个递进层级,第一层是Spec-First,先写规范再写代码,完成后规范可以丢弃,目前主流的Spec Kit、OpenSpec、Kiro都属于这个层级。第二层是Spec-Anchored,规范会保留下来,用于后续的维护和功能演进,Superpowers的技能体系接近这个层级。第三层是Spec-as-Source,规范就是核心源文件,只有Tessl在尝试这个层级。

核心发现是,SDD的层级越高,理论上能带来的收益越大,但在实际应用中遇到的问题也越多。

首先是审查过载问题,以Spec Kit为代表的重型框架,每个阶段都会生成大量文档,开发者审查这些规范文件花费的时间和精力,远远超过直接审查代码,SDD原本的目的是减少返工、提升效率,结果反而变成了额外的负担。

其次是AI可控性悖论,很多人认为规范越详细,AI就会越听话,执行越精准。但实际测试结果恰恰相反,AI依然会出现忽视指令、过度执行的情况,规范的冗长程度和AI的遵从程度之间,并没有线性关系。这也是Superpowers放弃过度细化规范,转而用TDD和双阶段审查强制验证结果的原因,与其寄希望于AI读懂所有规范,不如用测试直接证明AI执行正确。

最后是工作流通用性问题,现有所有SDD工具都存在一个共同盲点,它们默认所有开发任务都需要完整的SDD流程,但现实开发中,绝大多数任务都是简单的小型修改和修复,根本不需要启动完整的规范设计流程。缺乏根据任务复杂度自动调整工作流深度的能力,让SDD在简单场景中显得画蛇添足。

除了专家的理性警告,我们也可以通过真实数据,看清SDD的实际价值。多个独立调研显示,SDD能带来显著的优化效果,生产环境的缺陷数量减少40%到60%,重构时间降低50%,项目交付速度提升30%,编程时间减少56%,产品上市时间缩短30%到40%,两年内的开发成本降低20%到30%。

但这些正面数据也存在明显的局限,一是样本偏差,发布数据的多为SDD工具厂商或合作伙伴,中立第三方的评价更保守。二是项目类型偏差,成功案例多集中在中大型新建项目,针对已有代码库的改造数据非常稀缺。三是对照组模糊,数据对比的基准不明确,和完全无规范的Vibe Coding对比,还是和传统软件工程流程对比,结论天差地别。

综合专家观点和真实数据,我们能得出一个关键结论,SDD不是要不要采用的问题,而是什么时候用、怎么用的问题。它的效果完全取决于项目规模、团队经验、AI工具成熟度三个变量的交叉影响。单文件脚本类项目完全不需要SDD,多模块系统类项目高度需要SDD。资深工程师自带规范思维,轻量SDD即可,新手团队需要强制规范约束。AI工具的不断升级,也让SDD的执行效果持续提升。

五、渐进式Spec,SDD落地的最佳实践方案

结合行业实践、框架对比和专家分析,我始终认为,SDD的方向完全正确,但当前市面上的工具普遍陷入了过度设计的误区。

回顾软件工程的发展历史,每隔十年就会出现一次用更多流程解决流程不足的循环,瀑布模型、RUP、CMMI都曾走过这条路,最终都因为过于笨重、限制创造力而被淘汰。SDD如果一味追求重型流程、强制规范、冗余文档,很有可能重蹈覆辙,从提升效率的工具,变成阻碍开发的负担。

想要让SDD真正发挥价值,避免陷入过度设计的陷阱,渐进式Spec是目前最务实、最高效的落地方案。简单来说,就是根据项目的阶段、规模、类型,灵活选择SDD的应用深度,不搞一刀切,不盲目套用重型流程。

具体的实践方案可以分为四个层级。第一,原型验证阶段,代码量不足1000行的项目,继续使用Vibe Coding,不折腾任何规范流程,直接使用Claude Code、Cursor等工具裸用,核心目标是快速验证想法可行性。第二,功能迭代阶段,代码量在1000到10000行之间的项目,采用轻量Spec加TDD模式,选择OpenSpec或Superpowers,平衡规范和效率。第三,系统构建阶段,代码量超过10000行的大型项目,引入完整的SDD流水线,选择Spec Kit或Kiro,保障项目的可维护性和可扩展性。第四,已有代码库改造项目,坚持棕地项目优先理念,直接选择OpenSpec,适配现有代码环境。

很多人会问,为什么不推荐所有项目都使用Spec Kit这样的完整框架。原因很简单,过度的流程是创造力的天敌。原型阶段的核心是速度,是快速试错,这时候花费大量时间编写规范文档,就是用流程杀死创新。只有当项目验证可行性,进入工程化、规模化阶段后,规范的价值才会凸显,这时候引入SDD约束,才是符合开发规律的选择。

对于Tessl的规范即源代码路线,我持谨慎观望的态度。Martin Fowler的历史类比极具说服力,当年模型驱动开发的美好承诺最终落空,如今规范即源代码的激进理念,同样需要大量实践验证。虽然大语言模型解决了过往的部分问题,但非确定性风险依然存在,现在就全面押注为时过早,但我们也不能完全否定它的未来潜力。

如果团队没有精力深入研究所有框架,只想快速选择一个合适的工具,也可以按照简单的标准判断。Claude Code重度用户,直接选择Superpowers,它的TDD强制约束、双阶段审查和可组合技能,能最大化提升代码质量。使用多种AI工具的混合团队,选择OpenSpec,轻量、灵活、兼容性强,完美适配棕地项目。大型企业需要标准化开发流程,选择Spec Kit,官方背书和多工具兼容,能满足企业级标准化需求。

六、SDD对不同角色的真实价值与行动建议

SDD的兴起,不仅改变了开发模式,也对不同角色的从业者产生了深远影响,每个角色都应该找到自己的定位和行动方向。

对于技术负责人和CTO来说,不要盲目跟风推行SDD,也不要完全否定SDD的价值。核心是判断项目阶段,团队还在使用Vibe Coding做原型验证时,不用急于引入SDD,避免流程拖累速度。当团队开始为AI代码的维护、迭代发愁时,SDD就是最成熟的解决方案,同时要根据团队规模、项目类型选择合适的工具,不搞重型流程一刀切。

对于工程师和架构师来说,不用一开始就搭建完整的SDD流水线,可以先从Superpowers或OpenSpec入手,体验规范驱动开发的节奏,理解SDD的核心价值。SDD的本质不是流程,而是强迫开发者在写代码前想清楚所有问题,这本来就是优秀工程师的必备习惯,SDD只是用工具把这种习惯标准化、落地化。长期坚持,不仅能提升AI代码质量,还能反向提升自身的架构设计和需求梳理能力。

对于普通AI编程爱好者来说,不用纠结于复杂的框架和流程,只要理解SDD的核心理念就足够。很多人使用AI写代码时,都会遇到第一版惊艳,修改几次就崩溃的问题,这不是AI工具的问题,而是没有给AI清晰的约束和上下文。哪怕不使用任何SDD框架,在让AI写代码前,先简单梳理需求、明确功能、说明约束,就能大幅提升代码质量,减少后期维护的麻烦。

七、结语

Vibe Coding的出现,让AI编程走进了狂欢时代,它用极致的速度,改变了我们对开发效率的认知。但狂欢过后,95%的项目消亡,让我们看清了随性开发的致命缺陷。AI不缺编写代码的能力,缺的是明确的规则、清晰的规范、完整的上下文。

Spec-Driven Development的到来,为AI编码提供了缺失的拼图,它把模糊的意图变成精准的规范,让AI从自由发挥的创作者,变成按规执行的执行者。虽然当前的SDD框架还存在过度设计、通用性不足等问题,但渐进式Spec的实践方案,已经为我们指明了方向。

未来的AI开发,既不是完全抛弃规范的Vibe Coding,也不是过度流程化的重型SDD,而是两者的平衡融合。在快速验证时保留随性,在工程化时坚守规范,根据项目灵活调整,才能让AI编码真正走出规模化陷阱,从快速原型走向生产环境,从短期可用走向长期可靠。

对于每一位开发者、每一个技术团队来说,不必抗拒SDD的到来,也不必盲目跟风。理解规范的价值,找到适合自己的工具,在效率和规范之间找到平衡点,就能在AI编程的新时代,站稳脚跟,持续前行。而那些曾经活不过两周的AI编码项目,也终将在SDD的加持下,拥有长久的生命力。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐