95%的AI编码项目活不过两周，Spec-Driven Development真能救场吗？

AI编程的狂欢与反思：从Vibe Coding到规范驱动开发随着AI编程工具的普及，Vibe Coding凭借其快速生成代码的能力风靡一时。然而数据显示，90%-95%的AI编码项目无法进入生产环境，主要原因是缺乏可维护性和扩展性。规范驱动开发(SDD)应运而生，通过预先定义详细规范，引导AI生成更健壮的代码。目前主流SDD框架包括GitHub Spec Kit、OpenSpec、Superpo

小程故事多_80

358人浏览 · 2026-03-02 07:30:00

小程故事多_80 · 2026-03-02 07:30:00 发布

在这里插入图片描述

在AI编程席卷整个软件开发行业的今天，几乎每一位开发者都体验过那种瞬间完成代码编写的快感。从简单的函数实现到完整的功能模块，AI工具都能快速给出可运行的结果，这种开发模式被形象地称为Vibe Coding。凭借高效、便捷的特性，它迅速成为技术圈的热门趋势，无数团队和个人纷纷投入其中，期待用AI大幅提升开发效率，缩短项目周期。

但现实却给了所有人一记清醒的耳光。行业调研数据显示，高达90%到95%的AI编码项目无法从试点阶段进入生产环境，多数项目在短短两周内就陷入停滞甚至直接废弃。这些项目不是不能运行，而是陷入了可怕的规模化陷阱，代码能跑却没人敢修改，能实现基础功能却无法支撑长期维护和迭代。当AI编程的蜜月期彻底结束，一个全新的开发理念开始登上舞台，它就是Spec-Driven Development，简称SDD，也就是规范驱动开发。

很多人会疑惑，同样是借助AI开发，为什么Vibe Coding会遭遇如此严重的滑铁卢，SDD又凭什么成为拯救AI编码项目的关键。想要弄清楚这个问题，我们必须先回到Vibe Coding的本质，看清它从风靡全网到暴露缺陷的完整过程。
在这里插入图片描述

一、Vibe Coding的狂欢与落幕，快开发背后的致命隐患

Vibe Coding这个概念的诞生，源于人工智能领域知名专家Andrej Karpathy的一条推文。这条内容简单直接，核心观点就是开发者不用过度纠结细节和逻辑，直接让AI根据模糊意图编写代码，只要能正常运行就可以。这种反传统的开发理念，瞬间点燃了整个技术圈的热情，短短时间内获得海量转发和认同。

在很多人看来，Vibe Coding完美契合了快速原型开发的需求。过去开发一个原型，需要开发者梳理需求、设计架构、编写代码、调试修复，整个过程耗时费力。而Vibe Coding把复杂的思考过程简化，开发者只需要给出大致想法，AI就能快速输出可执行代码，几分钟甚至几秒钟就能看到效果。对于追求速度的初创团队、个人开发者以及需要快速验证想法的项目来说，这种模式无疑是理想选择。

但随着应用场景的不断拓展，Vibe Coding的致命缺陷开始暴露无遗。多家权威机构的调研数据，揭开了AI编码项目的残酷真相。麦肯锡的报告指出，超过六成的企业表示，AI生成的代码在原型阶段表现优异，却完全无法满足生产环境的可维护性要求。高德纳的调研则显示，只有不到一成的技术决策者，会完全信任AI智能体输出的结果。

问题的核心不在于AI写不出能运行的代码，而在于Vibe Coding从根源上缺少关键环节。它的运行逻辑是输入模糊意图，输出可执行代码，AI只知道要实现什么功能，却不知道为什么要这样实现，更不清楚代码背后的业务逻辑、约束条件和扩展需求。

当项目规模停留在单个文件、单个功能时，这种模糊性带来的影响微乎其微。可一旦项目复杂度提升，涉及多个模块联动、多层架构设计、长期功能迭代时，模糊意图催生的就是模糊代码。这些代码没有清晰的设计思路，没有统一的规范标准，没有完整的逻辑说明，看似能正常运行，实则暗藏无数隐患。

开发者在维护和修改时，根本无法理解每一段代码的设计初衷，不知道修改一处代码会引发怎样的连锁反应。久而久之，没人敢轻易改动代码，没人敢新增功能，没人敢修复潜在漏洞，项目就此陷入停滞。这就是Vibe Coding无法跨越的规模化陷阱，也是95%的AI编码项目快速消亡的根本原因。

在这样的行业背景下，规范驱动开发SDD应运而生。它不是对Vibe Coding的全盘否定，而是对AI开发模式的补全和升级，让AI编码从单纯的快速原型开发，走向可规模化、可维护、可迭代的工程化开发道路。

二、规范驱动开发，让AI编码从随性走向规范

Spec-Driven Development的核心思想并不新颖，先编写规范，再编写代码，这是软件工程领域传承多年的基本原则。但在AI时代，这个理念被赋予了全新的价值和意义。

传统开发模式中的规范，更多是面向开发者的文档，用于统一开发思路、明确需求边界，作用是辅助人工开发。而SDD模式下的规范，不再是单纯给人阅读的说明文档，而是直接喂给AI的执行指令。它清晰定义项目的需求、目标、架构、约束、接口、测试标准等所有关键信息，让AI不再依靠模糊意图猜测开发需求，而是按照精准、完整的规范执行代码编写。

简单来说，Vibe Coding是让AI自由发挥，写出能跑的代码，SDD是给AI明确规则，写出好用、好改、好维护的代码。两者的核心区别，就像随意搭建的临时小屋和严格按照图纸施工的稳固建筑，前者能短期使用，却经不起时间和规模的考验，后者虽然前期需要投入更多精力规划，却能长期稳定运行，支持持续扩展。

从2025年下半年到2026年初，SDD作为AI工程化领域最核心的趋势，吸引了众多企业和开发者的关注，市场上也随之涌现出多个专业框架。这些框架基于不同的设计哲学，面向不同的应用场景，各有优势和局限，其中最具代表性的有五个，分别是GitHub Spec Kit、OpenSpec、Superpowers、AWS Kiro和Tessl。想要用好SDD，首先就要选对适合自己的框架。

三、五大SDD框架深度横评，找到适合自己的开发工具

1. GitHub Spec Kit，官方标准的野心与负担

GitHub Spec Kit是GitHub在2025年8月推出的官方SDD工具包，采用MIT开源许可，发布后迅速收获五万多Star，成为行业内关注度最高的框架之一。

它的核心是一套完整的四阶段流水线，第一阶段是Specify，由开发者描述项目目标和用户旅程，AI智能体自动起草详细的规格文档。第二阶段是Plan，开发者声明架构、技术栈和约束条件，AI生成对应的技术方案。第三阶段是Tasks，AI把整体工作拆解成细小、可独立验证的任务单元。第四阶段是Implement，按照任务逐步实现代码并完成验证。

作为GitHub官方推出的工具，Spec Kit的优势十分突出。它拥有官方背书，兼容性极强，能够适配Copilot、Claude Code、Gemini CLI、Cursor等17种以上主流AI工具，同时跨平台支持Unix Shell和Windows PowerShell，满足不同开发者的使用习惯。

但优势背后，也存在明显的问题。Martin Fowler团队的专家在深度评测中明确指出，Spec Kit在运行过程中会生成大量重复的Markdown文件，审查体验极差，很多开发者表示宁愿直接审查代码，也不想面对这些繁琐的文档。此外，社区对其维护活跃度的质疑也不断出现，影响了大型团队的长期使用信心。

综合来看，GitHub Spec Kit更适合大型团队的新项目启动，以及需要建立标准化开发流程的企业环境。

2. OpenSpec，轻量高效的棕地项目优先方案

与Spec Kit的重型标准化路线不同，OpenSpec由Fission-AI开发，走的是轻量级、轻量化的路线，核心设计哲学是Brownfield-First，也就是棕地项目优先。

在实际开发场景中，大多数团队面对的不是从零开始的绿地新项目，而是已经拥有数万行甚至更多代码的棕地项目，这类项目的核心需求是持续演进和优化，而非重新搭建。OpenSpec正是针对这一痛点设计，它的Spec文件可以和代码存储在同一个仓库中，按照项目能力进行组织，上下文信息不会因为聊天会话结束而丢失，完美适配已有代码库的开发需求。

它的工作流简洁清晰，发起变更，创建提案、规格、设计、任务等相关产物，实现具体任务，归档并合并Spec文件，全程没有复杂的流程和冗余的文件。同时，OpenSpec使用门槛极低，不需要API密钥，不需要MCP协议，安装完成就能直接使用，支持20种以上开发工具，灵活度极高。

不过轻量灵活也带来了一定的短板，OpenSpec缺乏强制约束机制，完全依靠团队的自律性。对于开发规范严谨、自律性强的团队来说，它是高效工具，但对于纪律性不足的团队，可选的规范等同于没有规范，无法发挥SDD的真正价值。

OpenSpec的适用场景非常明确，就是已有代码库的持续演进，以及追求快速迭代的中小团队。

3. Superpowers，Claude生态的全栈工作流引擎

Superpowers是由Best Practical Solutions创始人Jesse Vincent打造，专门为Claude Code设计的技能框架，它不只是一个简单的Spec工具，而是一套完整的开发工作流引擎。

它的核心机制极具特色，首先是可组合技能，技能可以自动激活，全程引导开发流程，规范开发者的操作步骤。其次是Spec提取与审查，自动从对话中提取规范内容，分段展示给开发者审阅确认，避免信息遗漏和理解偏差。最重要的是，它强制推行TDD测试驱动开发，严格遵循红黄绿重构循环，先编写失败的测试用例，看到测试失败，再编写最少代码让测试通过，最后进行代码重构，从根源上保障代码质量。

此外，Superpowers还采用双阶段审查模式，每个子任务完成后，先检查规范合规性，再检查代码质量，双重保障开发结果。同时支持子智能体调度，自动创建git worktree，把任务并行分发给子智能体，提升开发效率。

为了验证框架的有效性，开发者还利用说服力原则进行测试，结果证明Claude Code会严格遵守Skills设定的规则，把它当作权威参考，而非可选建议。

但Superpowers的局限性也很明显，它深度绑定Claude Code生态，不支持其他AI工具，使用场景相对受限。它更适合Claude Code的重度用户，以及对代码质量有极高要求的个人开发者和小型团队。

4. AWS Kiro，IDE集成的极简务实选择

AWS Kiro是AWS推出的AI编码IDE，它把SDD流程直接嵌入开发环境，走极简务实的路线，是所有主流框架中最轻量的SDD实现。

对比Spec Kit生成大量文档的繁琐设计，Kiro全程只生成三个Markdown文件，分别是需求文档、设计文档和任务文档，精简到极致，避免了审查过载的问题。它的工作流只有三步，需求梳理，设计规划，任务执行，每一步都由AI生成内容，开发者负责审查确认，学习成本极低。

Kiro最大的优势在于原生集成VS Code开发环境，完全贴合开发者的日常使用习惯，不需要额外适应新的操作界面。它的规范文件相当于超级提示词，直接作为AI的执行上下文，简洁高效，能快速落地SDD理念。

但极简设计也带来了一定的弊端，Martin Fowler团队指出，Kiro的固定工作流对小型修复任务显得过度设计。比如只是修改一个CSS颜色，也要走完需求、设计、任务的完整流程，反而降低了开发效率，增加了不必要的繁琐步骤。

AWS Kiro适合AWS生态的用户，以及偏好IDE集成体验、追求极简开发流程的团队。

5. Tessl，规范即源代码的激进实验

Tessl是所有SDD框架中最特殊、最激进的一个，它大胆尝试Spec-as-Source路线，也就是规范即源代码，彻底颠覆传统开发模式。

在传统开发模式中，开发者优先编写代码，文档往往被忽略，随缘补充。在SDD模式中，开发者先编写规范，再根据规范编写代码。而Tessl更进一步，直接规定开发者只需要编辑规范，所有代码都由AI自动生成，规范成为项目的核心源文件，代码只是规范的附属产物。

这种模式足够激进，也充满争议。Martin Fowler把它和2000年代的模型驱动开发MDD对比，当年的模型驱动开发承诺绘制UML图就能生成代码，最终因为抽象层级过于笨重而失败。大语言模型虽然解决了模型驱动开发的部分约束问题，却引入了非确定性风险，用专家的评价来说，Tessl可能兼具了灵活性不足和非确定性的双重缺点。

目前Tessl还处于试验阶段，社区活跃度较低，适用场景非常有限，只适合愿意尝试前沿技术、敢于押注未来的早期采用者。

为了更清晰地对比五大框架的差异，我们可以从多个维度总结，Spec Kit是重量标准化，兼容多工具，学习成本中等，适合大型新建项目，约束性强。OpenSpec是轻量灵活，兼容多工具，学习成本低，适合中小型已有项目，约束性弱。Superpowers聚焦TDD加技能组合，仅支持Claude Code，学习成本中高，适合追求质量的中型项目，约束性强。Kiro是IDE原生极简，学习成本低，适合各类规模项目，约束性中等。Tessl是规范即源代码，专属平台，学习成本高，仅适合实验性项目，约束性极强。

四、理性看待SDD，专家警告与真实数据的双面启示

当SDD成为行业热门趋势，无数人开始追捧这种全新的开发模式时，行业内也出现了理性的声音。Martin Fowler团队的Birgitta Böckeler发布了一篇深度分析文章，用德语词Verschlimmbesserung形容SDD，这个词的意思是越改越坏的改进，给狂热的行业泼了一盆冷水。

Birgitta Böckeler把SDD分为三个递进层级，第一层是Spec-First，先写规范再写代码，完成后规范可以丢弃，目前主流的Spec Kit、OpenSpec、Kiro都属于这个层级。第二层是Spec-Anchored，规范会保留下来，用于后续的维护和功能演进，Superpowers的技能体系接近这个层级。第三层是Spec-as-Source，规范就是核心源文件，只有Tessl在尝试这个层级。

核心发现是，SDD的层级越高，理论上能带来的收益越大，但在实际应用中遇到的问题也越多。

首先是审查过载问题，以Spec Kit为代表的重型框架，每个阶段都会生成大量文档，开发者审查这些规范文件花费的时间和精力，远远超过直接审查代码，SDD原本的目的是减少返工、提升效率，结果反而变成了额外的负担。

其次是AI可控性悖论，很多人认为规范越详细，AI就会越听话，执行越精准。但实际测试结果恰恰相反，AI依然会出现忽视指令、过度执行的情况，规范的冗长程度和AI的遵从程度之间，并没有线性关系。这也是Superpowers放弃过度细化规范，转而用TDD和双阶段审查强制验证结果的原因，与其寄希望于AI读懂所有规范，不如用测试直接证明AI执行正确。

最后是工作流通用性问题，现有所有SDD工具都存在一个共同盲点，它们默认所有开发任务都需要完整的SDD流程，但现实开发中，绝大多数任务都是简单的小型修改和修复，根本不需要启动完整的规范设计流程。缺乏根据任务复杂度自动调整工作流深度的能力，让SDD在简单场景中显得画蛇添足。

除了专家的理性警告，我们也可以通过真实数据，看清SDD的实际价值。多个独立调研显示，SDD能带来显著的优化效果，生产环境的缺陷数量减少40%到60%，重构时间降低50%，项目交付速度提升30%，编程时间减少56%，产品上市时间缩短30%到40%，两年内的开发成本降低20%到30%。

但这些正面数据也存在明显的局限，一是样本偏差，发布数据的多为SDD工具厂商或合作伙伴，中立第三方的评价更保守。二是项目类型偏差，成功案例多集中在中大型新建项目，针对已有代码库的改造数据非常稀缺。三是对照组模糊，数据对比的基准不明确，和完全无规范的Vibe Coding对比，还是和传统软件工程流程对比，结论天差地别。

综合专家观点和真实数据，我们能得出一个关键结论，SDD不是要不要采用的问题，而是什么时候用、怎么用的问题。它的效果完全取决于项目规模、团队经验、AI工具成熟度三个变量的交叉影响。单文件脚本类项目完全不需要SDD，多模块系统类项目高度需要SDD。资深工程师自带规范思维，轻量SDD即可，新手团队需要强制规范约束。AI工具的不断升级，也让SDD的执行效果持续提升。

五、渐进式Spec，SDD落地的最佳实践方案

结合行业实践、框架对比和专家分析，我始终认为，SDD的方向完全正确，但当前市面上的工具普遍陷入了过度设计的误区。

回顾软件工程的发展历史，每隔十年就会出现一次用更多流程解决流程不足的循环，瀑布模型、RUP、CMMI都曾走过这条路，最终都因为过于笨重、限制创造力而被淘汰。SDD如果一味追求重型流程、强制规范、冗余文档，很有可能重蹈覆辙，从提升效率的工具，变成阻碍开发的负担。

想要让SDD真正发挥价值，避免陷入过度设计的陷阱，渐进式Spec是目前最务实、最高效的落地方案。简单来说，就是根据项目的阶段、规模、类型，灵活选择SDD的应用深度，不搞一刀切，不盲目套用重型流程。

具体的实践方案可以分为四个层级。第一，原型验证阶段，代码量不足1000行的项目，继续使用Vibe Coding，不折腾任何规范流程，直接使用Claude Code、Cursor等工具裸用，核心目标是快速验证想法可行性。第二，功能迭代阶段，代码量在1000到10000行之间的项目，采用轻量Spec加TDD模式，选择OpenSpec或Superpowers，平衡规范和效率。第三，系统构建阶段，代码量超过10000行的大型项目，引入完整的SDD流水线，选择Spec Kit或Kiro，保障项目的可维护性和可扩展性。第四，已有代码库改造项目，坚持棕地项目优先理念，直接选择OpenSpec，适配现有代码环境。

很多人会问，为什么不推荐所有项目都使用Spec Kit这样的完整框架。原因很简单，过度的流程是创造力的天敌。原型阶段的核心是速度，是快速试错，这时候花费大量时间编写规范文档，就是用流程杀死创新。只有当项目验证可行性，进入工程化、规模化阶段后，规范的价值才会凸显，这时候引入SDD约束，才是符合开发规律的选择。

对于Tessl的规范即源代码路线，我持谨慎观望的态度。Martin Fowler的历史类比极具说服力，当年模型驱动开发的美好承诺最终落空，如今规范即源代码的激进理念，同样需要大量实践验证。虽然大语言模型解决了过往的部分问题，但非确定性风险依然存在，现在就全面押注为时过早，但我们也不能完全否定它的未来潜力。

如果团队没有精力深入研究所有框架，只想快速选择一个合适的工具，也可以按照简单的标准判断。Claude Code重度用户，直接选择Superpowers，它的TDD强制约束、双阶段审查和可组合技能，能最大化提升代码质量。使用多种AI工具的混合团队，选择OpenSpec，轻量、灵活、兼容性强，完美适配棕地项目。大型企业需要标准化开发流程，选择Spec Kit，官方背书和多工具兼容，能满足企业级标准化需求。

六、SDD对不同角色的真实价值与行动建议

SDD的兴起，不仅改变了开发模式，也对不同角色的从业者产生了深远影响，每个角色都应该找到自己的定位和行动方向。

对于技术负责人和CTO来说，不要盲目跟风推行SDD，也不要完全否定SDD的价值。核心是判断项目阶段，团队还在使用Vibe Coding做原型验证时，不用急于引入SDD，避免流程拖累速度。当团队开始为AI代码的维护、迭代发愁时，SDD就是最成熟的解决方案，同时要根据团队规模、项目类型选择合适的工具，不搞重型流程一刀切。

对于工程师和架构师来说，不用一开始就搭建完整的SDD流水线，可以先从Superpowers或OpenSpec入手，体验规范驱动开发的节奏，理解SDD的核心价值。SDD的本质不是流程，而是强迫开发者在写代码前想清楚所有问题，这本来就是优秀工程师的必备习惯，SDD只是用工具把这种习惯标准化、落地化。长期坚持，不仅能提升AI代码质量，还能反向提升自身的架构设计和需求梳理能力。

对于普通AI编程爱好者来说，不用纠结于复杂的框架和流程，只要理解SDD的核心理念就足够。很多人使用AI写代码时，都会遇到第一版惊艳，修改几次就崩溃的问题，这不是AI工具的问题，而是没有给AI清晰的约束和上下文。哪怕不使用任何SDD框架，在让AI写代码前，先简单梳理需求、明确功能、说明约束，就能大幅提升代码质量，减少后期维护的麻烦。