重构软件开发的权力格局：从TDD、DDD到AI时代的SDD，哪种才是你的工程哲学？

十年前，TDD让我们重写测试如同推翻巴别塔；三年前，DDD试图用领域语言统一产品与技术的分歧；今天，SDD直接把“规范”变成可执行的源代码，AI成为这个新世界的翻译官。上周团队来了个新人，对着我们基于DDD设计的微服务架构一脸困惑：“这服务划分的依据是什么？这个聚合根的边界怎么定的？”我让他看领域文档，他翻了几页：“这些和代码对不上啊，上次重构后就没更新了吧？这一瞬间，我突然意识到，我们可能站在又

m0_37663100

1668人浏览 · 2026-01-03 10:23:19

m0_37663100 · 2026-01-03 10:23:19 发布

重构软件开发的权力格局：从TDD、DDD到AI时代的SDD，哪种才是你的工程哲学？

十年前，TDD让我们重写测试如同推翻巴别塔；三年前，DDD试图用领域语言统一产品与技术的分歧；今天，SDD直接把“规范”变成可执行的源代码，AI成为这个新世界的翻译官。

上周团队来了个新人，对着我们基于DDD设计的微服务架构一脸困惑：“这服务划分的依据是什么？这个聚合根的边界怎么定的？”我让他看领域文档，他翻了几页：“这些和代码对不上啊，上次重构后就没更新了吧？”

这一瞬间，我突然意识到，我们可能站在又一个范式革命的临界点。

01 演化史：从测试优先到规范即代码

2000年左右，Kent Beck提出TDD时，它的核心很激进：先写测试，再写实现。这在当时绝对是个异类——哪有还没写代码就先想怎么测试的？

可问题恰恰在这里：传统开发中，测试往往是最后一步，经常被挤压甚至忽略。

TDD的诞生，本质上是对“测试是二等公民”这一现状的反抗。它不只是个技术实践，更是一种开发哲学：通过可执行的测试用例来明确需求。

大约2003年，Dan North在TDD基础上提出了BDD。他发现许多开发者和业务人员对“测试”这个词有心理抵触，于是把焦点从“测试”转移到“行为”上。

BDD的核心是用业务人员和开发者都能理解的自然语言描述系统行为。那时候流行的工具是Cucumber，那些“Given-When-Then”的语句，我第一次见到时觉得“这玩意儿太形式主义了吧”。

有趣的是，DDD在同一时期也在兴起。Eric Evans在2003年出版的《领域驱动设计》中，直击了当时企业软件开发的核心痛点：业务逻辑与技术实现之间的巨大鸿沟。

回忆一下：你们团队的产品经理有没有说过“这个需求很简单，就加个按钮”？技术实现时才发现背后涉及三个服务的数据一致性？

DDD的核心理念是用“通用语言” 在业务和技术团队间建立沟通桥梁，通过战略设计和战术设计，让软件结构反映业务本质。

02 SDD：AI时代的新范式

到了AI编程时代，问题变得更加尖锐。SDD正是在这样的背景下崛起的。

SDD的核心是规范即真理，代码只是规范在特定语言和框架中的表达。

这不只是个技术上的小调整，而是权力关系的根本反转。

几十年来，代码一直是软件开发的核心资产。PRD、设计文档这些“规范”类的东西，往往是写出来就没人看，代码改了一轮又一轮，文档还停留在最初版本。

SDD打破了这种局面：规范成为单一事实来源。

更重要的是，现在的AI已经能理解并实现复杂的规范。规范不再只是给人看的文档，而是可以直接“喂”给AI生成代码的“可执行蓝图”。

03 理念差异：四种方法的核心对比

方法	核心关注点	核心产出	适合场景	典型工具/框架
TDD	代码正确性	测试用例 + 实现代码	函数/模块级别开发	JUnit, pytest, Mocha
BDD	系统行为	行为描述 + 可执行规格	端到端功能验收	Cucumber, Behave, SpecFlow
DDD	业务领域建模	领域模型 + 限界上下文	复杂业务系统设计	无特定工具，是一套方法论
SDD	规范完整性	可执行规范 + 生成代码	AI辅助的现代开发	OpenSpec, Spec Kit, BMad

TDD像是在拼图：你先确定每一块的边缘形状（测试），再去找能匹配的图案（实现代码）。

它的局限性也很明显：测试用例毕竟只是“点”的验证，难以确保整体业务逻辑的连贯性。

BDD前进了一步，它关注的是“用户能看到什么，系统应该有什么行为”。

但我得实话实说：在不少项目中，那些精心编写的.feature文件最后变成了另一种形式的“过时文档”，因为维护成本太高。

DDD试图解决更深层的问题：如何让软件架构反映业务本质？它提出了限界上下文、实体、值对象、聚合、领域服务等一系列概念，试图在业务复杂度和技术实现之间建立映射关系。

实际项目中，DDD最难的不是概念理解，而是如何保持领域模型与代码实现的一致性。

模型讨论会上画了一堆精美的图，两周后代码就偏离了最初的设计——这场景熟悉吗？

SDD采取了截然不同的路径。它不试图让代码去“反映”某个模型，而是让规范成为事实来源，代码只是规范的“快照式实现”。

说得更直白点：在SDD中，如果你要改功能，不是直接改代码，而是改规范，然后重新生成代码。

04 实战场景：何时用哪种方法？

适用TDD的场景

我一般会在这些情况下用TDD：

算法实现：比如写个复杂的排序算法或者数据处理逻辑
工具库开发：确保每个函数在各种边界条件下都正确
遗留代码重构：加测试保护已有的行为

# 典型的TDD流程示例：实现一个字符串计算器
# 1. 先写测试
def test_empty_string_returns_zero():
    assert add("") == 0

def test_single_number_returns_itself():
    assert add("1") == 1

def test_two_numbers_comma_delimited():
    assert add("1,2") == 3

# 2. 实现最简单的可通过代码
def add(numbers: str) -> int:
    if not numbers:
        return 0
    if "," in numbers:
        nums = numbers.split(",")
        return int(nums[0]) + int(nums[1])
    return int(numbers)