AI 已从“前沿探索”变成软件研发的日常工具,但在我接触的大量中国企业里,管理层对它的期待与现实体验,往往并不一致。最新发布的 DORA 2025 报告,给我们提供了一套相对冷静、基于证据的视角:AI 到底改善了哪些研发效能指标,又在哪些地方制造了新的不稳定?本文尝试站在中高层管理者与 PMO 的角度,对这些关键发现做一次系统梳理,帮助你用更务实的方式审视 AI 研发效能。

从“要不要上 AI”,到“AI 已经无处不在”

过去两年,我在不同规模和行业的客户现场听到最多的两个问题是:

  • “我们是不是也该搞点 AI,别被落下?”
  • “AI 研发效能到底有没有实打实的提升?”

DORA 2025 的数据,至少可以帮我们回答第一部分——这已经不是“要不要上 AI”的问题,而是“你有没有能力驾驭 AI”的问题。

1. AI 使用已经成为软件研发的“新默认”

DORA 报告显示:在 2022 年,开发者使用 AI 还算新鲜事,如今超过 90% 的技术专业人员会在工作中使用 AI 工具;其他行业调研也表明,84% 的开发者正在使用或计划使用 AI 工具进行开发。

这背后还有两组值得管理层注意的信号:

  • 企业层面:88% 的企业领导者表示,加速 AI 采纳是优先事项,2024 年全球企业在 AI 上的总投资达到 2523 亿美元,同比增长 26%。
  • 招聘层面:包含“生成式 AI 技能”的职位发布量在一年内增长了 300%+。

换句话说,无论你个人是否乐观,AI 已经是大多数研发团队的“日常基建”,而不是未来时的选配项。

2. 但“广泛采纳”不等于“广泛价值”

虽然上面提到 AI 已经是大多数研发团队的“日常基建”, DORA 报告中同时也提醒我们:

很多企业的 AI 计划仍然是由“FOMO(错失恐惧症)”驱动,而不是深思熟虑的战略。

这句话对国内环境尤为适用。在不少客户现场,我看到的 AI 项目是这样推进的:

  • 由上而下定一个目标:“要在某某大会上讲我们也在用 AI”;
  • 集中采购一批许可证,安排几轮培训;
  • 要求研发部报“节省了多少人天”“代码产出提升了多少”。

许可证买了、插件装了、分享会开了,开发者主观上觉得好像更快了。短期看,这类项目有一些可展示的成果;但长期看,它们往往没有改变组织的 AI 研发效能——也就是没有在交付节奏、质量稳定性、价值流效率上留下清晰的改善轨迹。

AI 真正改善了哪些“研发效能”指标?

DORA 团队这次用了一个相对严谨的方式:在控制环境和流程等因素之后,比较同类人群中 AI 采纳程度不同的人,看他们在各类结果上的差异。它没有停留在“开发者好感度调查”,而是尝试用多维度指标去刻画“AI 研发效能”的真实变化。

1. 个体视角:生产力与代码质量的真实提升

在个人层面,AI 研发效能的提升是被数据反复验证的。

DORA 发现,在其它条件相同的情况下,AI 采纳程度越高的从业者,越有可能报告更高的个人效能和代码质量。比如:

  • 更高水平的个人效能;
  • 更高比例的时间用于“有价值的工作”;
  • 更高水平的代码质量;
  • 更高水平的团队效能、组织效能以及产品效能;
  • 更高的软件交付吞吐量。

用大白话讲,就是:

AI 让开发者更容易把时间花在“创造价值”的事情上,而不是机械劳动上;同时对代码质量和产品结果,也有统计意义上的正向影响。

这与我在客户现场的观察基本一致:当团队已经有一定的工程基础,AI 非常擅长削减“边角料工作”——写重复代码、整理接口文档、生成简单测试、起草方案初稿。让骨干可以把精力更多放在架构决策、复杂场景和跨团队协作上——这才是真正的 AI 研发效能

2. 组织视角:效能的多个维度“同时变好”

如果把视角从个体拉到组织,DORA 进一步指出:在具备一定基础设施和管理成熟度的前提下,AI 采纳度更高的团队在组织效能、团队效能、产品效能和交付吞吐量上整体表现更好

这说明,只要底层没有严重短板,AI 研发效能的提升是可以传导到业务侧的,而不是只停留在“个人自我感觉良好”。

我通常会建议管理层,把这部分效应理解为:

AI 不会帮助一个混乱的组织“起死回生”,但会显著放大一个本来就走在正确方向上的组织的优势。

AI 没有解决的三个问题:摩擦、倦怠与不稳定性

然而,DORA 也非常坦诚地展示了另外一面——有些问题,采用 AI 后几乎没有动静,甚至在恶化。

1. 摩擦与倦怠:这是组织问题,不是工具问题

DORA 报告显示,AI 采纳程度与“工作摩擦”和“职业倦怠”的改善几乎没有显著相关性。——换句话说,用不用 AI,大家吐槽流程、抱怨疲惫的程度差不多。

DORA 给出的解释是:

这些结果更多是“社会技术系统”(流程 + 文化)的产物,即流程、结构和文化共同作用的结果。超出了个体开发者能够左右的范围。

这非常符合国内很多研发团队的现实:

  • 需求变更频繁、优先级经常反复拉扯;
  • 评审链路长、审批层级多,决策迟缓;
  • 跨团队协作模糊,职责边界不清晰;
  • 指标压力只下沉不共担。

在这种场景下,你即便给每个人配一个顶级 AI 助手,他也最多只能帮你“更快地做完错误的事”。

从组织治理角度看,这组数据在提醒管理层:

不要指望用 AI 来弥补结构性问题——那些问题需要的是决策机制调整、权限划分与流程重构,而不是一个更聪明的编辑器。

2. 软件交付不稳定性:AI 把“隐性风险”提前暴露

更值得警惕的一点是:AI 与“软件交付不稳定性”的上升存在统计相关性

2024 年的 DORA 研究曾指出:当 AI 采纳率每增加 25%,如果不配套改进交付体系,会出现“交付吞吐量平均下降 1.5%,不稳定性上升 7.2%”的反常现象。

2025 年的情况好一些——吞吐量开始提升,但不稳定性问题依然没有根本好转

原因其实不难理解:

  • AI 把“写代码的门槛”进一步放低了,让开发者更容易做出“更大体量的变更”;
  • 但测试自动化、灰度发布、监控与回滚能力,如果仍停留在“人肉 + 手工”的旧时代,系统自然会变得更脆弱。

DORA 的表述是:AI 目前主要集中在“键盘端”,因此提升了代码质量和生产力,但没有触及引发摩擦、倦怠和不稳定性的那些深层结构。

如果管理层只看到 AI 研发效能带来的“提速”,却忽略了不稳定性与隐性风险的叠加,就很容易在一年后迎来一波“质量与运维事故的反噬”。

AI 是“放大器”而不是“银弹”:七项能力与七类团队

DORA 在摘要部分给技术领导者提了一个非常重要但容易被忽略的结论:

成功的 AI 采纳是一个系统问题,而非工具问题。

这句话背后,有两个关键支点。

1. 七项 AI 能力:决定 AI 研发效能的“上限”

今年 DORA 报告的一个重要成果,是首次提出了 DORA 人工智能能力模型,总结出七项能显著放大 AI 效益的能力,其中几项与 AI 研发效能直接相关的包括:

① 明确且已共识的 AI 立场

  • 是否有清晰的 AI 使用政策;
  • 员工是否知道哪些场景可以大胆试验,哪些场景必须严格审慎。

② 健康的数据生态系统 & AI 可访问的内部数据

  • 内部数据(代码库、文档、工单、日志)是否干净、可访问、结构化;
  • AI 是否能安全访问这些内部信息,而不仅仅停留在“通用聊天机器人”。

③ 稳健的版本控制 + 小批量工作模式

  • 团队是否鼓励小步提交、频繁集成;
  • 出现问题时,能否快速精准地回滚到安全版本。

④ 以用户为中心的关注点与高质量内部平台

  • 研发是否真正围绕用户价值做优先级决策;
  • 是否存在一个统一的内部平台,为开发者提供统一入口、统一规范。

从 AI 研发效能的角度看,这些能力决定了本一家企业的“研发效能上限”,AI 只是让你更快地触碰那个上限——是高是低,取决于你之前打的地基。

2. 七类团队:先知道自己在哪里,再谈要去哪里

另一方面,DORA 还基于研发效能结果,比如吞吐量、不稳定性、团队效能、产品效能、摩擦、倦怠等维度,将团队划分为七类典型画像,从“和谐高成就者”到“遭遇基础性挑战者”。

有两个关键观察值得管理层重视:

  • 最佳表现者(聚类 6 与 7)能够在“速度”和“稳定性”两个维度上同时取得卓越成绩,占样本近 40%。
  • 另一端的团队(例如聚类 1、聚类 4),要么深陷基础问题,要么“高影响低节奏”,速度缺乏稳定性,是危险且不可持续的状态。

这直接打破了一个传统迷思:速度与稳定性不是天然对立的,优秀团队完全可以两者兼得。

而 AI 在这里扮演的角色,很可能是:

  • 对于已经接近聚类 6/7 的团队,AI 是一个加速器,可以进一步放大 AI 研发效能;
  • 对于停留在聚类 1/2 的团队,AI 可能只是把问题“放大并提前暴露”——这未必是坏事,但如果管理层没有系统观,就容易误以为“AI 没用,甚至添乱”。

因此,在设计 AI 路线图之前,最重要的一步其实是:搞清楚自己属于哪一类团队,而不是“简单抄一份别家的 AI 方案”。

这一点,我会留到下一篇文章中,用专门的一篇来展开。

给中高层和 PMO 的三点行动建议

站在项目治理与组织效能的角度,结合 DORA 2025 的数据和本土实践,我会给中高层和 PMO 三个相对直接的建议。在规划 AI 研发效能提升时,至少考虑以下三件事。

1. 把 AI 项目从“工具采购”升级为“交付系统重构”

如果你的 AI 项目目标只有两条:

  • 采购若干 AI 工具或平台;
  • 证明“我们也在用 AI,且节省了 X% 人力”。

那么在 DORA 的体系中,你大概率会落入那类高不稳定性、低可持续性的组织。

更健康的 framing 应该是:

我们希望能借助 AI 这次契机,整体升级软件交付系统

这意味着,AI 规划要与以下议题强绑定:

  • 系统架构是否支持小批量、易回滚的变更;
  • 测试与发布流水线是否足够自动化、可观测;
  • 需求管理、优先级机制是否真正以用户和业务价值为导向。

2. 用价值流管理,把 AI 接入“端到端”

DORA 用大量数据证明:价值流管理(VSM)可以显著提升团队效能、有价值工作时间与产品效能,是 AI 投资的放大器。

一个可操作的小步骤是:

  1. 选一个有代表性的产品或系统;
  2. 让产品、研发、测试、运维、安全坐在一起,用一张 A3 纸画出当前从“想法”到“上线”的全过程;
  3. 标注每个环节的平均等待时间、返工率以及常见摩擦点。

在这张图出来之前,不要急着讨论“用哪种 AI 工具”,否则你很可能在非瓶颈环节取得漂亮的局部优化,却看不到整体 AI 研发效能的提升。

3. 把平台工程与数据治理当成 AI 成功的“基础设施项目”

最后,DORA 明确指出:

  • 90% 的企业已采用平台工程,76% 拥有专职平台团队;
  • 高质量内部平台能显著增强 AI 对组织效能的正面影响,是 AI 成功应用的关键基础。

同样,健康的数据生态也是七项 AI 能力中的核心一环:高质量、可访问、一致性的内部数据,直接决定 AI 能否从“聪明玩具”变成“业务助手”。

对管理层来说,这意味着:

  • 如果你没有统一的内部开发者平台,AI 工具只会进一步加剧“工具碎片化”和“协作割裂”;
  • 如果你的数据分散在多个孤岛,质量参差不齐,AI 再强也只能给你生成“看起来聪明但不可信”的回答。

因此,把 AI 项目的预算单独拎出来讨论往往是陷阱。更务实的做法,是把平台工程建设、内部数据治理、AI 能力接入与治理,视为同一个“AI 研发效能基础设施项目”的三个侧面。

结语:管理者需要的,是“更清醒的系统观”

DORA 2025 带来的最大价值,不在于告诉我们“AI 很重要”(这一点你可能早就感受到了),而在于用数据提醒我们:

  1. AI 能显著提升个体与组织的研发效能,但前提是底层系统足够健康。
  2. 工作摩擦、职业倦怠和交付不稳定性,是组织结构与文化的结果,不会因为买了 AI 工具自动消失。
  3. 真正优秀的团队,可以在高吞吐与高稳定之间实现双赢,关键在于你有没有勇气用系统工程的方式重构交付体系。

作为中高层管理者与 PMO,如果你把 AI 看成一场 “交付系统升级”与“组织能力重塑” 的契机,而不是一轮工具采购,这场变革将更有可能为你的企业带来长期的 AI 研发效能优势。

在下一篇文章中,我会结合 DORA 2025 提出的七类团队画像模型,进一步展开讨论:

  • 如何判断你的团队属于哪一种类型?
  • 不同类型在上 AI 时应该先补哪些课、踩哪些刹车?
  • 如何在不透支团队的前提下,逐步提升 AI 研发效能?

敬请留意下一篇:《DORA 2025:基于七类团队画像的 AI 研发效能诊断方法》

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐