AI与人协同：开发领域的转型实践与深度思考

本文分享了AI与开发者协同工作的实践经验与思考。作者通过PostgreSQL批量写入优化、企业微信消息推送系统设计等案例，展示了AI在方案设计、代码生成、测试验证等场景中的价值，总结出"发散-收敛-细化"的协同模式。文章指出LLM本质是概率预测器而非理解者，其成功率随任务复杂度呈指数级下降，因此需要构建"人机协同"新范式：通过确定性优先、减少可能性空间、阶段

ezreal_pan

622人浏览 · 2026-01-22 13:46:59

ezreal_pan · 2026-01-22 13:46:59 发布

在AI技术飞速迭代的今天，大语言模型（LLM）已从概念走向实操，逐渐渗透到开发全流程。但很多开发者仍面临困惑：AI究竟是提效神器还是潜在“坑点”？如何让AI真正成为合格的协作伙伴而非单纯的工具？本文结合笔者在项目中的真实实践，从案例落地、技术本质、协同范式到未来规划，分享AI与人协同开发的核心经验。

一、我的AI实践：从案例中探索协同价值

在实际开发中，我将AI作为“结对编程伙伴”，在方案设计、代码生成、测试验证等场景中深度应用，总结出一套“发散-收敛-细化”的协同模式。

1. 技术方案设计：拓宽思路，精准破局

在PostgreSQL批量写入优化和企业微信消息推送系统设计两个核心场景中，AI发挥了关键的思路拓展作用。

PostgreSQL批量写入优化：项目中遇到“一次性写入数据过多导致参数超出65535限制”的问题，常规方案是数据切割分批写入。通过与AI讨论，发现了更优的copy方案——基于二进制协议的批量写入方式，借助github.com/lib/pq库实现高效数据插入，避免了分批写入的频繁连接开销。AI不仅提供了方案思路，还详细解释了二进制协议的底层原理和代码示例，让方案落地效率大幅提升。

在这里插入图片描述

企业微信消息推送系统设计：核心需求是解耦规则与执行流程，避免并发冲突。最初计划基于事件溯源（ES）架构实现，但受限于时间紧、任务重，无法完整落地消息队列驱动的全流程。通过与AI探讨，最终采用“规则+任务”的简化架构：定时任务生成task（仅新增不删改），通过乐观锁控制并发执行，对比任务创建时间与规则更新时间判断有效性。AI在此过程中不仅补充了ES架构的核心思想，还提供了并发控制、状态校验的具体实现思路，帮助我在简化方案的同时规避了关键风险。

在这里插入图片描述

2. 单元测试与代码生成：提效不丢精度

开发中最耗时的重复工作，往往是单元测试编写和标准化代码生成，而AI恰好能在此类场景中发挥优势。

单元测试自动生成：针对ParseExtCouponReverseResponse方法编写单元测试时，AI先帮我梳理了Response结构体定义和方法逻辑，然后基于“空响应、正常数据、异常格式”等场景，自动生成了包含测试用例名称、输入参数、预期结果和描述的完整测试代码框架。我只需在此基础上补充边界场景验证，测试覆盖率从60%提升至95%，效率提升近3倍。

在这里插入图片描述

repository层代码智能生成：基于GORM框架开发orgsvc项目时，我创建了“repository层代码生成助手智能体”。通过给AI明确角色定位（适配PostgreSQL的GORM代码专家）和严格规范（包命名、导入分组、错误处理、内部包路径），AI能快速生成符合项目标准的仓库层代码。例如批量创建、条件查询等重复逻辑，AI生成的代码完全遵循“内置包→第三方包→项目内部包”的导入规范，包含完整的Context传递和错误处理，无需二次修改即可集成，极大减少了重复劳动。

在这里插入图片描述

3. AI结对编程的核心流程

经过多次实践，我总结出AI结对编程的四步流程，确保协同效率最大化：

讨论方案：动手前与AI探讨技术选型（如并发解决方案、架构设计），拓宽思路边界；
拆解需求：将复杂任务拆分为小模块，让AI生成特定功能代码，并行推进开发；
代码评审：提交代码给AI进行性能、可读性分析，获取优化建议（如循环优化、错误处理规范）；
知识问答：遇到陌生技术点（如PostgreSQL二进制协议、ES架构细节），随时向AI请教，加速学习曲线。

二、看透LLM的本质：理解局限才能用好AI

在享受AI提效的同时，我们必须清醒认识到其本质与固有困境，避免陷入“盲目依赖”的陷阱。

1. LLM的本质：概率预测器而非“理解者”

LLM的核心工作逻辑是计算下一个Token在当前上下文的概率分布，其强大能力源于对海量文本数据中统计规律的捕捉，而非对世界的真正“理解”。例如输入“我爱你”，LLM预测概率最高的后续词汇是“中国”，仅因为该组合在训练数据中出现频率最高，而非存在逻辑关联。

这种本质决定了AI的输出是“统计上合理”而非“逻辑上正确”，这也是为什么AI会在复杂逻辑中出现看似低级的错误。

2. 不可回避的困境：pⁿ成功率衰减

理解了概率本质后，一个残酷的数学现实浮出水面：复杂任务的成功率会随步骤增加呈指数级下降。假设AI每一步的正确率为95%，那么：

10步任务的成功率仅为60%（0.95¹⁰≈0.6）；
20步任务的成功率降至35%（0.95²⁰≈0.35）；
50步任务的成功率仅为8%（0.95⁵⁰≈0.08）。

这不是工程优化能解决的问题，而是LLM的数学本质导致的必然结果。因此，指望AI独立完成端到端的复杂任务，往往会出现逻辑断裂、错误累积的情况。

三、人机协同：构建新的工作范式

AI的不可靠性与人类的局限性恰好形成互补，构建“人机协同”的工作范式，核心是用系统设计对抗个体不可靠性，发挥各自优势。

1. AI与人的不可靠性差异

维度	AI的不可靠性	人类的不可靠性
错误特征	未知且不可预测，错误可能出现在任何环节	已知且可预测，错误模式相对固定
能力逻辑	非累进性，高阶能力不代表能解决低阶问题	累进性，掌握高阶能力后可轻松解决低阶问题

简单来说：AI的错误是“随机bug”，人类的错误是“系统性偏差”；AI擅长海量数据处理和规则化任务，人类擅长逻辑判断、边界思考和风险把控。

哪怕是1+1这样的基础计算，AI也可能给出错误答案，且多次执行结果可能不一致——其错误出现的位置与形式完全不可预测。而人类的不可靠性则有迹可循：对于学过基础数学的人，1+1计算出错的概率极低，即便偶尔失误，通过重复校验也能修正。这背后的核心差异是：人类的能力具有累进性，掌握高阶能力后，低阶问题可轻松应对；而AI不具备这种能力递进关系。

因此，核心问题并非“AI是否可靠”，而是“AI的不可靠性是否可控”：

可控：可设计机制检测并处理错误，进而实现半自动化运行；
不可控：必须在人类监督下运行。

这正是当下AI的核心困境——无法脱离人类监督独立完成复杂任务。

2.用系统对抗个体不可靠

无论是人类还是 AI 都是不可靠的，但人类社会已经运转了数千年，我们建成了各种世界奇观，精密仪器，这些复杂的工程系统都能稳定运行，这是如何做到的？答案在于——用外部系统对抗个体不可靠。

系统设计的核心思想是：接受误差，设计容错。这包含两个核心层面：

接受现实：个体犯错是客观事实，无法彻底根除；
系统应对：通过系统层面的设计，对个体误差及时纠偏，或赋予系统容错能力，避免个体失误导致整体崩溃。

飞机堪称人类工程史上对抗不可靠性的典范。它涉及成千上万个部件协同工作，需在极端环境下保障安全，任何一个环节失效都可能引发灾难性后果。飞机设计师的应对思路值得借鉴：

多重备份：关键系统（如液压、飞控）均设计3-4套独立冗余，一套失效后其他系统可即时接管；
实时监控：机身遍布传感器，实时采集设备状态数据，异常时及时预警；
分层防御：针对驾驶员的“不可靠性”，设计警告分级、防呆机制、自动保护、双人制操作等多重保障。

这种思路同样适用于开发领域：方案评审规避需求理解偏差，多层测试体系减少bug遗漏，灰度发布降低生产环境风险——本质都是通过系统设计对冲个体不可靠性。

所有这些精妙的系统设计都基于一个关键前提：我们知道哪里可能出错。
对于飞机，我们知道引擎可能失效就设计多引擎冗余，知道液压系统可能泄漏就设计多套液压系统，知道结构可能疲劳开裂就设计损伤容忍结构。对于团队，我们知道开发者理解需求可能有偏差就设计方案评审，知道开发者会写出 bug 就设计多层测试体系，知道生产环境可能有未预见的问题就设计灰度发布。