导读:
用AI一年,我犯过最多的错误就是——把AI当超人用。
以为丢一个需求,它就能全搞定。
结果?返工、崩溃、怀疑人生。
后来我想明白了:AI不是超人,是特种兵。
你得给它配指挥系统、配后勤、配侦察兵。
一个人,指挥一支军队,才能真正起飞。


01 我踩过的坑:90%的人都经历过

坑一:需求写得太笼统

我以前这么说:

“帮我做个用户登录功能。”

AI理解:

好,做吧。结果做出来是个简单表单,根本没考虑安全、没考虑注册流程、没考虑第三方登录…

正确做法:

"帮我做个用户登录功能。

  • 要支持手机号+验证码登录
  • 登录后返回token,存本地
  • 要有登录有效期控制
  • 参考我们现有的auth模块风格"

实战心得:

AI的理解力取决于你给的信息量。
笼统的需求 = 笼统的结果。
写清楚"要什么、不要什么、参考什么",省下80%的沟通成本。


坑二:让AI自己判断复杂度

我以前这么做:

给一个需求,让AI自己判断该用哪个Skill。

结果:

它判断错了。用代码生成的Skill去做了架构设计,用评审的Skill去写了代码。全部返工。

正确做法:

我先判断复杂度,再派活。

复杂度 我的判断 派的活
简单 改个样式、加个小功能 直接code-gen
中等 要写模块、涉及多个文件 code-orchestrator协调
复杂 要设计架构、做技术选型 multi-agent联合作战
超纲 现有能力搞不定 prime-mover现场造新Skill

实战心得:

AI在"执行"上很强,但在"判断"上需要人把关。
复杂度判断这种高认知负荷的事,还是得人来做。
指挥官的职责,就是判断该派哪支部队。


坑三:不给AI留上下文

我以前这么做:

每次对话都是新的。完全不提之前聊了什么。

结果:

AI完全失忆。同样的问题重复问,同样的错误重复犯。

正确做法:

用TodoWrite记录进度。
每个大任务开始前,先写Todo。
每个子任务完成,更新状态。

我:先帮我做个用户模块
AI:好,我列一下计划

TodoWrite:
[ ] 用户登录接口
[ ] 用户注册接口  
[ ] Token管理
[ ] 单元测试

我:开始做第一个
AI:好,做登录接口
...
AI:登录接口完成了,更新Todo

实战心得:

TodoWrite不是记给我看的,是记给AI看的。
它让AI知道"现在在哪、接下来要去哪"。
没有这个,AI每次都是从零开始。


坑四:不做质量门禁

我以前这么做:

AI写完代码,我直接用。

结果:

Bug一堆,风格不统一,有的甚至跑不通。

正确做法:

质量门禁是底线,不能省。

我的标准流程:
1. AI写代码
2. lsp_diagnostics检查(语法错误、类型问题)
3. 运行测试
4. 人工review关键逻辑
5. 全部通过 → 合并

实战心得:

AI生成的代码,必须检查
它不是故意写错,它只是有时候会"想当然"。
质量门禁不是信不过AI,是为项目负责。


02 我现在是怎么指挥的:完整工作流

第一步:任务拆解

接到需求后,我不急着让AI干活。

先问自己几个问题:

问题 目的
这个需求涉及哪些模块? 明确范围
哪些是现有Skill能搞定的? 复用
哪些需要新做? 识别增量
复杂度怎么分级? 选路径

例子:

需求:“做个数据导出功能,支持Excel和CSV”

分析:

  • 涉及模块:后端接口、数据转换
  • 现有Skill:code-gen(写接口)
  • 需要新做:Excel/CSV导出逻辑
  • 复杂度:M级,code-orchestrator协调

第二步:任务分发

判断完复杂度,开始派活。

我的派活原则:
1. 先做核心路径
2. 依赖项后做
3. 每完成一个,更新Todo
4. 遇到阻塞,先标记,继续下一个

实战案例:

需求:做个后台管理系统,包含用户管理、权限管理

TodoWrite:
[ ] 用户管理CRUD(核心,先做)
[ ] 权限管理CRUD(依赖用户模块,后做)
[ ] 角色权限关联(最复杂,后做)
[ ] 接口文档(最后补)

第三步:执行与监控

AI干活的时候,我在干什么?

盯着,但不是盯着屏幕。

看它的输出是否符合预期。
看到偏了,及时拉回来。
看到卡住了,帮它一把。

监控指标:

指标 怎么看 异常怎么办
代码质量 lsp_diagnostics 有error必须修
进度 TodoWrite状态 超过预期时间就问
方向 隔一段时间review 偏离就纠正
阻塞 问"有什么问题" 帮它解决卡点

第四步:验收与复盘

AI做完了,我不是直接过。

先过自己的检查清单:

  • 代码能跑通吗?
  • 风格统一吗?
  • 有注释吗?
  • 单元测试过了吗?
  • 文档补了吗?

然后复盘:

问题 答案
这次用对了Skill吗? 对/不对,为什么
哪里沟通不畅? 需求没说清?
哪里可以优化? 下次怎么改进
要不要沉淀新Skill? 是/否

03 我常用的几个实战技巧

技巧一:让AI自己生成测试用例

我不再自己写测试了。

“这段代码逻辑有点复杂,你帮我写3个边界测试case。”

AI擅长的:

  • 找边界条件
  • 覆盖各种异常场景
  • 写断言

我不让AI做的:

  • 搭测试框架(这个我先搭好)
  • 设计测试策略(这个我定)

分工明确,效率最高。


技巧二:用AI做代码审查

不是我审查AI,是AI审查AI。

我的流程:
1. AI写完代码
2. 另一个AI(code-review skill)来审
3. 审出问题,原AI改
4. 人工抽检

code-review Skill我会提醒它关注:

  • 潜在的性能问题
  • 安全漏洞(SQL注入、XSS等)
  • 代码重复
  • 命名不规范
  • 缺少错误处理

效果:

第一遍审查,AI能发现70%的问题。
人工只需要处理剩下的30%。


技巧三:遇到不会的,先让AI搜一圈

很多东西我记不清了。与其查文档,不如让AI先搜。

我的指令:
"帮我查一下Python异步编程的最佳实践,重点看:
1. async/await的正确用法
2. 常见坑点
3. 性能优化建议
整理成3条核心要点给我"

AI的优势:

  • 搜得快
  • 整理得快
  • 能给链接出处

我的优势:

  • 判断哪些对我有用
  • 结合我的实际场景做取舍

配合着用,效果最好。


技巧四:把重复的操作沉淀成Skill

同样一件事,做第二遍的时候,就要考虑沉淀了。

判断标准:

问题 答案≥2次"是" 建议动作
这个操作我会做几次? ≥2次 考虑沉淀
步骤是不是固定的? 写成workflow
每次都要重新想? 写成Skill

我的经验:

第三次做同样类型的事,我已经有Skill在手了。
从此以后,这类事AI直接调Skill,5分钟搞定。


技巧五:保留完整执行记录

每次大任务完成,我会让AI生成一个执行摘要:

执行摘要:
- 需求:xxx
- 路径:code-gen → test-gen → code-review
- 耗时:2小时
- 产出:3个文件
- 问题:第2步卡在依赖版本
- 解决:升级依赖包
- 改进建议:下次可以先确认环境

有什么用?

  1. 复盘有依据
  2. 以后类似需求可以更快
  3. 团队协作时,别人也能看懂

04 我见过最多的问题:怎么判断该派几个AI?

问题1:一个AI能搞定吗?

问自己:

问题 答案
这个需求,AI能独立完成吗? 能 → 一个AI
需要调用外部工具吗? 要 → 可能需要多个
涉及多个领域吗? 是 → 可能需要多个

实战经验:

一个简单的CRUD,一个AI可以。
一个要调用API、要写数据库、要做前端交互——至少2个AI分工。


问题2:多个AI怎么协调?

我常用的模式:主AI + 副AI

主AI:负责统筹
- 接收需求
- 拆解任务
- 派活给副AI
- 汇总结果

副AI:负责执行
- code-gen(写代码)
- test-gen(写测试)
- doc-gen(写文档)

协调原则:

场景 怎么协调
顺序执行 主AI依次调用
并行执行 主AI同时派给多个
有依赖 先派无依赖的
遇阻塞 主AI处理卡点

问题3:AI之间吵架了怎么办?

我遇到过:两个AI给了完全相反的建议。

解决方式:

  1. 让它们各自说明理由
  2. 引入第三个AI做裁判
  3. 人工做最终决定

我的原则:

重要决策,AI可以给建议,但人来做决定。
毕竟,最后负责任的是我,不是AI。


05 实战场景:完整案例演示

场景:做个数据看板

需求:

做一个数据看板,包含:

  • 用户统计(折线图)
  • 收入统计(柱状图)
  • 实时更新

Step 1:任务拆解

我判断:
- 前端:做可视化组件
- 后端:写数据接口
- 联调:前后端对接
复杂度:M级,用code-orchestrator协调

Step 2:派活

code-orchestrator开始协调:
1. 先做后端API(数据接口)
2. 再做前端组件(可视化)
3. 最后联调

Step 3:执行监控

- 后端API完成 ✔
- 前端组件完成 ✔
- 联调遇到问题:跨域
  → 我介入,配置Nginx解决
- 联调继续 ✔

Step 4:验收

lsp_diagnostics检查 → 0 error
测试用例 → 5个case全部通过
人工review → 抽检2个关键逻辑,没问题

总耗时:4小时
如果是以前的我:至少2天


06 给新手指挥官的建议

建议一:从一个小项目开始

别一上来就搭46个Skill。

我的做法:

阶段 Skill数量 目的
第1周 3-5个 先跑通流程
第2周 10个左右 覆盖常用场景
第1个月 20个以上 开始形成体系

关键是:先用起来。


建议二:每完成一个任务,沉淀一个

不要追求"一步到位"。

我的节奏:

做一个需求 → 发现需要新Skill → 做完后沉淀 → 下次直接用

效率提升曲线:

  • 第1个需求:5小时
  • 第5个同类需求:2小时
  • 第10个同类需求:30分钟

建议三:记录你的"指挥日志"

每次派活,记录:

时间 需求 派的活 结果 反思
2026-02-06 登录功能 code-gen 完成 需求写得够细,一次过
2026-02-07 数据导出 code-orchestrator 有阻塞 应该先确认环境

3个月后,这就是你最值钱的资产。


建议四:不要让AI做"判断"

哪些事你来做:

  • 需求理解(虽然AI能帮你写得更清楚)
  • 复杂度判断
  • 技术选型(AI可以给选项,你来选)
  • 质量标准(你来定)

哪些事AI来做:

  • 代码实现
  • 测试编写
  • 文档生成
  • 方案调研

分工明确,效率最高。


07 我的Skill是怎么"长"出来的

从0到1:一个Skill的诞生

场景:我需要一个"格式化代码"的Skill

第一步:手动做3次

  • 第一次:用AI写代码,手动格式化
  • 第二次:格式化+加注释,手动做
  • 第三次:发现规律,总结步骤

第二步:写成Skill

# code-formatter
## 什么时候用
用户说"帮我格式化代码"或"代码风格乱了"
## 输入
- 代码文件路径
- 编程语言
## 输出
- 格式化后的代码
- 改动说明
## 步骤
1. 读取文件
2. 根据语言选择格式化工具
3. 运行格式化
4. 检查改动
5. 生成改动报告

第三步:测试

  • 用它格式化3个不同类型的文件
  • 检查输出是否符合预期
  • 调整格式规则

第四步:放进系统

  • 放到L2层core目录
  • 更新meta-commander的路由规则
  • 记录到Skill注册表

从1到100:Skill的进化

我会定期review我的Skill:

Skill 调用次数 成功次数 成功率 状态
code-gen 150 142 94.7% core
test-gen 80 72 90% core
doc-gen 30 22 73.3% extended

处理方式:

  • 成功率 < 70% → 检查是不是需求变了
  • 连续失败 → 是不是环境/依赖问题
  • 长期没人用 → 归档或者删除

08 最后的忠告

忠告一:AI是特种兵,不是超人

特种兵的特点:

  • 单兵能力强
  • 需要指挥
  • 需要后勤
  • 团队配合才能打胜仗

你一个人指挥一支军队,比你一个人当超人,效率高10倍。


忠告二:先有流程,再有自动化

别一上来就追求全自动化。

我的流程:

  1. 人做+AI辅助 → 熟悉流程
  2. AI做+人监督 → 开始自动化
  3. AI做+人抽检 → 成熟了
  4. AI做+AI自检 → 完全自动化

每一步都要走过,别跳级。


忠告三:记录是金

你今天做过的所有决策、踩过的所有坑,都是明天的财富。

不记录 = 忘记 = 下次重踩

我的习惯:

  • 每次大任务结束,写执行摘要
  • 每次踩坑,记录问题和解决方案
  • 每周复盘一次

3个月后,你就是这个领域的专家。


09 快速开始指南

今天就可以做的事:

  1. 选一个你最常用的场景(比如写API)
  2. 开一个TodoWrite
  3. 让AI帮你写这个场景的第一个Skill
  4. 用起来
  5. 用完更新Skill
  6. 下周再加一个新Skill

28天后,你会回来谢我。


10 彩蛋:我常用的Prompt模板

模板一:写代码

请帮我写一个[功能描述]

要求:
- 语言:[Python/Java/Go...]
- 风格:参考现有代码风格
- 注释:关键逻辑要加注释
- 错误处理:要完善
- 测试:请顺便写2个单元测试

参考:
- 目录:[路径]
- 风格文件:[文件名]

模板二:写测试

请为[文件名/函数名]写测试用例

要求:
- 覆盖正常流程
- 覆盖异常场景
- 覆盖边界条件
- 使用[pytest/unittest/...]

模板三:写文档

请为[模块/功能]写文档

要求:
- 包含功能说明
- 包含使用示例
- 包含API接口说明(如有)
- 包含注意事项
- 格式:Markdown

模板四:做Code Review

请对以下代码做Review

代码:[粘贴代码或文件路径]

请重点关注:
1. 潜在性能问题
2. 安全漏洞
3. 代码规范
4. 逻辑错误
5. 是否有更好的实现方式

输出格式:
- 问题列表(严重程度+描述+建议修改)
- 整体评分(1-10)
- 改进建议

写在最后

这篇文章写了我用AI指挥军队的真实经验。

核心理念一句话:

一个人 + 一套系统 = 一支军队

不是AI变强了,是你变强了。

你学会了怎么派活、怎么验收、怎么复盘。

AI只是你的兵,你是指挥官。


关注我,持续分享AI提效实战经验。

回复"指挥",送你一套我整理的Claude Code最佳实践清单(含20个常用Prompt模板)。

学习交流

我组建了一个AI Agent免费的学习交流微信社群,欢迎加入,可以私信我或者直接加vx:andyjackson,备注csdn

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐