基于Peter Steinberger在2025年12月28日发布的博客文章(OpenClaw爆火前夕),这是一份关于如何在AI时代高效构建软件的实战指南。


一、核心认知转变

1. 期待值的革命性变化

  • 2025年5月:对提示词能生成可运行代码感到惊讶
  • 现在:直接能跑的代码已成为日常正常预期
  • 关键洞察:与agent相处足够长时间后,你能准确知道某件事应该花多长时间

2. 对架构的感知不会消失

  • 反驳"使用agent会产生脱节感"的观点
  • 当Codex返回结果却没一次性解决问题时,会立刻起疑心
  • 真相:你依然能感受到糟糕的架构,只是通过不同方式

3. 生产力的新瓶颈

  • 主要限制:推理时间和深度思考,而非编码速度
  • 现实:大多数软件不需要深度思考
  • 策略:从CLI开始构建,形成闭环验证

二、模型选择的实战智慧

Codex vs Opus:深层差异

Codex(GPT-5.2)的特点:

  • 开始前会默默阅读文件10-15分钟
  • 大幅提高修复正确问题的几率
  • 适合大功能开发和重构
  • 虽然花4倍时间,但总体更快(避免返工)
  • 上下文管理能力是Opus的5倍

Opus的特点:

  • 更加急切,适合小修改
  • 经常不读整个文件或遗漏部分
  • 容易交付低效结果
  • 内部思考非常啰嗦(消耗更多token)
  • 用起来"很愉悦",有特别的个性

关键教训

“即使codex花的时间是Opus的4倍,我反而更快,因为不需要回去修复那个修复”

知识截止日期的重要性

  • GPT-5.2:截止到8月底
  • Opus:停在3月中旬(差5个月)
  • 使用最新工具时至关重要

三、工作流程设计

1. 多项目并行策略

  • 同时处理3-8个项目(根据复杂度)
  • 一个大项目 + 几个卫星项目
  • 需要安静、专注的家庭工作环境
  • 培养对任务难度的直觉

2. 队列功能的使用

  • 有新想法时加入管道
  • 不需要复杂的多agent编排系统
  • 瓶颈是人:需要快速迭代、玩、感受、看见

3. 迭代哲学

“我很少在脑子里有完整的图景。我构建东西,玩一玩,看看它’感觉’如何,然后得到新想法来完善它”

  • 反对Spec-Driven开发模式
  • 需要触摸、感受、看见才能让它演进
  • 构建软件像爬山:绕着走、转弯、有时往回走

4. Git工作流

  • 直接提交到main
  • 基本从不回滚或使用检查点
  • 不喜欢的就让模型改
  • 避免在脑中思考不同状态的认知负担
  • 注意:适合单人项目

5. 跨项目引用

  • 经常引用其他项目:../project-folder
  • 复制已解决的方案到新项目
  • 节省大量提示词

6. 文档管理

  • 在每个项目的docs文件夹维护文档
  • 使用脚本强制模型阅读相关文档
  • 不需要引用过去会话的复杂系统

7. 上下文管理

  • GPT-5.2后不再需要频繁重启会话
  • 即使上下文更满,性能依然很好
  • Codex在上下文管理上远超Claude
  • 内部思考非常浓缩以节省token

四、提示词技巧

从详细到简洁的转变

  • 过去:用语音输入写很长、详细的提示词
  • 现在:提示词变得短多了,经常打字

视觉化提示

  • 大量使用图片,特别是迭代UI时
  • 拖UI截图说"fix padding"或"redesign"
  • 展示什么是错的,几个词就够

Markdown输出

  • 常写:write docs to docs/*.md
  • 让模型自己选文件名
  • 核心理念:为agent设计代码库结构,而非为自己

五、技术栈选择

语言选择原则

  • Web项目:TypeScript
  • CLI:Go(agent非常擅长,类型系统让linting快)
  • macOS/UI:Swift

关键决策点

  • 语言/生态系统和依赖的选择最重要
  • 维护得好吗?流行吗?(=足够的世界知识)
  • 系统设计:通信方式、数据流向

macOS/iOS开发革命

  • 不太需要Xcode了
  • 不使用xcodeproj文件
  • Swift构建基础设施已足够好
  • Codex知道如何运行iOS应用和处理模拟器

六、工具和基础设施

Oracle的诞生与演进

  • 问题:Agent卡住→手动查询→重复浪费
  • 解决:构建CLI让agent自动运行GPT-5 Pro
  • 效果:Pro速通50个网站+深入思考,几乎总能击中正确答案
  • 演进:GPT-5.2后需求从每天多次降到每周几次
  • 收获:学到浏览器自动化、Windows知识、skills

多机器工作流

  • 两台Mac:MacBook Pro + Mac Studio
  • 通过git同步,比worktree简单
  • UI/浏览器自动化移到Studio(不打扰主机)
  • 任务继续运行,出差时远程成为主工作站

自动化一切

  • Skill注册域名和修改DNS
  • Skill写前端
  • AGENTS文件包含tailscale网络说明
  • 直接说"去我的mac studio更新xxx"

重构策略

  • 过去:专门的日子来重构清理
  • 现在:即兴处理
  • 看到丑陋代码立刻处理
  • 发现bug立刻提示(比写下来再切换上下文快)

先从模型和CLI开始

  • 案例:YouTube视频总结扩展
  • 先构建CLI(summarize)把核心做对
  • 效果好后一天构建整个扩展
  • 本地运行,快速,免费或付费模型都可

七、配置优化

模型选择

  • 首选:gpt-5.2-codex high
  • xhigh没什么好处,只是慢得多
  • KISS原则:不花时间思考不同模式

关键配置

model = "gpt-5.2-codex"
model_reasoning_effort = "high"
tool_output_token_limit = 25000
model_auto_compact_token_limit = 233000

功能开关

  • unified_exec = true(替换tmux和runner脚本)
  • web_search_request = true
  • skills = true
  • shell_snapshot = true
  • ghost_commit = false

压缩策略

  • 不要被压缩吓到
  • 新的/compact端点工作足够好
  • 任务可跨多次压缩运行并完成
  • 会变慢,但起到审查作用(模型重看代码会发现bug)

八、具体案例:VibeTunnel

项目背景

  • 终端多路复用器,让你在外出时编码
  • 投入两个月,好到在外出时用手机编码
  • 因心理健康原因停止

技术债的解决

  • 过去:尝试从TypeScript重写到Rust/Go/Zig,老模型consistently失败
  • 现在:两句话提示,Codex跑5小时,一次性交付可用转换版本

为什么重启

  • 为Clawdis(OpenClaw前身)服务
  • AI助手需要完全访问所有电脑
  • 字符流比看图片效率高得多

九、Clawdis/OpenClaw的愿景

全面访问

  • 消息、邮件、家庭自动化
  • 摄像头、灯光、音乐
  • 甚至控制床的温度

特性

  • 自己的声音
  • 发推的CLI
  • 自己的clawd.bot
  • 能看到并控制屏幕
  • 有时候会说刻薄的话

十、代码阅读的转变

革命性变化

“这年头我已经不太读代码了”

  • 看着代码流式生成
  • 偶尔看关键部分
  • 知道组件在哪里、如何组织、系统如何设计
  • 这通常就足够了

重要的是什么

  • 语言/生态系统和依赖的决策
  • 整体架构理解
  • 系统设计思考

十一、与模型对话的方式

告别"计划模式"

  • 过去:需要"计划模式"(拿走编辑工具)
  • 现在:直接和模型对话
  • 问问题、让它搜索、探索代码、一起创建计划
  • 满意时写"build"或"write plan to docs/*.md and build this"

计划模式的本质

  • 早期模型时代的黑客方案
  • 那些模型不太擅长遵循提示
  • 不是什么神奇的东西

十二、项目管理哲学

Issue追踪

  • 试过Linear等追踪器,都没坚持
  • 重要的想法立刻尝试
  • 其他的要么记住,要么不重要
  • 发现bug立刻提示(比写下来再切换上下文快)

批量更新

  • 让agent在项目文件夹运行
  • “找到我最近的所有go项目”
  • 实现改动 + 更新changelog
  • 每个项目自动升高patch版本号

十三、心态与平衡

竞争的价值

  • 希望Anthropic推出Opus-5
  • 竞争是好事

模型个性的重要性

  • 爱Opus作为通用模型
  • AI agent运行在GPT-5上不会有一半这么有趣
  • Opus用起来"很愉悦"
  • 技术能力不是唯一标准

享受构建的乐趣

“玩得太开心了在构建东西”


核心洞察总结

  1. 速度的真谛:不是最快完成,而是一次做对,避免返工
  2. 架构感知:不会因为用agent而消失,只是通过不同方式感知
  3. 迭代哲学:构建-玩-感受-演进,而非完整规划后执行
  4. 为agent设计:代码库结构为agent优化,而非为人类
  5. 简单至上:直接提交main,不过度工程化,KISS原则
  6. 立即处理:看到问题立刻解决,不积压
  7. CLI优先:先做对核心,再扩展到其他形式
  8. 模型个性:技术能力+使用愉悦度共同决定选择
  9. 人是瓶颈:不是编码速度,而是思考和感受
  10. 享受过程:构建本身就是乐趣

最终启示:Vibe Coding不是关于工具或技巧的堆砌,而是与AI建立一种新的协作关系——你负责感受、判断和方向,AI负责执行和实现。这种关系建立在信任、直觉和大量实践之上。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐