OpenClaw创始人Peter Steinberger的Vibe Coding完整方法论
·
基于Peter Steinberger在2025年12月28日发布的博客文章(OpenClaw爆火前夕),这是一份关于如何在AI时代高效构建软件的实战指南。
一、核心认知转变
1. 期待值的革命性变化
- 2025年5月:对提示词能生成可运行代码感到惊讶
- 现在:直接能跑的代码已成为日常正常预期
- 关键洞察:与agent相处足够长时间后,你能准确知道某件事应该花多长时间
2. 对架构的感知不会消失
- 反驳"使用agent会产生脱节感"的观点
- 当Codex返回结果却没一次性解决问题时,会立刻起疑心
- 真相:你依然能感受到糟糕的架构,只是通过不同方式
3. 生产力的新瓶颈
- 主要限制:推理时间和深度思考,而非编码速度
- 现实:大多数软件不需要深度思考
- 策略:从CLI开始构建,形成闭环验证
二、模型选择的实战智慧
Codex vs Opus:深层差异
Codex(GPT-5.2)的特点:
- 开始前会默默阅读文件10-15分钟
- 大幅提高修复正确问题的几率
- 适合大功能开发和重构
- 虽然花4倍时间,但总体更快(避免返工)
- 上下文管理能力是Opus的5倍
Opus的特点:
- 更加急切,适合小修改
- 经常不读整个文件或遗漏部分
- 容易交付低效结果
- 内部思考非常啰嗦(消耗更多token)
- 用起来"很愉悦",有特别的个性
关键教训:
“即使codex花的时间是Opus的4倍,我反而更快,因为不需要回去修复那个修复”
知识截止日期的重要性
- GPT-5.2:截止到8月底
- Opus:停在3月中旬(差5个月)
- 使用最新工具时至关重要
三、工作流程设计
1. 多项目并行策略
- 同时处理3-8个项目(根据复杂度)
- 一个大项目 + 几个卫星项目
- 需要安静、专注的家庭工作环境
- 培养对任务难度的直觉
2. 队列功能的使用
- 有新想法时加入管道
- 不需要复杂的多agent编排系统
- 瓶颈是人:需要快速迭代、玩、感受、看见
3. 迭代哲学
“我很少在脑子里有完整的图景。我构建东西,玩一玩,看看它’感觉’如何,然后得到新想法来完善它”
- 反对Spec-Driven开发模式
- 需要触摸、感受、看见才能让它演进
- 构建软件像爬山:绕着走、转弯、有时往回走
4. Git工作流
- 直接提交到main
- 基本从不回滚或使用检查点
- 不喜欢的就让模型改
- 避免在脑中思考不同状态的认知负担
- 注意:适合单人项目
5. 跨项目引用
- 经常引用其他项目:
../project-folder - 复制已解决的方案到新项目
- 节省大量提示词
6. 文档管理
- 在每个项目的
docs文件夹维护文档 - 使用脚本强制模型阅读相关文档
- 不需要引用过去会话的复杂系统
7. 上下文管理
- GPT-5.2后不再需要频繁重启会话
- 即使上下文更满,性能依然很好
- Codex在上下文管理上远超Claude
- 内部思考非常浓缩以节省token
四、提示词技巧
从详细到简洁的转变
- 过去:用语音输入写很长、详细的提示词
- 现在:提示词变得短多了,经常打字
视觉化提示
- 大量使用图片,特别是迭代UI时
- 拖UI截图说"fix padding"或"redesign"
- 展示什么是错的,几个词就够
Markdown输出
- 常写:
write docs to docs/*.md - 让模型自己选文件名
- 核心理念:为agent设计代码库结构,而非为自己
五、技术栈选择
语言选择原则
- Web项目:TypeScript
- CLI:Go(agent非常擅长,类型系统让linting快)
- macOS/UI:Swift
关键决策点
- 语言/生态系统和依赖的选择最重要
- 维护得好吗?流行吗?(=足够的世界知识)
- 系统设计:通信方式、数据流向
macOS/iOS开发革命
- 不太需要Xcode了
- 不使用xcodeproj文件
- Swift构建基础设施已足够好
- Codex知道如何运行iOS应用和处理模拟器
六、工具和基础设施
Oracle的诞生与演进
- 问题:Agent卡住→手动查询→重复浪费
- 解决:构建CLI让agent自动运行GPT-5 Pro
- 效果:Pro速通50个网站+深入思考,几乎总能击中正确答案
- 演进:GPT-5.2后需求从每天多次降到每周几次
- 收获:学到浏览器自动化、Windows知识、skills
多机器工作流
- 两台Mac:MacBook Pro + Mac Studio
- 通过git同步,比worktree简单
- UI/浏览器自动化移到Studio(不打扰主机)
- 任务继续运行,出差时远程成为主工作站
自动化一切
- Skill注册域名和修改DNS
- Skill写前端
- AGENTS文件包含tailscale网络说明
- 直接说"去我的mac studio更新xxx"
重构策略
- 过去:专门的日子来重构清理
- 现在:即兴处理
- 看到丑陋代码立刻处理
- 发现bug立刻提示(比写下来再切换上下文快)
先从模型和CLI开始
- 案例:YouTube视频总结扩展
- 先构建CLI(summarize)把核心做对
- 效果好后一天构建整个扩展
- 本地运行,快速,免费或付费模型都可
七、配置优化
模型选择
- 首选:gpt-5.2-codex high
- xhigh没什么好处,只是慢得多
- KISS原则:不花时间思考不同模式
关键配置
model = "gpt-5.2-codex"
model_reasoning_effort = "high"
tool_output_token_limit = 25000
model_auto_compact_token_limit = 233000
功能开关
unified_exec = true(替换tmux和runner脚本)web_search_request = trueskills = trueshell_snapshot = trueghost_commit = false
压缩策略
- 不要被压缩吓到
- 新的/compact端点工作足够好
- 任务可跨多次压缩运行并完成
- 会变慢,但起到审查作用(模型重看代码会发现bug)
八、具体案例:VibeTunnel
项目背景
- 终端多路复用器,让你在外出时编码
- 投入两个月,好到在外出时用手机编码
- 因心理健康原因停止
技术债的解决
- 过去:尝试从TypeScript重写到Rust/Go/Zig,老模型consistently失败
- 现在:两句话提示,Codex跑5小时,一次性交付可用转换版本
为什么重启
- 为Clawdis(OpenClaw前身)服务
- AI助手需要完全访问所有电脑
- 字符流比看图片效率高得多
九、Clawdis/OpenClaw的愿景
全面访问
- 消息、邮件、家庭自动化
- 摄像头、灯光、音乐
- 甚至控制床的温度
特性
- 自己的声音
- 发推的CLI
- 自己的clawd.bot
- 能看到并控制屏幕
- 有时候会说刻薄的话
十、代码阅读的转变
革命性变化
“这年头我已经不太读代码了”
- 看着代码流式生成
- 偶尔看关键部分
- 知道组件在哪里、如何组织、系统如何设计
- 这通常就足够了
重要的是什么
- 语言/生态系统和依赖的决策
- 整体架构理解
- 系统设计思考
十一、与模型对话的方式
告别"计划模式"
- 过去:需要"计划模式"(拿走编辑工具)
- 现在:直接和模型对话
- 问问题、让它搜索、探索代码、一起创建计划
- 满意时写"build"或"write plan to docs/*.md and build this"
计划模式的本质
- 早期模型时代的黑客方案
- 那些模型不太擅长遵循提示
- 不是什么神奇的东西
十二、项目管理哲学
Issue追踪
- 试过Linear等追踪器,都没坚持
- 重要的想法立刻尝试
- 其他的要么记住,要么不重要
- 发现bug立刻提示(比写下来再切换上下文快)
批量更新
- 让agent在项目文件夹运行
- “找到我最近的所有go项目”
- 实现改动 + 更新changelog
- 每个项目自动升高patch版本号
十三、心态与平衡
竞争的价值
- 希望Anthropic推出Opus-5
- 竞争是好事
模型个性的重要性
- 爱Opus作为通用模型
- AI agent运行在GPT-5上不会有一半这么有趣
- Opus用起来"很愉悦"
- 技术能力不是唯一标准
享受构建的乐趣
“玩得太开心了在构建东西”
核心洞察总结
- 速度的真谛:不是最快完成,而是一次做对,避免返工
- 架构感知:不会因为用agent而消失,只是通过不同方式感知
- 迭代哲学:构建-玩-感受-演进,而非完整规划后执行
- 为agent设计:代码库结构为agent优化,而非为人类
- 简单至上:直接提交main,不过度工程化,KISS原则
- 立即处理:看到问题立刻解决,不积压
- CLI优先:先做对核心,再扩展到其他形式
- 模型个性:技术能力+使用愉悦度共同决定选择
- 人是瓶颈:不是编码速度,而是思考和感受
- 享受过程:构建本身就是乐趣
最终启示:Vibe Coding不是关于工具或技巧的堆砌,而是与AI建立一种新的协作关系——你负责感受、判断和方向,AI负责执行和实现。这种关系建立在信任、直觉和大量实践之上。
更多推荐



所有评论(0)