老实说,我一开始并不太喜欢「在终端里跟 AI 打交道」。

在真正用上 OpenClaw 之前,我对 Claude Code 这类工具一直有点抗拒——不是能力不行,而是交互方式不符合视觉型创作者的直觉。终端不是我的主场。

直到我花了几天时间,认真把 OpenClaw 搭起来,用它跑完整个设计 + 产出流程,我才意识到一件事:

这不是又一个 AI 工具,而是一个可以住进你电脑里的“工作代理”

下面我会先讲 OpenClaw 如何改变我的日常工作流,再说 Codex 在其中扮演的角色。


我正在替换掉的工具,以及原因

很多所谓的「AI 工具」,本质上只是胶水:

  • 在不同 App 之间 copy / paste

  • 在聊天窗口、文档、终端之间频繁切换

  • 靠记忆去管理“东西到底放哪了”

OpenClaw 做的不是再加一层胶水,而是把胶水本身干掉

一个助手,能在清晰的安全模型下,直接访问你真实的工具:
文件、Shell、浏览器、消息系统、本地资源。

这件事一旦成立,很多工具的定位就会发生变化。


Notion → 本地 Markdown + Obsidian

我依然喜欢 Notion,但我已经不再把它当作「唯一真相源」。

现在我的写作流程是:

  • 在 OpenClaw 的对话里直接写 Markdown

  • 保存为本地文件,进入项目目录

  • Git 管理、版本可追溯

  • 用 Obsidian 快速预览、做轻量视觉调整

  • 一键导出成 HTML / 预览站点 / 正式站点

我现在信任的是一个混合式写作循环

  • AI 修改的是本地 Markdown

  • 我在 Obsidian 里做最后的人工微调

  • 预览速度极快,质量控制成本很低

最大的好处只有一句话:

内容和项目放在一起,本地化、可搜索、可脚本化、可长期维护。


Midjourney / Krea → Nano Banana Pro(通过 Codex + Telegram)

我以前是 Midjourney 的重度用户,每个月订阅费接近 200 美金。

但实际体验一直有几个问题:

  • 手、细节、真实感不稳定

  • 反复 reroll,时间成本高

  • 更适合“灵感图”,不太适合生产级输出

后来我把图像生成几乎全部换成了 Nano Banana Pro,并通过 Codex + Telegram 跑 API 工作流。

这一步,对我影响非常大。

Nano Banana Pro 在这些方面明显更强:

  • 手部、细节、真实场景的成功率更高

  • 审美更贴近真实的产品 / 营销网站

  • 很少出现明显的“AI 破绽”

但真正的杀手级能力不是「画得好不好」,而是整条流水线

  • 从我本地任意参考图生成

  • 锁定分辨率 / 比例

  • 本地自动归档

  • 批量生成变体(夜间跑,成本更低)

  • 结果直接回传 Telegram,手机上就能快速放大、筛选

  • 需要时一键生成可浏览图库

核心依然是两件事:

好的 Prompt + 好的参考库

Prompt 示例:

Generate 5 images inspired by this reference.
No UI, no text, no logos. No collage.
Don’t copy, only use as a reference, be creative.
Maintain the same visual style.
Use varied aspect ratios: 16:9, 4:3, 1:1, 3:4, 9:16.
Make details ultra-sharp.

这基本替代了我过去对 Midjourney / Krea 的大部分需求。


Cursor / v0 / Lovable / Aura → 真正能交付的工作流

Cursor 我还在用,但更多用于大规模代码 diff 的审查

Codex 非常擅长“外科手术式修改”,但 UI 比较极简;当代码库变大时,Cursor 在审查层面依然更舒服。

v0、Lovable、Aura 对我来说属于同一类工具:

  • 快速原型

  • 构建完整网站

  • 直接发布

(说明一下:Aura 是我参与构建的产品,确实有偏见)

真正重要的不是“生成”,而是闭环能力

  • 模板与设计变体

  • 可复用资产与引用

  • 接近 Figma 的手动精修层

  • 发布 / 域名 / CMS / 协作

如果工具只追求生成,而不解决这些“硬问题”,很快就会被下一个 AI 模型淘汰。


Figma 与 Nano Banana Pro 的现实分工

Figma 依然是精细手动修改的王者,我还在付费。

但在第一版生成上:

  • 网站、Slides、原型、动画 → Codex / v0 / Aura

  • 图像与营销物料 → Nano Banana Pro

Nano Banana Pro 的进化速度很快:

  • 排版已经不错

  • UI 表现逐步稳定

  • 参考图 + Prompt 的乘数效应非常明显

餐厅等位时,用 Telegram 生成的图像


为什么 Codex 在这个组合里很关键

OpenClaw 给我的是机器上的代理

Codex 给的是真正的代码执行力

我不是只在“问想法”,而是在要求它:

  • 改真实文件

  • 写能编译、能上线的代码

  • 不破坏现有结构

  • 在我保持设计状态的同时,把东西交付出来

这让它更像一个队友,而不是聊天机器人。


Codex vs OpenClaw:我的理解方式

  • Codex:代码专家,repo 级别思考,强审查、强可见性

  • OpenClaw:代理层,跨 App、跨日常工作,更“贴身”

Codex 的优势在于:

你能看到它跑了什么命令、改了哪些文件、diff 一目了然。

OpenClaw 则更像“你已经在用的环境里多了一个能力”。

如果认真交付复杂产品,代码审查这件事现在仍然重要


我现在真实在交付什么

以前,一个类似规模的产品,需要 5–10 人团队、3 个月。

现在:

  • 同级别产品 → 约 1 周

  • 设计提速更夸张

  • 模板直接上线、带内容、带分发

我现在是并行交付

  • 功能

  • 设计模板

  • 图像资产

  • 内容、视频、社交、长文

效率大概是:

在两年前基础上,再快 2 倍以上。

Aura 上正在交付的模板


一周内上线的真实功能例子

  • CMS:AI 生成集合 / 从 Notion、Sheets 导入

  • 自定义域名:以前完全不会,现在能独立完成

  • Skills 系统:管理页 + Prompt 引用

  • Playwright 截图:替代一堆效果很差的方案

甚至老项目的修改,现在也变成:

告诉它 app + repo + feature → 修 → 跑 → 部署


为什么“跑在你电脑上”这么重要

一句话总结:

只要在你本地存在的东西,它就能操作。

我现在常用的场景包括:

  • 打印 / 作业 / PDF

  • 项目初始化 + GitHub 推送

  • 报销、文件整理

  • 本地图像批处理

  • 语音 → Markdown 内容结构

这本质上是在降低生活到产出的摩擦系数


Telegram 成了我的控制中心(以及为什么拆成 4 个 Bot)

真正的难点不是 AI 能不能做,而是上下文会不会乱

我把 Telegram 拆成 4 个 Bot:

  • Shiori:写作与叙事

  • Komori:图像与资产

  • Sakura:设计评审

  • Shimo:运维与系统

这不是仪式感,而是降低 AI 猜测“我现在想干嘛”的成本


SOUL + Projects + Files:正在成为标准形态

现在越来越多 AI 工具都在往同一个模型收敛:

  • 记忆

  • 人格

  • 工作流规则

  • 技能

  • 全部写进文件

这不是角色扮演,是隔离与安全


不爽的地方(真实存在)

  • 没有流式输出

  • 仍然需要权限确认

  • 单任务执行(没有真正并发)

  • 安全是你的责任

所以我现在是:

  • Codex / OpenClaw / 其他工具并行使用

  • 定期跑安全审计

openclaw security audit --fix

结语:我不认为 AI 会吃掉 UI

我反而认为:

我们正在创造比过去更多的 UI

变化发生在编码层

  • 用意图驱动

  • 用 diff 审查

  • 用 AI 执行

人类角色变成:

  • 质量控制

  • 测试

  • 审美

  • 研究

  • 判断

结果非常现实:

做得更多,质量更好,还能留出生活时间。

对我来说,这才是 AI 工具真正值得兴奋的地方。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐