Codex大进化，几乎适用于一切！自主使用Mac，自动跨几周跑复杂任务，内置浏览器和生图模型，Sam Altman 评价：比他预想的还要实用

Claude 在3月份就上线了computer use功能，Cursor 在4月初发布了为Agent 设计的全新版本 Cursor 3，OpenAI 的这次更新可以称是 Agentic AI 浪潮的最新信号。过去AI只能生成代码，而现在则可以看屏幕、点鼠标、敲键盘、跑长任务、并行执行和多Agent协作。于是，前端迭代、测试、PR、JIRA跟进、周报生成都被自动化，普通人也能干复杂工作。大家准备好迎

模型启动机

335人浏览 · 2026-04-17 16:18:41

模型启动机 · 2026-04-17 16:18:41 发布

今天，OpenAI官方宣布了Codex的一次大升级，帖子中强调“适用于（几乎）所有事物的Codex”，Codex从编程助手摇身一变成为了能操作整台电脑的数字伙伴！

OpenAI Codex 在Claude Opus 4.7 发布一小时后也来了大动作。

最核心的变化是Codex不再只呆在聊天框里，而是能直接“看”电脑屏幕、操控鼠标键盘，还能同时跑多个平行Agent。同时，完全不干扰你的工作，只默默地在后台忙活。

除此之外，它还拥有了内置浏览器、GPT-image-1.5生图模型、持久化记忆、自动化长期工作的功能，并且新增了90多个插件。

连Sam Altman自己也感到意料之外的惊喜：感觉比他预想的还要实用。

有人在X上精辟地评论：“Anthropic 押注于原始模型能力，OpenAI 想要你的整个工作流程。”

还有人说得特别落地，讲Codex可能将处理“起草报告、设立合并数据室、审查合同、协助客户入职、生成营销资产、处理发票”等长期工作。

我们这就来看看新版本的Codex使用起来效果如何？

全新computer use功能

有网友录制了在Mac电脑中开启Codex的computer use功能的设置过程，可以看到需要赋予屏幕录制和辅助功能的权限。

底下有人评论：“OpenAI这次推出来的computer use，比不久前Claude Code的看着丝滑多了。背后的团队实力和技术/艺术积累也不一般。OpenAI兜里的货估计还不少。”

官方展示了Codex是如何自主操作电脑的。

视图中的左侧是Codex的聊天窗口，实时显示它在“思考”、调用工具、点击操作和代码变更说明。右侧是实际的 Xcode、代码编辑器和运行中的井字棋游戏窗口。Codex 的光标在屏幕上移动、点击按钮、切换窗口等。

估计自己使用时，有种看着别人在帮你远程操控电脑的感觉。

自动醒来做长期任务

Codex现在可以给自己安排未来的任务，跨几天甚至几周跑长期任务。由于其现在能在同一线程中运行，所以可以在保持原始上下文的条件下，从中断的地方继续运行。

这种会自动醒来的特性让小编想到了OpenClaw的心跳机制，不过Codex更专注工程自动化，而OpenClaw更偏向生活自动化。

自动化功能的页面中，已预置了一些常见选项，比如摘要报告、事件分诊和代码质量等，在右上角有自动创建按钮。

官方给出的例子是让Codex长期检查不同渠道的消息并向用户报告重点，当用户输入“你能帮我盯着点，如果有遗漏就告诉我吗？”时，Codex会回复：它会每小时检查一次，只在有重要变化时才通知用户。

首次亮相的90+插件

新增的插件能够在文档、项目管理、代码审查、创意工作、部署等工具中收集上下文和采取行动。

这些支持插件包括GitHub、Slack、Linear、Notion、Dovetail、Sora等，JIRA、GitLab、CircleCI、微软全家桶、Databricks 旗下的 Neon 等工具也都接了进来。

另外有人提到：

桌面 App 本身也加了处理 GitHub review 评论、多终端标签、通过 SSH 连远程 devbox（开发沙箱）等功能，PDF、表格、幻灯片可以直接在侧边栏预览。

插件的调用方式非常简单，在对话框中@一下，选择插件即可。

可展开的内置浏览器，生图和写代码自动衔接

Codex的内置浏览器有一个方便的展开功能，展开后其下方仍带有对话框，可以继续与Codex进行交流。

在图像生成这块，官方展示了一个为网页中某局部生成图片并添加到网页中的应用demo。

在这项任务里，Codex自动使用 gpt-image-1.5 生成了一张匹配主题的高质量汉堡图片，并自动替换了 hero 占位区域，最后让网页实现了更新。感觉网站运营确实更加简单便捷了。

有了内置图像生成，这意味着做产品概念图、界面原型、游戏素材可以和写代码在同一个流程里完成。

1个复杂实例：收集多App反馈，汇总于Excel

OpenAI的团队成员 Nick Baumann 还给出了一个复杂的实际应用案例。他让Codex把分散在各种 App 里的反馈，快速变成结构化、可行动的表格，极大节省了人工整理时间。

首先，他输入“你能把 Slack、Gmail 和这个文件里的团队工作空间 alpha 反馈，合成到 Google Drive 的审查表格里吗？”指令。

随后，Codex便开始自动读取并分析了 Slack 消息、Gmail 邮件和文件内容。接着，将反馈按“主题”分组，并为每条反馈添加摘要、严重程度和置信度。然后自动更新 Google Sheets 表格，整理出优先级、需要立即修复的、可以稍后处理的等分类。

最后Codex还根据用户新指令进一步优化表格，比如调整顺序、添加颜色标记、清晰化格式，使其更易于产品、设计和工程团队审阅。这确实为工作中团队的Excel统计事项省事不少。

看到这里，大家是不是想立马上手新版本Codex了呢？

它的更新情况是：从今天开始推送给用 ChatGPT 账号登录桌面 App 的用户。当下只有Mac OS上能使用电脑操作功能，欧盟和英国稍后开放。对于记忆和上下文感知推荐功能，企业版、教育版以及欧盟和英国的用户会后续开放权限。

写在最后：迎接生产力爆发浪潮

Claude 在3月份就上线了computer use功能，Cursor 在4月初发布了为Agent 设计的全新版本 Cursor 3，OpenAI 的这次更新可以称是 Agentic AI 浪潮的最新信号。

过去AI只能生成代码，而现在则可以看屏幕、点鼠标、敲键盘、跑长任务、并行执行和多Agent协作。于是，前端迭代、测试、PR、JIRA跟进、周报生成都被自动化，普通人也能干复杂工作。

大家准备好迎接这波“日常生产力”爆发的浪潮了吗？欢迎玩得飞起的大佬在评论区分享自己的有趣经历。

所有评论(0)

查看更多评论

模型启动机

@2501_94005722

已为社区贡献261条内容

Codex大进化，几乎适用于一切！自主使用Mac，自动跨几周跑复杂任务，内置浏览器和生图模型，Sam Altman 评价：比他预想的还要实用

模型启动机

全新computer use功能

自动醒来做长期任务

首次亮相的90+插件

可展开的内置浏览器，生图和写代码自动衔接

1个复杂实例：收集多App反馈，汇总于Excel

写在最后：迎接生产力爆发浪潮

相关链接：

所有评论(0)

温馨提示：您尚未绑定手机号

模型启动机