今天,OpenAI官方宣布了Codex的一次大升级,帖子中强调“适用于(几乎)所有事物的Codex”,Codex从编程助手摇身一变成为了能操作整台电脑的数字伙伴!

OpenAI Codex 在Claude Opus 4.7 发布一小时后也来了大动作。

今天,OpenAI官方宣布了Codex的一次大升级,帖子中强调“适用于(几乎)所有事物的Codex”,Codex从编程助手摇身一变成为了能操作整台电脑的数字伙伴!

图片

最核心的变化是Codex不再只呆在聊天框里,而是能直接“看”电脑屏幕、操控鼠标键盘,还能同时跑多个平行Agent。同时,完全不干扰你的工作,只默默地在后台忙活。

除此之外,它还拥有了内置浏览器、GPT-image-1.5生图模型、持久化记忆、自动化长期工作的功能,并且新增了90多个插件。

连Sam Altman自己也感到意料之外的惊喜:感觉比他预想的还要实用。

图片

有人在X上精辟地评论:“Anthropic 押注于原始模型能力,OpenAI 想要你的整个工作流程。”

图片

还有人说得特别落地,讲Codex可能将处理“起草报告、设立合并数据室、审查合同、协助客户入职、生成营销资产、处理发票”等长期工作。

我们这就来看看新版本的Codex使用起来效果如何?

全新computer use功能

有网友录制了在Mac电脑中开启Codex的computer use功能的设置过程,可以看到需要赋予屏幕录制和辅助功能的权限。

底下有人评论:“OpenAI这次推出来的computer use, 比不久前Claude Code的看着丝滑多了。背后的团队实力和技术/艺术积累也不一般。OpenAI兜里的货估计还不少。”

图片

官方展示了Codex是如何自主操作电脑的。

视图中的左侧是Codex的聊天窗口,实时显示它在“思考”、调用工具、点击操作和代码变更说明。右侧是实际的 Xcode、代码编辑器和运行中的井字棋游戏窗口。Codex 的光标在屏幕上移动、点击按钮、切换窗口等。

估计自己使用时,有种看着别人在帮你远程操控电脑的感觉。

图片

自动醒来做长期任务

Codex现在可以给自己安排未来的任务,跨几天甚至几周跑长期任务。由于其现在能在同一线程中运行,所以可以在保持原始上下文的条件下,从中断的地方继续运行。

这种会自动醒来的特性让小编想到了OpenClaw的心跳机制,不过Codex更专注工程自动化,而OpenClaw更偏向生活自动化。

自动化功能的页面中,已预置了一些常见选项,比如摘要报告、事件分诊和代码质量等,在右上角有自动创建按钮。

图片

官方给出的例子是让Codex长期检查不同渠道的消息并向用户报告重点,当用户输入“你能帮我盯着点,如果有遗漏就告诉我吗?”时,Codex会回复:它会每小时检查一次,只在有重要变化时才通知用户。

图片

首次亮相的90+插件

新增的插件能够在文档、项目管理、代码审查、创意工作、部署等工具中收集上下文和采取行动。

这些支持插件包括GitHub、Slack、Linear、Notion、Dovetail、Sora等,JIRA、GitLab、CircleCI、微软全家桶、Databricks 旗下的 Neon 等工具也都接了进来。

另外有人提到:

桌面 App 本身也加了处理 GitHub review 评论、多终端标签、通过 SSH 连远程 devbox(开发沙箱)等功能,PDF、表格、幻灯片可以直接在侧边栏预览。

图片

插件的调用方式非常简单,在对话框中@一下,选择插件即可。

可展开的内置浏览器,生图和写代码自动衔接

Codex的内置浏览器有一个方便的展开功能,展开后其下方仍带有对话框,可以继续与Codex进行交流。

图片

在图像生成这块,官方展示了一个为网页中某局部生成图片并添加到网页中的应用demo。

在这项任务里,Codex自动使用 gpt-image-1.5 生成了一张匹配主题的高质量汉堡图片,并自动替换了 hero 占位区域,最后让网页实现了更新。感觉网站运营确实更加简单便捷了。

图片

有了内置图像生成,这意味着做产品概念图、界面原型、游戏素材可以和写代码在同一个流程里完成。

1个复杂实例:收集多App反馈,汇总于Excel

OpenAI的团队成员 Nick Baumann 还给出了一个复杂的实际应用案例。他让Codex把分散在各种 App 里的反馈,快速变成结构化、可行动的表格,极大节省了人工整理时间。

首先,他输入“你能把 Slack、Gmail 和这个文件里的团队工作空间 alpha 反馈,合成到 Google Drive 的审查表格里吗?”指令。

随后,Codex便开始自动读取并分析了 Slack 消息、Gmail 邮件和文件内容。接着,将反馈按“主题”分组,并为每条反馈添加摘要、严重程度和置信度。然后自动更新 Google Sheets 表格,整理出优先级、需要立即修复的、可以稍后处理的等分类。

最后Codex还根据用户新指令进一步优化表格,比如调整顺序、添加颜色标记、清晰化格式,使其更易于产品、设计和工程团队审阅。这确实为工作中团队的Excel统计事项省事不少。

图片

看到这里,大家是不是想立马上手新版本Codex了呢?

它的更新情况是:从今天开始推送给用 ChatGPT 账号登录桌面 App 的用户。当下只有Mac OS上能使用电脑操作功能,欧盟和英国稍后开放。对于记忆和上下文感知推荐功能,企业版、教育版以及欧盟和英国的用户会后续开放权限。

写在最后:迎接生产力爆发浪潮

Claude 在3月份就上线了computer use功能,Cursor 在4月初发布了为Agent 设计的全新版本 Cursor 3,OpenAI 的这次更新可以称是 Agentic AI 浪潮的最新信号。

过去AI只能生成代码,而现在则可以看屏幕、点鼠标、敲键盘、跑长任务、并行执行和多Agent协作。于是,前端迭代、测试、PR、JIRA跟进、周报生成都被自动化,普通人也能干复杂工作。

大家准备好迎接这波“日常生产力”爆发的浪潮了吗?欢迎玩得飞起的大佬在评论区分享自己的有趣经历。

相关链接:

https://x.com/OpenAI/status/2044827705406062670

https://x.com/dotey/status/2044917716893467109?s=20

https://x.com/nickbaumann_/status/2044848823823180102?s=20

https://www.youtube.com/watch?v=m0w9CnTXyRs&pp=ygUFQ29kZXg%3D

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐