Codex大进化,几乎适用于一切!自主使用Mac,自动跨几周跑复杂任务,内置浏览器和生图模型,Sam Altman 评价:比他预想的还要实用
Claude 在3月份就上线了computer use功能,Cursor 在4月初发布了为Agent 设计的全新版本 Cursor 3,OpenAI 的这次更新可以称是 Agentic AI 浪潮的最新信号。过去AI只能生成代码,而现在则可以看屏幕、点鼠标、敲键盘、跑长任务、并行执行和多Agent协作。于是,前端迭代、测试、PR、JIRA跟进、周报生成都被自动化,普通人也能干复杂工作。大家准备好迎
今天,OpenAI官方宣布了Codex的一次大升级,帖子中强调“适用于(几乎)所有事物的Codex”,Codex从编程助手摇身一变成为了能操作整台电脑的数字伙伴!
OpenAI Codex 在Claude Opus 4.7 发布一小时后也来了大动作。
今天,OpenAI官方宣布了Codex的一次大升级,帖子中强调“适用于(几乎)所有事物的Codex”,Codex从编程助手摇身一变成为了能操作整台电脑的数字伙伴!

最核心的变化是Codex不再只呆在聊天框里,而是能直接“看”电脑屏幕、操控鼠标键盘,还能同时跑多个平行Agent。同时,完全不干扰你的工作,只默默地在后台忙活。
除此之外,它还拥有了内置浏览器、GPT-image-1.5生图模型、持久化记忆、自动化长期工作的功能,并且新增了90多个插件。
连Sam Altman自己也感到意料之外的惊喜:感觉比他预想的还要实用。

有人在X上精辟地评论:“Anthropic 押注于原始模型能力,OpenAI 想要你的整个工作流程。”

还有人说得特别落地,讲Codex可能将处理“起草报告、设立合并数据室、审查合同、协助客户入职、生成营销资产、处理发票”等长期工作。
我们这就来看看新版本的Codex使用起来效果如何?
全新computer use功能
有网友录制了在Mac电脑中开启Codex的computer use功能的设置过程,可以看到需要赋予屏幕录制和辅助功能的权限。
底下有人评论:“OpenAI这次推出来的computer use, 比不久前Claude Code的看着丝滑多了。背后的团队实力和技术/艺术积累也不一般。OpenAI兜里的货估计还不少。”

官方展示了Codex是如何自主操作电脑的。
视图中的左侧是Codex的聊天窗口,实时显示它在“思考”、调用工具、点击操作和代码变更说明。右侧是实际的 Xcode、代码编辑器和运行中的井字棋游戏窗口。Codex 的光标在屏幕上移动、点击按钮、切换窗口等。
估计自己使用时,有种看着别人在帮你远程操控电脑的感觉。

自动醒来做长期任务
Codex现在可以给自己安排未来的任务,跨几天甚至几周跑长期任务。由于其现在能在同一线程中运行,所以可以在保持原始上下文的条件下,从中断的地方继续运行。
这种会自动醒来的特性让小编想到了OpenClaw的心跳机制,不过Codex更专注工程自动化,而OpenClaw更偏向生活自动化。
自动化功能的页面中,已预置了一些常见选项,比如摘要报告、事件分诊和代码质量等,在右上角有自动创建按钮。

官方给出的例子是让Codex长期检查不同渠道的消息并向用户报告重点,当用户输入“你能帮我盯着点,如果有遗漏就告诉我吗?”时,Codex会回复:它会每小时检查一次,只在有重要变化时才通知用户。

首次亮相的90+插件
新增的插件能够在文档、项目管理、代码审查、创意工作、部署等工具中收集上下文和采取行动。
这些支持插件包括GitHub、Slack、Linear、Notion、Dovetail、Sora等,JIRA、GitLab、CircleCI、微软全家桶、Databricks 旗下的 Neon 等工具也都接了进来。
另外有人提到:
桌面 App 本身也加了处理 GitHub review 评论、多终端标签、通过 SSH 连远程 devbox(开发沙箱)等功能,PDF、表格、幻灯片可以直接在侧边栏预览。

插件的调用方式非常简单,在对话框中@一下,选择插件即可。
可展开的内置浏览器,生图和写代码自动衔接
Codex的内置浏览器有一个方便的展开功能,展开后其下方仍带有对话框,可以继续与Codex进行交流。

在图像生成这块,官方展示了一个为网页中某局部生成图片并添加到网页中的应用demo。
在这项任务里,Codex自动使用 gpt-image-1.5 生成了一张匹配主题的高质量汉堡图片,并自动替换了 hero 占位区域,最后让网页实现了更新。感觉网站运营确实更加简单便捷了。

有了内置图像生成,这意味着做产品概念图、界面原型、游戏素材可以和写代码在同一个流程里完成。
1个复杂实例:收集多App反馈,汇总于Excel
OpenAI的团队成员 Nick Baumann 还给出了一个复杂的实际应用案例。他让Codex把分散在各种 App 里的反馈,快速变成结构化、可行动的表格,极大节省了人工整理时间。
首先,他输入“你能把 Slack、Gmail 和这个文件里的团队工作空间 alpha 反馈,合成到 Google Drive 的审查表格里吗?”指令。
随后,Codex便开始自动读取并分析了 Slack 消息、Gmail 邮件和文件内容。接着,将反馈按“主题”分组,并为每条反馈添加摘要、严重程度和置信度。然后自动更新 Google Sheets 表格,整理出优先级、需要立即修复的、可以稍后处理的等分类。
最后Codex还根据用户新指令进一步优化表格,比如调整顺序、添加颜色标记、清晰化格式,使其更易于产品、设计和工程团队审阅。这确实为工作中团队的Excel统计事项省事不少。

看到这里,大家是不是想立马上手新版本Codex了呢?
它的更新情况是:从今天开始推送给用 ChatGPT 账号登录桌面 App 的用户。当下只有Mac OS上能使用电脑操作功能,欧盟和英国稍后开放。对于记忆和上下文感知推荐功能,企业版、教育版以及欧盟和英国的用户会后续开放权限。
写在最后:迎接生产力爆发浪潮
Claude 在3月份就上线了computer use功能,Cursor 在4月初发布了为Agent 设计的全新版本 Cursor 3,OpenAI 的这次更新可以称是 Agentic AI 浪潮的最新信号。
过去AI只能生成代码,而现在则可以看屏幕、点鼠标、敲键盘、跑长任务、并行执行和多Agent协作。于是,前端迭代、测试、PR、JIRA跟进、周报生成都被自动化,普通人也能干复杂工作。
大家准备好迎接这波“日常生产力”爆发的浪潮了吗?欢迎玩得飞起的大佬在评论区分享自己的有趣经历。
相关链接:
https://x.com/OpenAI/status/2044827705406062670
https://x.com/dotey/status/2044917716893467109?s=20
https://x.com/nickbaumann_/status/2044848823823180102?s=20
https://www.youtube.com/watch?v=m0w9CnTXyRs&pp=ygUFQ29kZXg%3D
更多推荐



所有评论(0)