突发!GPT-5编程版本来了:连续编程7小时不停,还能自动找出致命缺陷

原创 Aitrainee AI进修生 2025年09月16日 07:52 湖南

OpenAI 也是在代码上继续发力了。

大家伙应该都期望出现下一个Claude级别的代码模型。毕竟Claude很好,但Anthropic很不好。

OpenAI 刚刚发布了专门用于编码的 GPT-5-Codex,这其实是一个GPT5的一个版本。针对 Codex 中的代理编码进一步优化的 GPT-5 版本。

,时长00:10

GPT-5-Codex 的训练重点是现实世界的软件工程工作;并独立处理冗长而复杂的任务。它的代码审查功能可以在发布之前发现关键错误。

自从 4 月首次推出 Codex CLI 和 5 月首次推出 Codex web 以来,Codex 正在稳步发展。

图片

图片

图片

Codex 可以在你开发的地方运行——在终端或 IDE、Web 上、GitHub 中,甚至在 ChatGPT iOS 应用程序中。

GPT-5-Codex 是 GPT-5 的一个版本,针对 Codex 中的代理软件工程进行了进一步优化。它接受了复杂的、现实世界的工程任务的训练,例如从头开始构建完整项目、添加功能和测试、调试、执行大规模重构以及进行代码审查。

它更易于纵,更好地遵守 AGENTS.md 指令,并生成更高质量的代码——只需告诉它你需要什么,而无需编写有关样式或代码清洁度的冗长说明。

图片

GPT-5-Codex 会根据任务的复杂性更动态地调整它花在思考上的时间。

该模型结合了编码代理的两项基本技能:在交互式会话中与开发人员配对,以及在较长的任务上持久、独立地执行。

这意味着 Codex 在处理定义明确的小请求或与它聊天时会感觉更敏捷,并且在大型重构等复杂任务上工作时间更长。

在测试过程中, GPT-5-Codex 在大型复杂任务上一次独立工作超过 7 小时,迭代其实现,修复测试失败,并最终交付成功的实施。

在 OpenAI 员工流量上,对于按模型生成的 token(包括隐藏推理和最终输出)排序的后 10% 的用户轮次,GPT-5-Codex 使用的 token 比 GPT-5 少 93.7%。相反,对于前 10% 的人,GPT-5-Codex 思考得更多,花费两倍的时间在推理、编辑和测试代码以及迭代上。

图片

GPT-5-Codex。一个专门用来做代码审查,和找出致命缺陷的模型。

它会自己去导航你的代码库。

自己去理清所有的依赖关系。自己去运行代码和测试,来验证一切是否正确。

Openai在一堆知名的开源项目上,测试了它的能力。然后让资深工程师去评判它的审查评论。

结论:

它给出的评论,很少有不正确或不重要的。,从而将

这意味着,它能把你的注意力,更多的保留在关键问题上。

图片

Codex CLI 是开源的,可以直接在 CLI 中附加和共享图像(屏幕截图、线框图和图表)在执行更复杂的工作时,Codex 现在使用待办事项列表跟踪进度,并包括用于连接到外部系统的 Web 搜索和 MCP 等工具。

这次除了新模型,终端 UI 也进行了升级:工具调用和差异的格式更好,更易于理解。

它还支持压缩对话状态,使较长的会话更易于管理。

图片

Codex CLI 扩展

,时长00:27

Codex 还新增了代码审查功能,旨在捕获严重缺陷。

它能理解 PR 意图,并结合整个代码库进行推理,可以通过运行代码和测试来验证行为。

启用后,Codex 会自动审查 GitHub PR,并可根据指令直接实现修改。在 OpenAI 内部,Codex 每天审查大量 PR 并发现数百个问题。

图片

价格

Plus(增强版)

  • 本地任务:普通用户平均每 5 小时可发送 30–150 条消息,并有每周上限。

  • 云端任务:在有限时间内提供慷慨的额度。

最适合希望每周进行几次专注编程会话的开发者。


Pro(专业版)

  • 本地任务:普通用户平均每 5 小时可发送 300–1,500 条消息,并有每周上限。

  • 云端任务:在有限时间内提供慷慨的额度。

最适合希望在多个项目中支撑全天工作的开发者。


Business(企业版)  企业版计划包含与 Plus 相同的每用户使用上限。企业版计划采用灵活定价,用户可购买额外额度以增加超出基础上限的本地任务使用量。更多详情请参考 ChatGPT 费率表。

开始使用:

npm i -g @openai/codex

公告:https://openai.com/index/introducing-upgrades-to-codex/

🌟 知音难求,自我修炼亦艰,抓

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐