GPT-5.5发布：OpenAI宣称这是通往AGI的“最后一公里”，AI竞赛进入新阶段！

OpenAI发布革命性AI模型GPT-5.5（代号"Spud"），这是自GPT-4.5以来首个完全重新训练的基础模型。该模型在多项指标上取得突破：Terminal-Bench得分82.7%，长上下文召回率提升37.4%，幻觉率降低60%，并集成Codex编程能力与自主任务执行功能。与Claude Opus 4.7和Gemini 3.1 Pro相比，GPT-5.5在代码执行和在线

我算是程序猿

185人浏览 · 2026-04-24 16:23:07

我算是程序猿 · 2026-04-24 16:23:07 发布

OpenAI发布了全新模型GPT-5.5，这是自GPT-4.5以来首次从零完全重新预训练的基础模型，代号“Spud”。GPT-5.5在Terminal-Bench得分达82.7%，长上下文召回率提升37.4%，幻觉率降低60%，并在Codex深度集成、自主任务执行等方面展现强大能力。OpenAI CEO Sam Altman称其为通往AGI路上的最后一个大里程碑。与Claude Opus 4.7和Gemini 3.1 Pro的对比显示，GPT-5.5在代码执行和在线研究中表现优异，但各模型在特定领域仍有所长。GPT-5.5的API定价已公布，尽管价格翻倍，但Token效率提升40%，综合成本增幅约20%。ChatGPT Plus及更高版本已上线支持GPT-5.5，API即将上线。GPT-5.5的发布标志着AI竞赛进入新阶段，定义了下一代AI的基准线。

Altman原话：「AGI前的最后一个里程碑」

🤯 突发

就在昨天，OpenAI 正式发布了 GPT-5.5，代号「Spud」（土豆）。

这不是一次常规更新——它是自 GPT-4.5 以来，OpenAI 首次从零完全重新预训练的基础模型。

10万卡集群、1M tokens上下文、融合o1推理框架。Altman亲口说：这是通往AGI路上，最后一个大的里程碑。

这份速览，帮你3分钟看懂所有重磅更新。

📊 核心数据


82.7% Terminal-Bench 得分前代 75.1% → +7.6pp	+37.4pp 长上下文召回率提升 36.6% → 74.0%
-60% 幻觉率大幅降低金融场景合规价值显著	+40% Token效率提升综合成本仅增约20%

数据来源：OpenAI 官方基准测试 & AI Insight 深度报告

🔥 5大核心能力

① 完全重训练：不是升级，是重建

此前 GPT-5.1/5.2/5.3/5.4 全部基于同一基础模型微调，而 5.5 是自 GPT-4.5 以来首次从预训练起点重建。融合 GPT 生成能力 + o1 结构化推理框架，10万卡 GB200 NVL72 集群训练。

② 长上下文：从「勉强可用」到「真正可部署」

支持 1M tokens 上下文窗口，召回率从 36.6% 跃升至 74.0%（+37.4pp）。合同分析、代码库审计、研究综述从此可以真正投入生产。

③ Codex深度集成：编程能力天花板

擅长实现/重构/调试/测试四类核心编码任务。前端代码生成被认为碾压 Claude Opus 4.7，跨文件代码审计能力大幅提升。Codex 场景下 Token 消耗显著降低。

④ 自主任务执行：你只管说，它来干

可直接输入多步骤、结构混乱的任务描述，模型自动解析执行。支持工具调用、结果校验，能自动处理不确定情况——真正意义上的 Agent 能力。

⑤ 幻觉率暴降60%：企业级可用

纽约银行 CIO 评价「令人印象深刻的抗幻觉能力」。金融、医疗、法律等高风险场景的合规价值显著提升，AI生成的结果终于能真正信任。

⚔️ 三巨头横评

GPT-5.5 vs Claude Opus 4.7 vs Gemini 3.1 Pro，谁才是真正的AI之王？


评测项	GPT-5.5	Claude 4.7	Gemini 3.1
Terminal-Bench	82.7 🏆	69.4	68.5
SWE-Bench Pro	58.6	64.3 🏆*	—
BrowseComp Pro	90.1 🏆	—	85.9
写作偏好	29%	47% 🏆	24%
智能指数	60 🏆	57	57

* OpenAI 质疑 Claude 在 SWE-Bench Pro 部分题目存在记忆化嫌疑。数据来源：AI Insight 综合评测

**一句话结论：**GPT-5.5 在代码执行和在线研究中碾压全场，Claude 在编程和写作上仍有优势，Gemini 在浏览和信息检索上紧咬不放。AI 竞争进入「各有所长」阶段。

💬 关键声音

「这是AGI前的最后一个重大里程碑。」

—— Sam Altman，OpenAI CEO

「这不是渐进式改进，而是我们思考模型开发方式的根本性转变。凝聚了两年的研究成果。」

—— Greg Brockman，OpenAI 联合创始人

「意义重大……快速改进并未结束。」

—— Ethan Mollick，沃顿商学院教授

「令人印象深刻的抗幻觉能力。」

—— 纽约银行 CIO

💰 API定价


模型	输入价格	输出价格
GPT-5.5	$5/M tokens	$30/M tokens
GPT-5.5 Pro	$30/M tokens	$180/M tokens
GPT-5.4（参考）	$2.5/M tokens	$15/M tokens

**算一笔账：**价格翻倍，但 Token 效率 +40%，Batch API 享 50% 折扣，综合成本增幅约 20%。贵了，但性能提升对得起这个价。

🚀 怎么用


ChatGPT	Plus / Pro / Business / Enterprise 已上线
Codex	已设为默认推荐模型
API	即将上线，模型ID: gpt-5.5

GPT-5.5 不是在追赶竞争者，
是在定义下一代AI的基准线。

Altman说这是「AGI前的最后一个里程碑」。
如果他说的是真的——那下一个里程碑，就是AGI本身。

结语：抓住大模型时代的职业机遇

AI大模型的发展不是“替代人类”，而是“重塑职业价值”——它淘汰的是重复性、低附加值的工作，却催生了更多需要“技术+业务”交叉能力的高端岗位。对于求职者而言，想要在这波浪潮中立足，不仅需要掌握Python、TensorFlow/PyTorch等技术工具，更要深入理解目标行业的业务逻辑（如金融的风险控制、医疗的临床需求），成为“懂技术、懂业务”的复合型人才。

无论是技术研发岗（如算法工程师、研究员），还是业务落地岗（如产品经理、应用工程师），大模型都为不同背景的职场人提供了广阔的发展空间。只要保持学习热情，紧跟技术趋势，就能在AI大模型时代找到属于自己的职业新蓝海。

最近两年大模型发展很迅速，在理论研究方面得到很大的拓展，基础模型的能力也取得重大突破，大模型现在正在积极探索落地的方向，如果与各行各业结合起来是未来落地的一个重大研究方向

大模型应用工程师年包50w+属于中等水平，如果想要入门大模型，那现在正是最佳时机

2025年Agent的元年，2026年将会百花齐放，相应的应用将覆盖文本，视频，语音，图像等全模态

如果你对AI大模型入门感兴趣，那么你需要的话可以点击这里大模型重磅福利：入门进阶全套104G学习资源包免费分享！

扫描下方csdn官方合作二维码获取哦！

在这里插入图片描述

给大家推荐一个大模型应用学习路线

这个学习路线的具体内容如下：

第一节：提示词工程

提示词是用于与AI模型沟通交流的，这一部分主要介绍基本概念和相应的实践，高级的提示词工程来实现模型最佳效果，以现实案例为基础进行案例讲解，在企业中除了微调之外，最喜欢的就是用提示词工程技术来实现模型性能的提升

第二节：检索增强生成（RAG）

可能大家经常会看见RAG这个名词，这个就是将向量数据库与大模型结合的技术，通过外部知识来增强改进提升大模型的回答结果，这一部分主要介绍RAG架构与组件，从零开始搭建RAG系统，生成部署RAG，性能优化等

第三节：微调

预训练之后的模型想要在具体任务上进行适配，那就需要通过微调来提升模型的性能，能满足定制化的需求，这一部分主要介绍微调的基础，模型适配技术，最佳实践的案例，以及资源优化等内容

第四节：模型部署

想要把预训练或者微调之后的模型应用于生产实践，那就需要部署，模型部署分为云端部署和本地部署，部署的过程中需要考虑硬件支持，服务器性能，以及对性能进行优化，使用过程中的监控维护等

第五节：人工智能系统和项目

这一部分主要介绍自主人工智能系统，包括代理框架，决策框架，多智能体系统，以及实际应用，然后通过实践项目应用前面学习到的知识，包括端到端的实现，行业相关情景等

学完上面的大模型应用技术，就可以去做一些开源的项目，大模型领域现在非常注重项目的落地，后续可以学习一些Agent框架等内容

上面的资料做了一些整理，有需要的同学可以下方添加二维码获取（仅供学习使用）

在这里插入图片描述

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

gstack：让一个人拥有整个工程团队的生产力

2048 AI社区

2026年AI搜索优化源码搭建全实测：从环境适配到启动验证，新手零踩坑指南

2048 AI社区

Flutter for OpenHarmony 地图功能萌系实战指南：给 App 加上超萌 “小地图”✨

适配的时候我发现，鸿蒙设备上地图缩放有时候会有点卡顿，后来给地图加了RepaintBoundary，像给地图单独开了个小房间，渲染一下子就丝滑了！”，用户同意后，地图就会显示当前位置，点上一个粉粉的小标记，像给用户的位置盖了个可爱的章～就像给 App 配了个会发光的 “导航小助手”，不仅能显示用户位置，还能缩放地图、打可爱的小标记，用起来超治愈～地图最可爱的功能，就是能找到用户的位置，点个粉粉的小