史上最强大模型 GPT-5 已于8月8日凌晨正式发布,这一代模型无论在智力水平、推理效率、安全防护还是订阅体系上都领先前代一个维度。官方宣称 GPT-5 的综合表现已经达到「博士级专家」——不仅能写诗作曲、生成前端应用,还能就肿瘤分型或 AIME 竞赛数学题给出严谨答案。

为何说 GPT-5 已达博士级?

在开场介绍GPT-5时,奥特曼简单回顾了下从GPT-3到4,再到5的历程。他自己比喻说,“GPT-3像个高中生,GPT-4像个大学生,而GPT-5则已经变成了一名各个领域的专家。

在“让我迅速了解什么是伯努利效应(Bernouli effect)”的指令下,GPT-5迅速给出了关于伯努利效应的详细解释。而当用户再要求用SVG动画演示时,GPT-5则直接开始进入深度思考模式,两分钟生成了420行代码,让我们看到了可交互的动画。

值得注意的是,用户可以自由调整飞行速度和角度,气流线条也跟着实时变动。这不仅是可视化的知识输出,更是个性化、具备教学辅助价值的模拟系统。

在正经的科研场景中,GPT-5 表现得也像一位“跨学科博士后”。免疫学教授用 GPT-5 解读实验数据,模型不仅能解释结果,还会预测未来实验趋势,并主动提出下一步实验方案,大大压缩了科研迭代周期。

在专业能力上,据 OpenAI 披露的数据,GPT-5 在大约一半的案例中和行业专家水平相当或更好。

GPT-5 的诞生,标志着通用模型从“高级助手”进化为“跨学科博士级合作者” 。接下来,最值得关注的并非模型本身的分数,而是——谁能在安全前提下,把 GPT-5 的深度推理真正融入科研流程。

不是单个模型,而是一整个系统

GPT‑5 最大的升级,不在于参数量的堆叠,而在于架构的彻底变化:它从一个模型,变成了一个多个子模型协作的系统。你看到的还是一个 ChatGPT,但背后其实是多个模型在分工配合:

  • 快速模型:响应迅速,用于处理大多数日常提问;
  • 推理模型:专门负责复杂逻辑、数学计算和编程任务;
  • 智能路由:会根据提问的类型、难度,甚至用户语气,自动决定该切换哪个模型。

比如你在对话中加一句「认真想一想」,它就能识别并启用“深度推理”模式。对用户来说一切无感,但背后早已完成一次智能切换。

目前面向普通用户,GPT-5提供免费、Plus和Pro三种模式。

性能提升,测试成绩几乎屠榜

GPT‑5 在多个评测中全面刷新成绩:
image.png

在编程方面,GPT-5 的编码性能超越了 Claude Opus 4.1,成为全球“最强”的编码模型。它在 SWE-Bench 上的准确率达到了 74.9%,略高于 Claude 的 74.5%。

image.png

API 性价比超预期

GPT‑5 的定价策略相较 GPT‑4o 更具吸引力:

  • 输入 token 单价是 GPT‑4o 的一半,输出价格基本持平;
  • 输出中包含用于推理的“不可见 token”,也就是说相同内容可能会用更多 token;
  • 短时间内重复使用相同输入 token 可享受 90% 折扣 —— 聊天类产品非常适合;
  • 支持 token 缓存、精细控制,甚至可以选择不同的“推理等级”以控制成本和效果。

image.png

快速体验 GPT-5

Xroute.ai,快速接入 GPT-5,即刻享用!还有更多大模型可以使用~

image.png

image.png

image.png

写在最后

GPT-5的发布标志着人工智能技术又一次重大突破。从技术参数到性能表现,从成本控制到实际应用,GPT-5都展现了作为新一代AI王者的实力。虽然在某些特定领域,Claude 4、Gemini 2.5 Pro等竞争对手仍有优势,但GPT-5在综合性能、可靠性和通用性方面的领先地位已经确立。

对于企业和开发者而言,选择哪个AI模型取决于具体的应用场景和需求。但毫无疑问的是,GPT-5的出现再次推高了AI能力的上限,为人工智能在各个领域的深度应用开辟了新的可能性。

在这个AI技术快速迭代的时代,我们有理由相信,GPT-5只是这场技术革命中的一个重要节点,更多令人期待的突破还在前方等待着我们去发现和探索。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐