GPT-5达到博士水平？十分钟带你看懂核心亮点

OpenAI发布GPT-5：全面升级AI体验 OpenAI正式发布GPT-5，带来多项重大改进。全新模型具备博士级专家对话能力，相比前代产品显著提升了生成速度和准确性。产品线简化为主力模型、精简版、专业版等5个核心版本，且免费用户也能使用GPT-5（每小时限10条消息）。主要升级包括：编程能力提升（SWE-bench测试达74.9%）、幻觉率大幅降低、新增个性化聊天风格（4种可选）、Google

大志说编程

951人浏览 · 2025-08-12 14:05:59

大志说编程 · 2025-08-12 14:05:59 发布

在北京时间8月8日凌晨1点，OpenAI举办了一场长达77分钟的发布会，GPT-5 在万众期待中发布了！这次发布不仅带来了全新的AI模型，也是对整个ChatGPT体验的全面升级。本文将带大家一起看看这次发布的重要亮点。

在这里插入图片描述

前言

GPT-5，被 CEO Sam Altman 称为和它交流仿佛是在和“博士级别专家”进行对话。相比于 GPT-4o，GPT-5模型生成速度、准确性都显著提升，并且GPT-5是所有 ChatGPT 用户（包括免费用户）的默认模型。在发布会上，Sam Altman 还举了一个例子来表示GPT各个版本的区别。

1、跟GPT-3沟通，有很多的幻觉，仿佛在和一个高中生沟通

2、跟GPT-4沟通，给我们的感觉是跟大学生沟通，而且是水平不错的大学生

3、跟GPT-5沟通，我们就像是在跟专家对话，这些专家能达到博士水平

模型产品统一

在经历了GPT-4众多模型的时代，OpenAI进行了产品线简化，GPT-5保留了几个核心的模型：

GPT-5 - 主力模型，适合日常对话和任务
GPT-5-Mini：GPT-5精简版，速度更快，成本更低
GPT-5-Nano：速度优先设计，延迟低，适合对性能敏感的应用。
GPT-5 Thinking - 强化推理版本，需要更长的思考时间
GPT-5 Pro - 专业版本（仅限付费用户）

让人非常惊喜的是：免费用户现在也能使用与付费用户相同的GPT5模型！ 但是在使用量上有限制，免费用户1小时只能和GPT-5发送10条消息，达到限制后会自动切换到"GPT-5-mini"版本，GPT-5-mini几乎可以无限制使用。

性能提升

OpenAI公布了一些测试数据，结果显示，GPT-5在多个方面都有显著提升：

编程能力：在SWE-bench编程基准测试中表现出色，得分达到74.9%
多语言代码编辑：在Aider Polyglot测试中获得88%的高分
视觉问题解决：在MMMU基准测试中也有不错表现

在这里插入图片描述

不过，在这次GPT-5各项指标虽然都有提升，但相比之前GPT版本间各项指标的巨大提升，这次的提升幅度相对小一些。

幻觉大幅减少

在GPT-5中，产生幻觉的几率会大大减少，GPT-5 通过更先进的训练方法和更强的推理能力，显著减少了回答中的错误信息和无根据内容，幻觉率相比 GPT-4 和之前的版本明显降低。它能更好地区分事实与推测，从而减少“胡编乱造”的情况。

尤其是针对健康方面的问题。发布会上还邀请了一位癌症患者分享使用体验，他们展示了AI如何辅助他们更好地理解病情和治疗方案。同时，OpenAI也提醒用户不要盲目相信AI的医疗建议。

个性化聊天风格

GPT-5推出了个性化聊天风格功能。除了默认风格外，用户还可以让GPT-5保持如下风格：

愤世嫉俗者（Cynic） - 讽刺幽默，直言不讳
机器人（Robot） - 精确高效，不带感情色彩
倾听者（Listener） - 温暖轻松，善于反思
书呆子（Nerd） - 顽皮好奇，热爱知识分享

用户还可以选择不同的颜色，来实现聊天个性化。

Google服务深度集成

从下周开始，ChatGPT Pro用户将可以使用GPT-5直接连接Google服务：

Google日历 - 帮助管理日程安排
Google通讯录 - 提供联系人信息
Gmail - 处理邮件相关任务

在发布会中，展示了一个案例，GPT-5通过读取邮件、日历信息帮助工程师安排跑步时间，GPT-5很好地扮演了人类助理的角色。

在这里插入图片描述

编程能力的提升

在编程方面，GPT-5的提升是显著的，

可调节详细程度：开发者可以控制GPT-5回答的冗长程度
更大上下文窗口：支持256,000个token（相比o3的200,000个token）
优化的编程协作：GPT-5在Cursor上实测表现也非常好

如下是在发布会上生成的一个非常丝滑的示例程序：

在这里插入图片描述

这里，我也给出了一些提示词，让它帮我生成一个个人技术博客网站，它可以完整的将项目结构打包成一个压缩包，让用户下载到本地，并且可以随时提出改进建议对程序进行优化。
在这里插入图片描述

API定价策略

GPT-5 在定价策略方面更有竞争力，价格仅为 Claude Opus 4.1 的 1/15，对于开发者而言性价比更高。

GPT-5：输入$1.25/百万token，输出$10/百万token
GPT-5 mini：输入$0.25/百万token，输出$2/百万token
GPT-5 nano：输入$0.05/百万token，输出$0.40/百万token

在这里插入图片描述

总结

GPT-5 在多个方面进行了改进，包括模型精度提升、幻觉率降低以及个性化聊天风格的新增，整体体验较 GPT-4 有所优化。并且免费用户也可以使用GPT-5模型，降低了使用门槛.

尽管在编程能力、多模态处理等方面表现不错，但GPT-5提升幅度相较前几代模型较小，但GPT-5的API 定价具有一定竞争力，尤其是对于开发者而言。

整体来看，GPT-5的表现相对优秀，但离真正实现AGI（人工通用智能）还有很长的路要走。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

GPT-5.5能力全景研究：从架构到表现的系统性拆解

2048 AI社区

AI+ERP场景地图：哪些业务最值得优先智能化？（AI+ERP系列-6）

2048 AI社区

2026 简历突围：0 基础如何用 RAG 项目打动面试官？（全栈实战指南）

2026年企业级AI应用已成为求职硬通货，本文提供零基础搭建RAG知识库的实战方案。采用Java+Python双语言架构：Java负责业务稳定性（SpringBoot），Python实现AI功能（LangChain）。关键步骤包括容器化部署、数据清洗、混合检索策略和安全护栏设计。项目亮点在于工程化思维培养，解决企业知识孤岛问题。简历包装建议采用STAR法则，突出混合检索、双语言协作等企业级能力。掌