在北京时间8月8日凌晨1点,OpenAI举办了一场长达77分钟的发布会,GPT-5 在万众期待中发布了!这次发布不仅带来了全新的AI模型,也是对整个ChatGPT体验的全面升级。本文将带大家一起看看这次发布的重要亮点。

在这里插入图片描述

前言

GPT-5,被 CEO Sam Altman 称为和它交流仿佛是在和“博士级别专家”进行对话。相比于 GPT-4o,GPT-5模型生成速度、准确性都显著提升,并且GPT-5是所有 ChatGPT 用户(包括免费用户)的默认模型。在发布会上,Sam Altman 还举了一个例子来表示GPT各个版本的区别。

1、跟GPT-3沟通,有很多的幻觉,仿佛在和一个高中生沟通

2、跟GPT-4沟通,给我们的感觉是跟大学生沟通,而且是水平不错的大学生

3、跟GPT-5沟通,我们就像是在跟专家对话,这些专家能达到博士水平

模型产品统一

在经历了GPT-4众多模型的时代,OpenAI进行了产品线简化,GPT-5保留了几个核心的模型:

  • GPT-5 - 主力模型,适合日常对话和任务
  • GPT-5-Mini:GPT-5精简版,速度更快,成本更低
  • GPT-5-Nano:速度优先设计,延迟低,适合对性能敏感的应用。
  • GPT-5 Thinking - 强化推理版本,需要更长的思考时间
  • GPT-5 Pro - 专业版本(仅限付费用户)

让人非常惊喜的是:免费用户现在也能使用与付费用户相同的GPT5模型! 但是在使用量上有限制,免费用户1小时只能和GPT-5发送10条消息,达到限制后会自动切换到"GPT-5-mini"版本,GPT-5-mini几乎可以无限制使用。

性能提升

OpenAI公布了一些测试数据,结果显示,GPT-5在多个方面都有显著提升:

  • 编程能力:在SWE-bench编程基准测试中表现出色,得分达到74.9%
  • 多语言代码编辑:在Aider Polyglot测试中获得88%的高分
  • 视觉问题解决:在MMMU基准测试中也有不错表现
    在这里插入图片描述

在这里插入图片描述

不过,在这次GPT-5各项指标虽然都有提升,但相比之前GPT版本间各项指标的巨大提升,这次的提升幅度相对小一些。

幻觉大幅减少

在GPT-5中,产生幻觉的几率会大大减少,GPT-5 通过更先进的训练方法和更强的推理能力,显著减少了回答中的错误信息和无根据内容,幻觉率相比 GPT-4 和之前的版本明显降低。它能更好地区分事实与推测,从而减少“胡编乱造”的情况。

尤其是针对健康方面的问题。发布会上还邀请了一位癌症患者分享使用体验,他们展示了AI如何辅助他们更好地理解病情和治疗方案。同时,OpenAI也提醒用户不要盲目相信AI的医疗建议

个性化聊天风格

GPT-5推出了个性化聊天风格功能。除了默认风格外,用户还可以让GPT-5保持如下风格:

  • 愤世嫉俗者(Cynic) - 讽刺幽默,直言不讳
  • 机器人(Robot) - 精确高效,不带感情色彩
  • 倾听者(Listener) - 温暖轻松,善于反思
  • 书呆子(Nerd) - 顽皮好奇,热爱知识分享

用户还可以选择不同的颜色,来实现聊天个性化。
##

Google服务深度集成

从下周开始,ChatGPT Pro用户将可以使用GPT-5直接连接Google服务:

  • Google日历 - 帮助管理日程安排
  • Google通讯录 - 提供联系人信息
  • Gmail - 处理邮件相关任务

在发布会中,展示了一个案例,GPT-5通过读取邮件、日历信息帮助工程师安排跑步时间,GPT-5很好地扮演了人类助理的角色。

在这里插入图片描述

编程能力的提升

在编程方面,GPT-5的提升是显著的,

  • 可调节详细程度:开发者可以控制GPT-5回答的冗长程度
  • 更大上下文窗口:支持256,000个token(相比o3的200,000个token)
  • 优化的编程协作:GPT-5在Cursor上实测表现也非常好

如下是在发布会上生成的一个非常丝滑的示例程序:

在这里插入图片描述

这里,我也给出了一些提示词,让它帮我生成一个个人技术博客网站,它可以完整的将项目结构打包成一个压缩包,让用户下载到本地,并且可以随时提出改进建议对程序进行优化。
在这里插入图片描述

API定价策略

GPT-5 在定价策略方面更有竞争力,价格仅为 Claude Opus 4.1 的 1/15,对于开发者而言性价比更高。

  • GPT-5:输入$1.25/百万token,输出$10/百万token
  • GPT-5 mini:输入$0.25/百万token,输出$2/百万token
  • GPT-5 nano:输入$0.05/百万token,输出$0.40/百万token

在这里插入图片描述

总结

GPT-5 在多个方面进行了改进,包括模型精度提升、幻觉率降低以及个性化聊天风格的新增,整体体验较 GPT-4 有所优化。并且免费用户也可以使用GPT-5模型,降低了使用门槛.

尽管在编程能力、多模态处理等方面表现不错,但GPT-5提升幅度相较前几代模型较小,但GPT-5的API 定价具有一定竞争力,尤其是对于开发者而言。

整体来看,GPT-5的表现相对优秀,但离真正实现AGI(人工通用智能)还有很长的路要走。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐