山姆·奥特曼举起手机,向世界宣布:“你口袋里的博士级专家,今天正式上岗。”

img

2025年8月8日凌晨1点,旧金山发布会现场,OpenAI CEO山姆·奥特曼轻点手机屏幕。短短5分钟内,一个功能完整的法语学习应用在众目睽睽之下诞生——从零代码到全功能实现,完全由AI自主完成。这个震撼演示的主角,正是OpenAI最新发布的GPT-5

“这标志着我们迈向通用人工智能(AGI)的关键一步。”奥特曼在发布会上郑重宣布。他同时给出了一个生动比喻:GPT-3如同高中生,GPT-4像大学生,而GPT-5已达到博士级专家水平


1 历史性发布,全民AI时代开启

此次GPT-5发布打破了OpenAI的多个传统。这是首次向免费用户开放旗舰模型,所有ChatGPT用户都能直接体验GPT-5的强大能力。尽管免费账户有使用配额限制,但超出后仍可使用轻量版GPT-5 Mini。

OpenAI采用分层策略推出三个版本:

  • GPT-5旗舰版:最强推理与多模态能力,支持400K上下文窗口(相当于一本书的容量)
  • GPT-5 Mini:高性价比,适合中小企业和开发者
  • GPT-5 Nano:超低延迟,专为移动设备和嵌入式系统优化

定价策略堪称“价格屠夫”:标准版输入仅需 $1.25/百万tokens,输出$10/百万tokens,比GPT-4 Turbo成本降低超80%。这种激进定价被业界视为抢占B端市场的战略举措。

2 技术跨越,博士级智能全面进化

根据OpenAI公布的测试数据,GPT-5实现了全方位的性能跃升

  • 编程能力:在SWE-bench测试中达到74.9%准确率,远超GPT-4o的30.8%
  • 数学推理:在AIME 2025测试中取得94.6%的惊人准确率,可独立解决高难度数学问题
  • 可靠性突破:幻觉率(编造答案的概率)较GPT-4o降低45%,比早期模型降低80%

642

GPT-5的革命性功能“氛围编程”(Vibe Coding)引发开发者热议。仅需自然语言描述,即可生成200+行代码,10分钟内完成全栈开发。

实测案例显示,开发者用它成功复刻了Windows 95系统、3D生命游戏和魔方求解器等复杂项目。

多模态能力全面升级,支持文本、图像、语音、视频的全方位交互。在医疗领域,GPT-5在HealthBench Hard测试中得分46.2%,可辅助解读医学影像。

超长文本处理能力是另一大亮点。400K上下文窗口让AI能一次性处理整本书籍、完整项目文档或数百页法律合同。这种能力正在重塑信息密集型行业的工作流程。

3 真实世界,AI助手落地应用

发布不到72小时,GPT-5已在多个领域展现惊人实用价值

  • 医疗辅助:用户Carolina被诊断出三种癌症,GPT-5帮助她翻译复杂医学术语,理解报告并准备关键问题
  • 药物研发:安进公司(Amgen)利用GPT-5优化药物设计流程,高效分析科学文献;Moderna则用它自动补全临床试验协议,减少人工审核
  • 创意开发:YouTube博主已用GPT-5生成赛博版乐高、3D流体模拟和多邻国克隆版等创意项目

GPT-5还引入了个性化交互功能

  • 四种预设人格:愤世嫉俗者(Cynic)、机器人(Robot)、倾听者(Listener)与书呆子(Nerd),满足不同对话需求
  • 智能连接:Memory功能可连接Gmail、Google Calendar,自动提醒未回复邮件,并结合行程提供个性化建议

4 免费体验,博士级助手触手可及

普通用户可通过多种方式体验GPT-5:

  • 免费用户:登录ChatGPT官网或App,切换至GPT-5模型(有使用额度限制)
  • Plus会员($20/月):更高使用配额,支持GPT-5-Thinking深度思考模式
  • Pro用户($200/月):无限访问GPT-5 Pro,支持500万Token上下文处理整本书或企业级数据库

开发者可通过API调用三个版本,成本最低至$0.05/百万Token。企业用户则可通过微软生态全面接入,GPT-5已整合至Microsoft 365 Copilot、Azure、GitHub等产品线。

5 争议与挑战,AGI之路尚远

尽管成就斐然,GPT-5仍面临质疑。发布会现场演示时,当被问及伯努利原理在机翼应用的经典问题,GPT-5仍给出了不够准确的解释。奥特曼也坦承:“尽管是通向AGI的重要里程碑,但要实现媲美人脑的机器智能,仍存在诸多技术瓶颈。”

部分用户认为性能提升未达“AGI突破”预期,甚至调侃“不如叫GPT-4.6”。更尴尬的是,发布会上一张性能对比图出现低级错误(显示52.8 > 69.1),网友戏称“PPT是GPT-5自己做的吗?”

安全策略的调整也引发关注。GPT-5不再简单拒绝敏感请求,而是在安全范围内尽可能帮助用户,或引导至第三方资源。这种“柔性安全”策略效果如何,仍需时间检验。


全球AI格局正在重构。GPT-5在综合能力排行榜位列第一,超越Google Gemini 2.0 Ultra和国产翘楚DeepSeek-R1。但其在中文理解方面仍落后于DeepSeek-R1(95% vs 98.3%),在多模态处理上也略逊于Gemini 2.5。

微软创始人比尔·盖茨在社交媒体评价:“GPT-5不是最聪明的AI,却是迄今最接近可持续落地的AI助手。”随着GPT-5向全球7亿ChatGPT用户开放,博士级智能正从实验室走进千家万户
I,却是迄今最接近可持续落地的AI助手。”随着GPT-5向全球7亿ChatGPT用户开放,博士级智能正从实验室走进千家万户

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐