花了好几天深度体验 GPT-5 的全家桶后,我想聊聊我的真实感受。结论先行:5-thinking 带来了断崖式的进步,但 Plus 用户的处境,真的有点尴尬。😩

🎯 5-thinking:精准与可靠性的断崖式飞跃

这部分是最大的惊喜!5-thinking 给我的解释,相比之前的 Claude 3 Opus 有了质的提升,主要体现在两点:更简短、更精准

过去用 Opus 经常遇到一个恼人的情况:它会用一堆我根本不认识的专业缩写来解释问题,缩写之间还夹杂着逻辑和幻觉,看得我头都大了🤯,只能强制它重说。

这次,我专门翻出那些 Opus 没解释明白的老问题去“拷问”5-thinking,结果非常惊艳。它似乎真的能知道我哪里不明白,给出的答案直击要害,干净利落。

尤其是在医疗健康领域5-thinking 给出的答案相当具有参考性。不夸张地说,在日常咨询层面,你几乎可以把它当成一个靠谱的家庭医生。👨‍⚕️

一句话总结:即便你暂时感觉不到它和 Opus 在输出质量上的明显差异,我也强烈建议你在分析知识类问题时切换到 5-thinking 它在抑制幻觉和欺骗性内容上的优势实在是太大了,这种可靠性的提升,完全可以弥补目前响应速度上的一点点劣势。

🐢 5-Pro:强大,但慢得让人难以忍受

算力更强的 5-Pro 我只试了十几个问题,因为实在太慢了。最短的一次也等了足足 8 分钟!⏳ 这比之前用深度研究模式生成一整篇文章的时间还长。

我的观点是:如果 Pro 的生成时间不能缩短到 3 分钟以内,我可能永远不会常用它。 这和当初的 o3 Pro 一样,因为同样的问题,我几乎也没怎么用过。

💔 AI伴侣的终结与“翻车”论的真相

最近社交媒体上很多人“失恋”了,纷纷怀念 GPT-4o 那种会哄人、更讨好用户的风格。虽然阿尔特曼同意暂时恢复 4o,但这只是权宜之计。出于对公司安全和用户心理健康的考量,那种“AI男/女朋友”风格的模型,未来大概率不会再推出了。🤖💔

至于那些说“GPT-5翻车了”的言论,基本都站不住脚。客观来说,AI大版本升级,性能提升的边际效益确实在递减。这次 4 到 5 的升级幅度,可能和当年 3.5 到 4 差不多。但这是整个行业的普遍现象。

那些“Grok 5 年底超越 GPT-5”的豪言壮语听听就好,毕竟 Grok 团队吹过的牛,常常要等到下一代产品才能勉强实现。真正能威胁到 GPT-5 的,还得是谷歌的 Gemini 3。传闻它可能在幻觉控制、上下文长度,甚至结合多模态世界模型(Genie 3)方面实现超越。🤔

😭 最受伤的竟是 Plus 用户?

要说吐槽,OpenAI 的 Plus 用户绝对最有资格。

  • 过去($20/月):基础模型随便用,推理模型中度用,高级推理偶尔用。
  • 现在($20/月):基础模型中度用(每3小时160条,且未来可能更少),推理模型(5-thinking)轻度用(最初每周仅200条),高级模型(5-Pro根本不准用

这简直是最倒霉的一档用户,可偏偏我们是付费的中坚力量。每月花200刀的顶配用户无限制,一分不花的用户也能轻度体验甚至被路由到 5-thinking。我们这20刀花得不上不下,相当憋屈。💸

从性价比来说,谷歌 Gemini 每月20美元的套餐显然更划算。

🙏 一丝希望:未来的额度调整

也许是收到了太多 Plus 用户的抗议,CEO 阿尔特曼后来提到,要把 5-thinking 的每周上限提高到 3000 条

如果这个承诺最终兑现,那我将毫不犹豫地从 Pro 降级回 Plus。这可省下了一大笔钱!在那之前,只能先忍耐了。🙏

在此,我们推荐小镜AI开放平台,它已在第一时间全面接入并支持GPT-5的完整系统。

作为国内领先的多模型中继与管理平台,小镜AI为用户提供了“即插即用、智能调度、高性价比”的一站式体验:

  • ✅ 无需折腾:彻底免去复杂的API申请、不稳定的网络环境配置和繁琐的海外支付流程,注册即用,即刻体验。
  • ✅ 一站式体验:一个账号,即可在统一的界面中无缝体验、切换和对比GPT-5、Claude 3.5/Opus、Gemini 2.5等全球所有顶尖模型,为您的业务找到最佳选择。
  • ✅ 高性价比:平台提供比官方更灵活、更具成本效益的计费方案,无论是个人尝鲜还是企业级应用,都能以极低的门槛享受到最前沿的技术红利。

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐