GPT-5发布！人人都能用上的「博士级」智能模型！

LMArena全榜第一目前，国内一站式AI工具平台——天意科研云，已上线 GPT-5 模型，无需魔法即可使用。👉 天意科研云地址：ai.dftianyi.com据山姆・奥特曼介绍，目前，GPT-5 面向普通用户提供免费、Plus 及 Pro 三种使用模式。API 平台也推出了 GPT-5、GPT-5 mini 和GPT-5 nano 三款模型供选择。这一次，OpenAI 不再是挤牙膏式更新，相较

qq_42275724

258人浏览 · 2025-08-08 15:53:29

qq_42275724 · 2025-08-08 15:53:29 发布

大家期待已久的 GPT-5 ，终于面世了！

LMArena全榜第一

目前，国内一站式AI工具平台——天意科研云，已上线 GPT-5 模型，无需魔法即可使用。

👉 天意科研云地址：ai.dftianyi.com

据山姆・奥特曼介绍，GPT-5 是一个集成模型，它会根据问题自己决定什么时候需要深入思考，不需要你在各个模型中切换。

目前，GPT-5 面向普通用户提供免费、Plus 及 Pro 三种使用模式。API 平台也推出了 GPT-5、GPT-5 mini 和GPT-5 nano 三款模型供选择。

这一次，OpenAI 不再是挤牙膏式更新，相较于 GPT-4 系列模型，新一代模型在逻辑推理、多模态处理及编码能力等方面都有了质的飞跃。尤其在编码方面，GPT-5 在网页开发中表现已经超越了 Claude Opus 4 模型。

关于 GPT-5 的编程能力，山姆・奥特曼此前也曾在 X（原推特）上发布动态，疑似在暗示 GPT-5 具备很强的编程能力。

下面用一张图展示 GPT-5 与前几代 ChatGPT 之间的关系。

根据测试结果显示，GPT-5 的幻觉率大幅降低。在含至少一个重大事实错误的回答数量上，gpt-5-main 较 GPT-4o 减少 44%，而 gpt-5-thinking 则比 OpenAI o3 降低 78%。

此外，GPT-5 在回答方面也更人性化，不会像 GPT-4o 那么迎合人类，和 GPT-5 对话更像是在和一位博士水平的朋友聊天。

GPT-5 性能测试

现在再来看看GPT-5的跑分情况。

AIME 0225数学竞赛中，GPT-5 在没有工具的情况下拿到了 96.7% 的高分，在使用 Python 的情况下，GPT-5 得分达到 100%。

在 SWE-bench Verified 基准测试中，GPT-5 在现实世界编程能力领先 GPT-o3 和 GPT-4o。

在博士级科学问题测试中，GPQA Diamond 取得 88.4% 的成绩，创下新高。而 GPT-5 Pro 版本的表现更为出色，得分达到 89.4%。

GPT-5 在人类最后的考试测试中再创新高，超越了 ChatGPT Agent。

在多模态理解方面，GPT-5 取得了 84.2% 的分数，其中视觉理解大幅提升。

在思考模式下，GPT‑5 能用更短的思考时间创造更大价值。在视觉推理、智能体编程、研究生级科学问题解决测试中，GPT‑5 （思考模式）的性能大幅领先GPT-o3 模型，同时其输入token 量还减少了 50%-80%，这意味着 GPT-5 的性价比更高。

网友实测体验

不少网友也纷纷上手实测，网友 @William Holmberg 只用 6 分钟就通过 GPT-5 做了一个开放世界 MMORPG 游戏。

还有网友用 GPT-5 做了超级玛丽游戏，还原度不错。

@Ethan Mollick 网友用 GPT-5 做了一款程序化的 Brutalist 风格建筑创建器，可以拖拽的方式编辑建筑。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

代码分支命名规范

短生命周期：feature/、bugfix/ 分支只存在到合并到 develop 或 main 后即可删除。长期分支：main、develop、release/x.y.z 可以保留。多人协作可加用户或任务 ID 前缀（可选）Bug 修复分支 bugfix/xxx。发布分支 release/x.y.z。功能描述尽量简短，便于在命令行显示。功能分支 feature/xxx。紧急修复

2048 AI社区

国产算力部署大模型神器—Chitu 首场Meetup，携国产算力生态伙伴，GOSIM 杭州首次齐亮相！

2048 AI社区

计算机毕业设计项目选题推荐（源码+论文+项目讲解）

【计算机毕设资源分享】为帮助大四学生高效完成毕业设计，现提供80+高分项目资源包，包含：SpringBoot管理系统、Vue后台、微信小程序等主流技术栈项目。所有项目均含完整源码、设计文档及创新点（如AI问答、协同过滤算法、Echarts可视化等），支持代码指导与功能定制。特色包括真实答辩项目、全定制开发流程（需求分析→部署手册）及独特创新设计，特别适合基础薄弱的学生快速上手。项目涵盖智慧社区、非