Claude Opus 4.1 模型发布!编程实力遥遥领先!
刚刚,Claude Opus 4.1 正式发布!目前,国内一站式AI工具平台——天意科研云,已上线 Claude Opus 4.1 模型,无需魔法即可使用。👉 天意科研云地址:ai.dftianyi.comAnthropic 在发布 Claude Opus 4 不久后,昨天凌晨再次推出 Claude Opus 4.1,编程能力再次提升。按照官方的说法,Opus 4.1 并不是一次彻底换代,而是对
刚刚,Claude Opus 4.1 正式发布!
目前,国内一站式AI工具平台——天意科研云,已上线 Claude Opus 4.1 模型,无需魔法即可使用。
👉 天意科研云地址:ai.dftianyi.com
Anthropic 在发布 Claude Opus 4 不久后,昨天凌晨再次推出 Claude Opus 4.1,编程能力再次提升。
按照官方的说法,Opus 4.1 并不是一次彻底换代,而是对 Opus 4 的深度优化,全面提升了Agent代理任务、现实世界编程和逻辑推理能力。
此外,Anthropic 还在官方新闻稿中还留了“彩蛋”——表示未来几周会对模型进行重大改进。
这几乎等同于提前敲响了 “Claude 5” 的前奏,虽然没有明说,但暗示意味十足。而 Opus 4.1 很可能只是一个过渡模型,但其能力已经足够惊艳。
综合能力显著提升
如果你以为这是一次轻量更新,那就低估了 Anthropic 的节奏控制力。
在 SWE-bench Verified 基准测试中,Opus 4.1 以 74.5% 的成绩领先,超越了Claude Opus 4、Gemini 2.5 Pro、ChatGPTo3,在编码任务中排名第一。
有网友在第一时间测评体验了 Opus 4.1,让其生成一款“台球游戏”。可以看到最终生成效果相当不错,这种体验在以前的 Claude 中也有,但这一次的表现,稳定性和完成度都明显更高了。
不仅如此,Opus 4.1 在逻辑推理与智能体相关任务中的能力也得到了明显提升。但加量不加价,Opus 4.1 的定价与 Claude Opus 4 保持一致。
对于经常需要处理多文件结构、跨模块逻辑的开发者来说,使用 Opus 4.1意味着更高的定位精度、更少的冗余干预和更低的 debug 成本。
合作伙伴实测
一款AI模型的实力,从不止于跑分数据,而是落地之后的表现。在 Opus 4.1 的发布中,Anthropic 没有直接标榜 “我们有多强”,而是以合作伙伴的实测反馈作为有力背书。
GitHub 指出 Opus 4.1 各个方面都优于 Opus 4,在跨文件代码重构方面的表现尤为突出。
Rakuten Group 表示 Claude 4.1 在大型代码库中表现稳定,能够精准定位、修复bug ,而且不会引入新的 bug,他们团队很喜欢将这一功能用于日常工作中。
Windsurf 在初级开发者测试中发现,Opus 4 升级到 Opus 4.1 的提升幅度,相当于从 Sonnet 3.7 升级到 Sonnet 4 的性能飞跃。
更多推荐
所有评论(0)