Claude Code 重磅更新：Sonnet 4.5 登顶编码基准，Code 2.0 赋能下一代 Agent

Anthropic发布"ClaudeCoded"重大更新，推出ClaudeSonnet4.5和ClaudeCode2.0。Sonnet4.5在SWE-Bench编码测试中取得77.2%的优异成绩，通用智能显著提升。Code2.0为开发者带来VSCode原生扩展、终端UI刷新和创新的Checkpoints回滚功能。API方面新增上下文编辑和内存工具，解决长期运行和知识持久化问题。

金蜘蛛.net

644人浏览 · 2025-10-09 07:00:00

金蜘蛛.net · 2025-10-09 07:00:00 发布

Anthropic 近日发布了代号为“Claude Coded”的重大更新，不仅推出了性能强大的 Claude Sonnet 4.5，还带来了面向开发者的 Claude Code 2.0 及其一系列工具升级，以及针对 API 代理能力的突破性进展。本次升级旨在为开发者提供世界上最优秀的编码模型和构建复杂 AI Agent 所需的核心基础设施。

第一部分：核心模型升级——Claude Sonnet 4.5

Claude Sonnet 4.5 现已在所有获取 Claude 的渠道中推出。它不仅巩固了 Claude 在编码领域的领导地位，更在通用智能方面实现了实质性飞跃。

1. 编码性能登顶 SWE-Bench

Claude Sonnet 4.5 被誉为**“世界上最好的编码模型”**。

基准成就： 它在行业标准测试 SWE-Bench 上处于领先地位。
验证分数： 经验证，其分数高达 77.2%。
复杂任务专注力： 开发者们会兴奋地发现，Sonnet 4.5 能够在复杂的任务中保持专注，持续运行时间远超 30 个小时。

2. 通用能力显著提升

此次升级并不仅仅局限于代码改进。

能力提升： Claude 在推理、数学和计算机使用方面也取得了实质性进展。
OS World 飞跃： 在测试 AI 使用计算机能力（如同人类操作）的 OS World 基准测试中，Claude 的得分从四个月前的 42% 跃升至 61% 以上。
实际应用： 开发者现在可以通过最近向所有等待列表用户开放的 Claude for Chrome 扩展程序 亲自体验这些改进。

第二部分：开发者工具链革新——Claude Code 2.0

Claude Code 2.0 带来了针对 IDE 和终端环境的双重优化，特别是全新的 Checkpoints 功能，极大地提升了大型任务的开发信心。

1. 原生 VS Code 扩展程序（Beta）

对于偏爱在集成开发环境（IDE）中编程的开发者而言，本次升级的核心是 VS Code 的原生扩展程序。

集成体验： 该扩展将 Claude Code 直接引入您的 IDE 中。
实时追踪： 开发者可以通过专用的侧边栏面板实时查看 Claude 所做的更改。
内联差异： 面板会显示所做更改的内联差异（inline diffs），方便开发者追踪代码变动。
获取方式： 该扩展目前处于 Beta 阶段，可在 VS Code Marketplace 中获取。

2. 终端 UI 刷新与 Checkpoints

终端界面也进行了焕然一新的升级。

界面特性： Claude Code 2.0 带来了更新的界面特性、改进的状态可见性以及可搜索的提示历史记录。
Checkpoints（检查点）功能： 这是本次更新中最令人兴奋的功能。它允许开发者自信地运行大型任务，并能在需要时即时回滚到先前的状态。
- 激活方式： 使用 /rewind 命令或双击 Escape 键即可激活。
- 回滚选择： 用户可以选择将代码、对话，或两者都恢复到先前的状态。
- 重要提示： 请注意，Checkpoints 仅适用于 Claude 所做的编辑，而不适用于用户编辑或 Bash 命令。因此，官方仍建议将此功能与您的版本控制系统（VCS）结合使用。

3. 实时追踪与思考模式切换

用法追踪： 开发者现在可以使用 /usage 命令实时跟踪其使用情况。在 Claude 应用程序中，也可以通过“设置”->“用量”查看数据。
思考模式： 现在只需轻按 Tab 键即可启用或禁用思考（thinking）模式，并且您的偏好设置将在不同会话中保存。

第三部分：API 代理能力构建与分析

在 Claude API 方面，Anthropic 推出了两项关键的新功能，旨在让 AI Agent 能够处理更高的复杂性，并延长其有效运行时间。

1. 上下文编辑（Context Editing）

上下文编辑是解决大型 Agent 任务中上下文窗口限制的关键工具。

功能： 当 Agent 执行任务并累积工具结果时，如果接近 Token 限制，上下文编辑将自动清除上下文窗口中陈旧的工具调用和结果。
效果： 它在移除陈旧内容的同时，保留了对话流程。
深层洞察： 这有效地延长了 Agent 的运行时间，使其无需人工干预即可长时间运行，是实现复杂、长期自动化任务的关键。

2. 内存工具（Memory Tool）

内存工具使得 Claude 能够拥有持久化的外部记忆。

机制： 它通过基于文件的系统，使 Claude 能够存储和查阅超出上下文窗口之外的信息。
操作： Claude 可以在一个专用的内存目录中创建、读取、更新和删除文件。
安全与持久性： 这个目录完全是客户端侧的，存储在您的基础设施中，并且跨会话保持持久。
形象比喻： “这有点像为您的 Agent API 准备了一个 claw.md 文件”。

3. Claude Agent SDK

更名： 原 Claude Code SDK 已更名为 Claude Agent SDK。
核心能力： 它为您提供了构建自己的 Agent 所需的核心工具、上下文管理系统和权限框架，这些都是为 Claude Code 提供动力的系统。
价值： 该 SDK 融入了 Anthropic 在过去六个月中学到的所有经验和教训，是构建复杂 Agent 的强大基石。

第四部分：Claude App 文件创建与数据可视化

在 Claude 应用程序中，用户可以直接利用 Claude 的代码能力进行数据分析和文件生成。

数据分析与洞察： Claude 现在可以使用代码来分析数据、创建文件，并以您熟悉的格式和文件类型可视化洞察结果。
自然语言生成： 您可以使用自然语言提示 Claude 来生成以下文件：Excel 电子表格、PowerPoint 演示文稿、Word 文档或 PDF 文件。
即时可用： 这些文件可以即时下载和使用。
可用性： 此功能目前已在所有付费计划中以预览版形式提供。

总结与深入洞察

本次 Claude Coded 更新不仅通过 Sonnet 4.5 将编码性能推向新高，还通过 Code 2.0 极大地优化了开发者的工作流。Checkpoints、内联差异 VS Code 插件都是提高效率和开发信心的利器。

更具战略意义的是 API 代理能力的增强。上下文编辑和内存工具的引入，标志着 Anthropic 正在积极解决 Agent 长期运行和知识持久化两大核心难题。Context Editing 解决了短期任务中的 Token 溢出问题，而 Memory Tool 则提供了跨会话的知识库，这对于构建能够处理复杂、多步骤、需要长期知识积累的企业级 Agent 至关重要。

随着 Claude Agent SDK 的推出和 App 端直接的文件生成能力，Anthropic 不仅致力于成为顶级的代码伴侣，更致力于成为强大的、可定制的 AI 基础设施提供商。

原始视频：https://youtu.be/Yct0MvNtdfU?si=jq4qM7sHPGYOdJuC

中英文字幕：

Claude Code 重磅更新：Sonnet 4.5 登顶编码基准，Claude Code 2.0 赋能下一代 Agent

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【花雕动手做】HUSKYLENS 2 AI 相机视觉传感器 ( 二哈识图 2) 之识别条形码输出相关数据

2048 AI社区

AI在企业并购协同效应预测中的应用与挑战

企业并购是企业实现快速扩张、资源整合和战略转型的重要手段。协同效应是企业并购追求的重要目标之一，它指的是并购后企业整体价值大于并购前各企业价值之和的效应，包括经营协同、财务协同和管理协同等方面。准确预测协同效应对于企业制定并购决策、评估并购价值以及整合并购资源具有至关重要的意义。本文章的目的在于探讨AI技术在企业并购协同效应预测中的应用原理、方法和实际效果，分析其面临的挑战，并提供相应的解决方案和