Anthropic正式出手：AI Agent三大核心痛点

这是一个容易被忽视、但实战中极其恼人的问题。Schema告诉AI：“这两个字段都是字符串”。due_date到底要2025-11-25还是？是12345还是USR-12345？以前，开发者只能在描述里写一大堆文字说明，或者祈祷AI猜对。

程序员维他命

655人浏览 · 2025-11-29 11:26:17

程序员维他命 · 2025-11-29 11:26:17 发布

Anthropic发布三项Beta功能解决AI Agent开发核心问题：Tool Search Tool按需加载工具节省90% token；Programmatic Tool Calling让AI编写Python代码处理数据，减少37% token并提升准确率；Tool Use Examples通过示例提高参数填写准确率。这些功能标志着AI Agent开发从"Prompt Engineering"向"Software Engineering"的转变，让AI更像资深工程师解决问题。

我分析了AI Agent面临的两大瓶颈：工具选择的困境和上下文的诅咒。那时我还只是基于概念性的探讨，预判这会是行业必须攻克的难题。

没想到，Anthropic的效率比我想象的还要快。

就在11月24日，他们正式发布了三项Beta功能，直接将这些想法落地成了产品。这不是论文，不是概念验证，而是可以在Claude开发者平台上直接调用的真实API。

这篇文章，我将带你深入拆解这三个功能——Tool Search Tool、Programmatic Tool Calling 和 Tool Use Examples。它们分别瞄准了AI Agent开发中最头疼的三个问题：找工具、用工具、以及用对工具。

第一招：Tool Search Tool——让AI学会"查字典"

痛点：工具太多，上下文先爆了

来看一个真实的数据。当你给AI接入5个常见的MCP服务时：

服务	工具数量	Token消耗
GitHub	35个工具	~26K tokens
Slack	11个工具	~21K tokens
Sentry	5个工具	~3K tokens
Grafana	5个工具	~3K tokens
Splunk	2个工具	~2K tokens
合计	58个工具	~55K tokens

还没开始干活，55K tokens就没了。如果再加上Jira（~17K tokens），你的上下文直接逼近100K。Anthropic透露，他们内部测试时甚至见过134K tokens被工具定义吃掉的极端情况。

更致命的是，工具太多还会让AI"眼花"。当存在notification-send-user和notification-send-channel这样名字相近的工具时，AI很容易选错。

解法：按需加载，而非全量预载

Tool Search Tool的思路很简单：不要让AI背着整个工具箱上路，而是教它使用"工具目录"。

实现方式是这样的：你把所有工具定义照常提交给API，但给绝大多数工具标记上defer_loading: true。这些工具不会进入AI的初始上下文——AI一开始只看到一个"搜索工具"的能力（大约500 tokens）。

当任务来临时，AI会先搜索"我需要什么工具"，找到相关的3-5个工具后，才把它们的完整定义加载进来。

效果如何？看这张官方对比图：

Tool Search Tool对比图

左边是传统方式：所有工具定义预加载，消耗77K tokens；右边是Tool Search Tool：按需加载，只消耗8.7K tokens

Token消耗：从77K降至8.7K，节省近90%
准确率提升：Opus 4从49%提升到74%，Opus 4.5从79.5%提升到88.1%

这就像是把"死记硬背"变成了"开卷考试"——AI不需要记住所有工具的细节，只需要知道"有这么一本目录可以查"。

第二招：Programmatic Tool Calling——让AI用代码说话

痛点：回合制交互，中间结果撑爆上下文

这个痛点我在上一篇文章里详细讲过。传统的工具调用是"你一句我一句"的回合制：

AI请求获取员工列表（等待…）
系统返回20个员工
AI逐个请求每个人的账单（等待20次…）
系统返回几千条账单流水（AI被迫全部读入上下文）
AI终于得出结论

问题在于：那几千条账单明细，AI真正需要的只是"谁超标了"这个结论，但它不得不把所有原始数据都塞进自己的"大脑"里。

解法：让AI写脚本，自己跑批处理

Programmatic Tool Calling允许AI编写一段Python代码来编排整个工作流。代码在安全沙箱中运行，自行调用工具、处理数据、做聚合计算，最后只把精炼的结果返回给AI。

Programmatic Tool Calling流程图

关键区别：工具调用的结果不再返回给模型，而是在代码执行环境中直接处理，最终只有精炼结果进入AI上下文

看这段AI生成的代码：

team = await get_team_members("engineering")
# 并行获取所有级别的预算
levels = list(set(m["level"] for m in team))
budget_results = await asyncio.gather(*[
get_budget_by_level(level) for level in levels
])
budgets = {level: budget for level, budget in zip(levels, budget_results)}
# 并行获取所有人的开支
expenses = await asyncio.gather(*[
get_expenses(m["id"], "Q3") for m in team
])
# 计算超标人员
exceeded = []
for member, exp in zip(team, expenses):
budget = budgets[member["level"]]
total = sum(e["amount"] for e in exp)
if total > budget["travel_limit"]:
exceeded.append({
"name": member["name"],
"spent": total,
"limit": budget["travel_limit"]
})
print(json.dumps(exceeded))

这段代码的精妙之处：

并行执行：用asyncio.gather同时发起多个请求，而不是逐个等待
本地计算：数据聚合在沙箱里完成，不经过AI的上下文
精准输出：AI最终只看到exceeded这个列表，而非2000+条原始账单

实测数据：

Token消耗：从43,588降至27,297，减少37%
准确率：GIA基准测试从46.5%提升至51.2%
延迟：省掉了19+次模型推理的时间

Anthropic还透露，他们的新产品Claude for Excel就是用这个技术实现的——可以读写几千行的电子表格，而不会撑爆上下文。

第三招：Tool Use Examples——用例子说话

痛点：JSON Schema能定义结构，但无法传达"潜规则"

这是一个容易被忽视、但实战中极其恼人的问题。

看这个工单创建工具的Schema：

{
"due_date": {"type": "string"},
"reporter_id": {"type": "string"}
}

Schema告诉AI：“这两个字段都是字符串”。但它没说：

due_date到底要2025-11-25还是Nov 25, 2025？
reporter_id是12345还是USR-12345？

以前，开发者只能在描述里写一大堆文字说明，或者祈祷AI猜对。

解法：直接给例子，一看就懂

Tool Use Examples允许你直接在工具定义里嵌入具体的调用示例：

{
"name": "create_ticket",
"input_schema": {...},
"input_examples": [
{
"title": "Login page returns 500 error",
"priority": "critical",
"reporter": {"id": "USR-12345", "name": "Jane Smith"},
"due_date": "2024-11-06"
},
{
"title": "Add dark mode support",
"reporter": {"id": "USR-67890", "name": "Alex Chen"}
},
{
"title": "Update API documentation"
}
]
}

三个例子，AI瞬间学会：

日期格式是YYYY-MM-DD
用户ID是USR-开头的
紧急bug要填完整信息，普通需求可以简化，内部任务只需标题

这就是少样本学习（Few-shot Learning）直接嵌入工具层。效果：复杂参数的调用准确率从72%飙升到90%。

组合拳：三者如何协同工作？

这三个功能不是孤立的，它们解决的是AI使用工具的完整链路：

环节	痛点	解法
发现工具	工具定义太多，撑爆上下文	Tool Search Tool（按需加载）
执行工具	中间结果太多，回合制低效	Programmatic Tool Calling（代码编排）
调对工具	参数格式不明，容易出错	Tool Use Examples（示例教学）

Anthropic在文章中给出了分层策略的建议：

先找瓶颈，再上对应方案：

如果上下文被工具定义撑爆 → 先上Tool Search Tool
如果中间结果太多影响推理 → 上Programmatic Tool Calling
如果参数总是填错 → 加Tool Use Examples

然后逐层叠加： Tool Search Tool确保找对工具，Programmatic Tool Calling确保高效执行，Tool Use Examples确保调用正确

AI Agent正在从"实习生"变成"资深工程师"

回顾这三个功能，它们的共同点是什么？

都在教AI用"工程师思维"解决问题，而非用"学生思维"死记硬背。

Tool Search Tool：资深工程师不会背API文档，他会查
Programmatic Tool Calling：资深工程师不会手动逐行处理数据，他会写脚本
Tool Use Examples：资深工程师学习新API，第一件事是看example

Anthropic正在把这些"工程师常识"内化到AI的工作方式中。这不仅仅是功能的迭代，更是AI Agent开发范式的转变——从"Prompt Engineering"走向真正的"Software Engineering"。

当AI可以自主搜索工具、编写代码批量处理数据、并在看不见的沙箱里完成复杂逻辑时，我们对它的信任边界在哪里？

以前，AI的每一步操作都摊在上下文里，我们可以看到它"在想什么"。现在，越来越多的过程被封装进代码里、隐藏在沙箱中。我们看到的只是输入和输出。

这是效率的必然代价，但也值得每一个AI应用开发者认真思考。

如何开始使用？

这三个功能目前都是Beta状态，需要通过特定的header开启：

client.beta.messages.create(
betas=["advanced-tool-use-2025-11-20"],
model="claude-sonnet-4-5-20250929",
max_tokens=4096,
tools=[
{"type": "tool_search_tool_regex_20251119", "name": "tool_search_tool_regex"},
{"type": "code_execution_20250825", "name": "code_execution"},
# 你的工具定义...
]
)

如果你正在构建复杂的AI Agent系统，尤其是需要接入大量MCP服务的场景，我强烈建议去认真研究。

原文地址: https://www.anthropic.com/engineering/advanced-tool-use

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

第六届新能源与电气科技国际学术研讨会 (ISNEET 2025)

2048 AI社区

阿里下场硬刚字节，争夺AI超级入口

建设云和AI硬件基础设施，做一家拥有从AI算力，AI云平台，AI模型，开源生态到AI应用的全栈AI技术公司。在最新的财报电话会上，阿里甚至表态，3800亿元资本开支偏保守，不排除进一步增加。另一方面，字节利用抖音给豆包“流量输血”，相当于有 6-7 亿级别的日活可以精准触达，这种体量的输血能力，纵观整个中国 AI 市场，也只有手持抖音的字节能实现。一个不容忽视的背景是，抖音、微信这两个中国互联网最