最近的GPT-5使用下来,工具调用能力比4强了很多,函数参数填写的准确率明显提升了,但感觉问题还是那个问题:能调用的工具太有限了。

这也能引申出目前Agent框架普遍存在的硬伤:

首先是工具扩展性差。我之前用LangChain做过一个项目,想让Agent处理一些特定格式的Excel文件,结果发现要么用现成的工具凑合,要么就得自己写Tool类、定义schema,然后注册到框架里。整个流程下来比自己直接写Python脚本还麻烦。

还有一个硬伤是推理成本。每次Agent执行任务都要走完整的推理链路,中间任何一步出错就得重新来,token烧得飞快不说,体验也很差。

最让人绷不住的是,遇到复杂任务,没有可调用的工具的时候,甚至直接摊牌不干。

Python-use范式给了我新思路

最近了解到国内某团队提出的Python-use范式,感觉思路很有意思。他们的核心观点是:既然LLM写代码能力已经足够强了,为什么还要把它限制在预定义的工具集里?

传统Agent只能在框架内搭建,而Python-use直接让AI写代码解决问题,相当于给了AI一个完整的编程环境。

我加入测评团队试用了下他们的产品AiPy,确实不一样。比如我让它随便处理一个CSV文件,传统Agent可能要找CSV处理工具,填各种参数。但是AiPy直接生成了一段pandas代码,从读取、处理到输出,一气呵成。很亮眼的是,这段代码可以直接保存下来重复使用。

从使用工具到制造工具

这个转变其实挺关键的。传统Agent本质上是工具的使用者,能力边界被框架的工具集限死了。Python-use让AI变成了工具的制造者,遇到新需求就写新代码,代码本身就是工具。

比如用它分析某个API的响应时间并生成图表,传统Agent可能找不到合适的现成工具。但在Python环境下,AI可以直接用requests测试API,用matplotlib画图,几十行代码就搞定了,而且这段代码下次还能复用。

他们的团队本身就做网络安全和设备识别,比如自有平台ZoomEye能识别各种网络设备和协议。这个背景让AiPy在处理复杂网络场景和IoT设备时有明显优势,AI可以直接调用Python生态里的各种库,不需要等人专门开发对应的工具。

当然,让AI直接执行代码确实有安全风险。不过从实用角度看,我们平时运行的软件哪个不是直接在系统上执行的?关键是要有合理的权限控制和错误处理机制。AiPy团队计划后续完善沙箱机制。我觉得这个平衡点把握得还可以,不能因为理论上的风险就把功能阉割掉。

AiPy还有一个优势是错误处理能力。传统Agent调用工具出错了往往就卡住了,Python-use可以让AI分析错误信息,自动修正代码重新执行。这种自愈能力在实际使用中很有价值。

总的来说,AI Agent雷声大雨点小的根本原因是思路问题。大家都在优化工具调用的准确性,但忽略了工具本身的局限性。现在LLM的代码能力已经很强了,完全可以按需生成解决方案,没必要困在预定义的工具框架里。

Python-use这个思路回归了编程的本质:code is everything。虽然还在早期阶段,但我觉得这个方向是对的。毕竟作为程序员,最熟悉的就是用代码解决问题,为什么要让AI绕这么大个弯呢?

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐