放下对通用智能体的执念,AI 真实应用景象正在浮现丨行业观察(一)
AGI 尚未到来,通用智能体在行业落地中的实际效果仍面临诸多限制。在这样的现实背景下,我们究竟能获得哪些启发?第一篇年末观察由此展开。
写在前面

2025 年,AI Agent 已成为行业焦点,各类智能化应用不断推向用户。这一年,Kyligence 持续夯实 Data Agent 产品能力,并发布 AI 深度洞察(Kyligence DeepInsight),将更高效的数据分析与智能决策融入营销、运营、销售等核心业务场景。但随着应用不断深入,我们愈发意识到,有必要更理性地看待 Agent 的“火热”。AGI 尚未到来,通用智能体在行业落地中的实际效果仍面临诸多限制。在这样的现实背景下,我们究竟能获得哪些启发?第一篇年末观察由此展开。本文作者为 Kyligence 联合创始人兼CTO 李扬,欢迎您的阅读,enjoy~
通用智能体效果不及预期
行业一度期待具备记忆能力、工具调用能力与自主任务规划能力的“通用智能体”,能够重塑生产方式。但在真实任务场景中,其实际表现并未如预期般可靠。
从准确率来看,单个原子任务达到 95% 已属不错;但一旦进入真实业务流程,多个原子任务的串联与并行执行,会显著放大不确定性,组合后的整体成功率可能不足三分之二。对于强调可控性与稳定性的企业级应用而言,这样的波动已足以令人审慎权衡。与此同时,短期内进一步提升通用大语言模型的空间亦较为有限。当前主流的“预训练 + 大规模参数扩展”路径已显现瓶颈,人类可获取的高质量公开语料也趋近枯竭。
但若暂时放下对通用智能体的执念,转而聚焦特定领域,则会是另一番景象。
AI Coding 实践启示:更多领域将借助 AI 实现 30% 提效
其实,我们可以从编程领域已经取得的进展中获得启发。
当前的大语言模型仍然会产生幻觉、会犯错,也谈不上真正理解软件工程的深层规律,但这并不妨碍它显著提升专业软件工程师的日常工作效率,提升幅度普遍在 20%~30%。在一些相对简单的原型系统和演示场景中,AI Coding 甚至已经能够 100% 代替人工编码,使产品经理或行业咨询专家直接完成最终交付,而无需程序员参与。这在相当多的工作场景中,意味着协作结构的变化,其带来的整体效率提升,可能是成倍的。
那么,类似的进步是否也会发生在其他领域?如果会,又会以怎样的速度展开?
我们的答案是:会。
仅基于当前的 AI 技术,以半年到一年为时间尺度,将持续有新的领域完成 AI 化的初步改造,并展现出至少 30% 的效率提升空间。所有具备标准化、规范化特征的简单脑力工作,都是 AI 优化的直接对象。
一个可参考的类比,是 20 世纪 50 年代计算机发明所带来的信息化进程。最早完成信息化改造的是金融与银行业,随后扩展至政务、军工、制造业,再进一步覆盖零售、物流等领域。整个过程持续了数十年。尽管今天新技术的演进速度相较过去呈指数级提升,但其逐步融入不同行业、重塑具体业务流程的方式,在本质上仍然相似。
AI 技术如何真正融入一个领域?为什么这一过程往往需要较长时间?同样可以借助“信息化”的经验来理解。以企业内部一项具体任务的信息化为例,其落地通常要经历几个关键环节。
首先是专业表达。领域专家需要将“要解决的问题”明确表达出来,并形成可被讨论与执行的专业规则。例如,在银行信贷审批中,高风险贷款可能需要五个部门的一级负责人逐一签字确认,且需明确到具体责任人;而低风险贷款则只需三个部门的二级负责人审批,同样需要精确到个人。
其次是技术表达。技术专家负责将上述专业规则转译为可实现的技术逻辑,例如构建一套审批工作流:流程的第一步调用风控大模型判定贷款风险等级,随后根据不同风险等级自动分配不同的审批路径;每个审批节点需要与 OA 系统的电子签名模块对接。同时,风控模型本身还需要从多个维度评估申请人的资质,每个维度对应的量表、参考数据集与判定标准,都需要被明确下来。
再次是技术实现。工程师依据既定的技术方案进行系统开发与部署。
最后是效果反馈。通过对项目结果的考察、验收与评估。
其中最困难、也最耗时的,正是“专业表达”和“技术表达”这两个环节。
专业表达的难点在于,现实中的业务往往并不存在一套统一、标准化的专业表述,而要形成共识,常常需要先提升整体管理水平。以放贷审批为例,在信息化之前,许多关键判断依赖经办人的主观经验,并没有一致的工作流程;即便在尝试 AI 化之前,如何判定一笔贷款的风险等级、需要考察哪些因素、评估哪些维度,也常常因审批人员而异。这些问题本质上并非技术难题,而是专业领域在引入更先进技术之前,必须先完成的内部梳理,对行业管理者的治理能力提出了不小的考验。类似于信息化时代的 Business Process Re-engineering,上系统前得先把原来人怎么做梳理清楚。
技术表达的难点,则在于跨界理解。正所谓,这世界上最远的距离,就是你不懂我 :-)。它要求有人既能理解专业语言,又能将其准确转译为技术语言,类似于至少精通两种语言的翻译角色。而在新技术应用的早期,掌握相关技术的人本就稀缺,更遑论同时理解业务与技术。且这一轮创新的本质是专业知识的系统化建设,较之前的信息化建设,要求技术专家对业务领域有更深刻的理解。无论是新技术知识的扩散,还是领域专家与技术专家之间的有效协作,都需要时间积累。
从这一点也可以理解,为什么编程(Coding)成为最早取得突破的 AI 应用领域。程序员往往同时具备领域理解与技术能力,既能设计编程的标准化流程和方案,也能完成工程落地,甚至直接评估效果。多重角色集于一身,大幅降低了沟通这一人类协作中最主要的时间成本,使其得以率先实现 AI 技术的有效转化。
所以对于更多领域的 AI 应用场景,我们要做的就是等待,等待领域中专业表达和技术表达两个关键步骤的完成。那句老话:时间能解决一切问题。
不同的是,其他行业的落地节奏,远没有编程领域来得快。软件工程具备一种天然优势:程序员同时理解技术语义与业务语境,能够对模型生成的代码快速判断并即时修正。
但在法律、医疗、供应链等行业,知识往往高度分散——一部分在规则里,一部分在经验里,还有大量隐藏在非结构化内容中。模型难以吸收,人类也难以迁移。
这也指向一个越来越清晰的趋势:要让 AI 真正理解行业和业务,仅靠单方面的努力是不够的。技术专家与行业专家需要双向协作,或者由跨界型人才来推动——他们既精通行业知识,又理解数据与算法,能够将人类经验转化为机器可理解的结构化信息,从而真正推动 AI 在企业场景中落地。
从服务的客户中,我们观察到越来越多不同部门、不同岗位的员工加入 AI 项目,对齐、落地、调整、推广。Data Agent 等应用在企业中形成了正循环,多维的碰撞带来新的火花,这也成为 AI 的“产物”之一。很高兴看到这样的现象,这是 Kyligence 今年实践中的一些观察,分享给您。
更多推荐



所有评论(0)