放下对通用智能体的执念，AI 真实应用景象正在浮现丨行业观察（一）

AGI 尚未到来，通用智能体在行业落地中的实际效果仍面临诸多限制。在这样的现实背景下，我们究竟能获得哪些启发？第一篇年末观察由此展开。

Kyligence

196人浏览 · 2026-02-11 11:30:47

Kyligence · 2026-02-11 11:30:47 发布

写在前面

2025 年，AI Agent 已成为行业焦点，各类智能化应用不断推向用户。这一年，Kyligence 持续夯实 Data Agent 产品能力，并发布 AI 深度洞察（Kyligence DeepInsight），将更高效的数据分析与智能决策融入营销、运营、销售等核心业务场景。但随着应用不断深入，我们愈发意识到，有必要更理性地看待 Agent 的“火热”。AGI 尚未到来，通用智能体在行业落地中的实际效果仍面临诸多限制。在这样的现实背景下，我们究竟能获得哪些启发？第一篇年末观察由此展开。本文作者为 Kyligence 联合创始人兼CTO 李扬，欢迎您的阅读，enjoy~

通用智能体效果不及预期

行业一度期待具备记忆能力、工具调用能力与自主任务规划能力的“通用智能体”，能够重塑生产方式。但在真实任务场景中，其实际表现并未如预期般可靠。

从准确率来看，单个原子任务达到 95% 已属不错；但一旦进入真实业务流程，多个原子任务的串联与并行执行，会显著放大不确定性，组合后的整体成功率可能不足三分之二。对于强调可控性与稳定性的企业级应用而言，这样的波动已足以令人审慎权衡。与此同时，短期内进一步提升通用大语言模型的空间亦较为有限。当前主流的“预训练 + 大规模参数扩展”路径已显现瓶颈，人类可获取的高质量公开语料也趋近枯竭。

但若暂时放下对通用智能体的执念，转而聚焦特定领域，则会是另一番景象。

AI Coding 实践启示：更多领域将借助 AI 实现 30% 提效

其实，我们可以从编程领域已经取得的进展中获得启发。

当前的大语言模型仍然会产生幻觉、会犯错，也谈不上真正理解软件工程的深层规律，但这并不妨碍它显著提升专业软件工程师的日常工作效率，提升幅度普遍在 20%～30%。在一些相对简单的原型系统和演示场景中，AI Coding 甚至已经能够 100% 代替人工编码，使产品经理或行业咨询专家直接完成最终交付，而无需程序员参与。这在相当多的工作场景中，意味着协作结构的变化，其带来的整体效率提升，可能是成倍的。

那么，类似的进步是否也会发生在其他领域？如果会，又会以怎样的速度展开？

我们的答案是：会。

仅基于当前的 AI 技术，以半年到一年为时间尺度，将持续有新的领域完成 AI 化的初步改造，并展现出至少 30% 的效率提升空间。所有具备标准化、规范化特征的简单脑力工作，都是 AI 优化的直接对象。

一个可参考的类比，是 20 世纪 50 年代计算机发明所带来的信息化进程。最早完成信息化改造的是金融与银行业，随后扩展至政务、军工、制造业，再进一步覆盖零售、物流等领域。整个过程持续了数十年。尽管今天新技术的演进速度相较过去呈指数级提升，但其逐步融入不同行业、重塑具体业务流程的方式，在本质上仍然相似。

AI 技术如何真正融入一个领域？为什么这一过程往往需要较长时间？同样可以借助“信息化”的经验来理解。以企业内部一项具体任务的信息化为例，其落地通常要经历几个关键环节。

首先是专业表达。领域专家需要将“要解决的问题”明确表达出来，并形成可被讨论与执行的专业规则。例如，在银行信贷审批中，高风险贷款可能需要五个部门的一级负责人逐一签字确认，且需明确到具体责任人；而低风险贷款则只需三个部门的二级负责人审批，同样需要精确到个人。

其次是技术表达。技术专家负责将上述专业规则转译为可实现的技术逻辑，例如构建一套审批工作流：流程的第一步调用风控大模型判定贷款风险等级，随后根据不同风险等级自动分配不同的审批路径；每个审批节点需要与 OA 系统的电子签名模块对接。同时，风控模型本身还需要从多个维度评估申请人的资质，每个维度对应的量表、参考数据集与判定标准，都需要被明确下来。

再次是技术实现。工程师依据既定的技术方案进行系统开发与部署。

最后是效果反馈。通过对项目结果的考察、验收与评估。

其中最困难、也最耗时的，正是“专业表达”和“技术表达”这两个环节。

专业表达的难点在于，现实中的业务往往并不存在一套统一、标准化的专业表述，而要形成共识，常常需要先提升整体管理水平。以放贷审批为例，在信息化之前，许多关键判断依赖经办人的主观经验，并没有一致的工作流程；即便在尝试 AI 化之前，如何判定一笔贷款的风险等级、需要考察哪些因素、评估哪些维度，也常常因审批人员而异。这些问题本质上并非技术难题，而是专业领域在引入更先进技术之前，必须先完成的内部梳理，对行业管理者的治理能力提出了不小的考验。类似于信息化时代的 Business Process Re-engineering，上系统前得先把原来人怎么做梳理清楚。

技术表达的难点，则在于跨界理解。正所谓，这世界上最远的距离，就是你不懂我 :-）。它要求有人既能理解专业语言，又能将其准确转译为技术语言，类似于至少精通两种语言的翻译角色。而在新技术应用的早期，掌握相关技术的人本就稀缺，更遑论同时理解业务与技术。且这一轮创新的本质是专业知识的系统化建设，较之前的信息化建设，要求技术专家对业务领域有更深刻的理解。无论是新技术知识的扩散，还是领域专家与技术专家之间的有效协作，都需要时间积累。

从这一点也可以理解，为什么编程（Coding）成为最早取得突破的 AI 应用领域。程序员往往同时具备领域理解与技术能力，既能设计编程的标准化流程和方案，也能完成工程落地，甚至直接评估效果。多重角色集于一身，大幅降低了沟通这一人类协作中最主要的时间成本，使其得以率先实现 AI 技术的有效转化。

所以对于更多领域的 AI 应用场景，我们要做的就是等待，等待领域中专业表达和技术表达两个关键步骤的完成。那句老话：时间能解决一切问题。

不同的是，其他行业的落地节奏，远没有编程领域来得快。软件工程具备一种天然优势：程序员同时理解技术语义与业务语境，能够对模型生成的代码快速判断并即时修正。

但在法律、医疗、供应链等行业，知识往往高度分散——一部分在规则里，一部分在经验里，还有大量隐藏在非结构化内容中。模型难以吸收，人类也难以迁移。

这也指向一个越来越清晰的趋势：要让 AI 真正理解行业和业务，仅靠单方面的努力是不够的。技术专家与行业专家需要双向协作，或者由跨界型人才来推动——他们既精通行业知识，又理解数据与算法，能够将人类经验转化为机器可理解的结构化信息，从而真正推动 AI 在企业场景中落地。

从服务的客户中，我们观察到越来越多不同部门、不同岗位的员工加入 AI 项目，对齐、落地、调整、推广。Data Agent 等应用在企业中形成了正循环，多维的碰撞带来新的火花，这也成为 AI 的“产物”之一。很高兴看到这样的现象，这是 Kyligence 今年实践中的一些观察，分享给您。