为何95%的AI项目注定失败?回到未来,策略型代理AI才是正确路径
一篇《代理AI的进展:回到未来》的重磅论文,深入剖析了当前AI转型中普遍存在的误区与困境。作者指出,当前95%的AI项目失败并非因为模型不够先进,而是因为企业缺乏能够有效消费模型的架构。文章创造性地提出了“机器中的机器”理论,将机器学习拆解为负责生产模型的M1和负责运筹调度的M2。通过回顾过去十年在算法交易领域的极端环境测试,作者论证了策略型代理AI(Strategies-based Agenti
一篇《代理AI的进展:回到未来》的重磅论文,深入剖析了当前AI转型中普遍存在的误区与困境。

作者指出,当前95%的AI项目失败并非因为模型不够先进,而是因为企业缺乏能够有效消费模型的架构。
文章创造性地提出了“机器中的机器”理论,将机器学习拆解为负责生产模型的M1和负责运筹调度的M2。
通过回顾过去十年在算法交易领域的极端环境测试,作者论证了策略型代理AI(Strategies-based Agentic AI)才是企业级转型的正确路径,而非目前流行的基于大语言模型的概率性尝试。
文章详细阐述了如何通过联邦架构、边缘计算和微观经济学原理,构建起真正具有竞争壁垒的算法化企业生态。
被误读的AI与架构的缺失
2025年的科技界弥漫着一种奇特的氛围,大语言模型已经渗透进了董事会的战略规划、咨询公司的精美PPT以及国家级的数字战略中。
在这个喧嚣的时刻,一个冷峻的事实开始浮出水面,人们惊讶地发现所谓的幻觉并非大模型偶然的瑕疵,而是其结构性的本质特征。
这些模型从设计之初就不是为了精准检索信息,而是为了基于概率进行估算和创作。
对于那些急于将大模型直接接入生产核心的企业来说,这无异于主动将结构性的噪音引入了自己的中枢神经系统。
这种误判的根源深植于我们对人工智能这个词汇的模糊定义中。
在过去的几年里,商业叙事过度包装了机器学习的能力,导致了概念的混淆。
我们需要回归本源,将智能定义为能够精准生成样本外异常值的能力。
这意味着真正的智能不仅是处理已知数据的平均值,更是要在未知的环境中做出精准的独特判断。
目前的机器学习本质上是计算统计学的一个分支,它的核心工作是利用迭代优化来逼近一个函数。
无论是传统的统计学还是现代的深度学习,其本质都是试图通过数据来描绘世界运行的规律。
这种认知偏差导致了巨大的资源错配。
无数企业投入巨资试图训练或微调自己的模型,却忽略了一个更为关键的问题:拥有一个模型和经营一家智能化公司完全是两回事。
这就像是拥有一台高性能的引擎,却没有任何传动系统、底盘或驾驶控制系统将其转化为前进的动力。
学术界和科技巨头们在模型的研发上已经构建了极高的壁垒,对于绝大多数企业而言,试图在模型层面(即学习层面)建立竞争优势是一场注定失败的追逐战。
真正的机会,隐藏在如何构建那个能够驾驭模型的机器之中。
为了厘清这一团乱麻,我们需要引入一个新的视角,将机器学习(Machine Learning)拆解为两个独立的部分:学习(Learning)与机器(Machine)。
学习部分关注的是统计学原理和算法训练,属于科学探索的范畴,其产出是标准化的模型。
而机器部分则是关于如何将这些模型嵌入到复杂的业务流程、合规要求和战略决策中,属于工程与架构的范畴。
绝大多数的失败案例,都是因为试图用解决学习问题的方法,去应对机器层面的挑战。

这种混淆在学术界和产业界之间制造了一道深深的裂痕。
科学(Science)致力于发现新模型,科学应用(Science Applied)致力于通过数据工程将模型落地,而应用科学(Applied Science)则需要结合领域专家的经验法则、业务逻辑和复杂的环境约束,创造出解决实际问题的方案。
目前的困境在于,我们将大量精力投入到了科学应用中,却误以为这就是应用科学的全部。
企业需要的不是一个更聪明的聊天机器人,而是一个能够理解业务上下文、遵守合规底线、并能与其他系统无缝协作的算法生态系统。
从模型校准到企业级运筹的进化
在深入探讨解决方案之前,我们必须详细剖析双机理论的核心架构。
这一理论将支撑人工智能运作的基础设施划分为第一机器(M1)和第二机器(M2)。这种区分不仅仅是技术层面的模块化,更是战略思维的根本转变。
第一机器(M1)是关于模型校准的机器。
它的核心任务是构建、估算和暴露统计模型。这需要极高的数据工程能力,负责将原始数据转化为模型可理解的张量或嵌入向量,管理庞大的GPU集群进行分布式训练,并最终将模型封装为服务。
目前市面上绝大多数的AI公司,包括那些提供大语言模型服务的巨头,本质上都是M1层面的玩家。
它们的壁垒在于巨额的算力投入和顶尖的算法人才,其产出的是一种日益商品化的通用能力。
无论是ChatGPT还是Claude,它们都在提供一种高质量的概率预测服务,这种服务对于个人用户或者创意工作者来说极具价值,但对于要求严苛的企业级操作来说,它仍然只是一个概率性的输入。
大语言模型公司目前的战略重心正试图从B2C转向B2B,但这种转型面临着结构性的阻力。
因为LLM的本质是基于互联网公开数据的统计平均,它在降低用户认知负荷的同时,也拉低了专业判断的上限。
当一个模型能够输出7-8分水平的答案时,这成为了新的基准线,迫使人类专家必须追求12-13分的卓越表现才能体现价值。
更重要的是,企业运营需要的是确定性、可追溯性和合规性,而这些恰恰是基于概率生成的LLM难以提供的。
试图在M1的基础上直接构建复杂的企业应用,就像是试图在沙滩上建造摩天大楼,地基的不稳定性决定了上层建筑的脆弱。
第二机器(M2)则完全不同,它是关于模型消费的机器。
M2关注的是如何将M1产生的模型能力,与企业的业务规则、专家经验(启发式算法)、合规约束以及其他微服务有机地结合起来。
M2是一个复杂的架构层,它负责调度、编排和监控成百上千个智能体的协同工作。
这些智能体不仅仅是调用LLM的接口,它们包含了明确的算法逻辑(If-Then规则)和领域知识。
M2的存在,使得企业能够将黑盒子的模型包裹在白盒子的业务逻辑中,从而实现可控、可信且高效的自动化运作。
真正的竞争优势无法在模型层(L)维持,因为模型会因学术界的开源精神而迅速贬值;竞争优势也难以在M1层长期保持,因为算力和数据工程最终也会成为标准化的基础设施。
唯有在M2层,即企业如何组织和运用这些智能的架构层面,才能构建起独特的护城河。
这就是为什么我们需要将目光从基于LLM的代理AI转向基于策略的代理AI。
策略型代理AI不依赖于语言模型的模糊指令,而是借鉴了算法交易的成熟范式,将业务逻辑封装为一个个独立的、可互操作的策略单元。

这种策略型的M2架构具有几个显著的特征。
它是联邦式的,软件不是运行在中央服务器的单体巨石,而是分布在各种终端设备上,包括员工的笔记本电脑。
这不仅降低了硬件升级的成本,提高了系统的生存能力,还天然地保护了数据隐私。
它是模块化的,由最小架构单元(MAUs)、最小架构扩展(MAEs)和最小架构模式(MAPs)组成。
这些标准化的组件就像乐高积木一样,可以灵活地拼装出各种复杂的业务应用,大大缩短了新功能的上线时间。
它是算法原生的,每一个节点都是一个独立的计算单元,能够根据局部信息做出最优决策,同时通过通信协议与整体保持协调。
从历史的维度看,这种架构演进并非凭空而来。
算法交易领域早在二十年前就面临了同样的挑战:如何在毫秒级的竞争中,将统计模型、市场规则、风险控制和交易策略完美融合。
那个行业早已证明,依靠单一的模型是无法生存的,必须依靠强大的系统架构。
我们将这种经过极端环境验证的架构思想,抽象并泛化到了企业的其他部门,从网络安全到人力资源,从采购到战略规划。
这不仅是技术的迁移,更是管理哲学的革新,它要求我们将企业视为一个由算法驱动的生态系统,而非传统的层级组织。
在构建M2的过程中,有一个有趣的现象:最复杂的M1往往出现在算法交易中,因为那里的市场数据分布是时刻变化的,对模型的实时性和准确性要求极高。
相比之下,LLM处理的语言数据分布相对稳定,这也是为什么语言模型更容易被商品化。
因此,从最复杂的交易场景出发,自上而下地降维打击,将成熟的架构能力推广到相对简单的普通商业场景,是一条比自下而上摸索更为高效的路径。
这解释了为什么研究始于金融交易,却最终指向了通用的企业智能化转型。

构建这样的M2并非易事,它需要跨越学科的边界,将经济学、技术和机器学习深度融合。
这是一个应用科学的领域,不仅需要精通代码和算法,更需要深刻理解业务的本质。
许多公司试图通过简单的API调用来引入AI,结果却发现自己陷入了无尽的调试和维护泥潭。
原因就在于他们缺乏M2这一层关键的中间件,缺乏将AI能力转化为业务流程的承载容器。
只有当企业首先完成了自身的架构转型,成为了一个算法友好的平台型组织,AI的潜力才能真正爆发出来。
重塑产业与国家的算法基石
我们将视线投向更广阔的领域,M2架构的影响力远远超出了单一企业的范畴。
当我们将这种联邦式、策略型的架构思维应用到整个产业链乃至国家战略时,一幅更为宏大的图景徐徐展开。
这是关于生产关系的重构,是微观经济学理论在数字化时代的物理实现。
在投资领域,挑战了传统的投资组合理论。
长久以来,风险管理是基于资产类别的聚合来进行的,这是一种受限于过往技术能力的妥协。
通过引入维度驱动的投资组合(Dimension-Driven Portfolios),将风险控制的颗粒度下沉到了策略层面。这意味着管理者不再是笼统地配置股票或债券,而是精准地配置某种特定的交易逻辑或风险因子。
这就像是从粗放的草药熬制进化到了精准的分子药物设计,极大地提升了资本的配置效率。
这种架构使得大型资产管理机构能够像敏捷的对冲基金一样运作,兼具规模与精度。
在网络安全领域,M2架构展现出了独特的防御优势。
传统的网络安全往往是被动防御,依赖于围墙式的边界防护。
而在算法化的企业中,防御变成了内生且动态的能力。
每一个智能代理都具备自我监测和防御的功能,整个网络构成了一个具有免疫系统的有机体。
结合博弈论设计主动防御策略,使得企业在面对攻击时,能够像生物体一样进行局部的隔离、诱捕和反击。这种防御机制不仅限于技术层面,更延伸到了业务连续性的保障,确保在遭受攻击时核心业务仍能维持最低限度的运转。
当这种变革扩展到国家层面时,研究提出了极致效率国家的概念。
在地缘政治的博弈中,目前的焦点过多地集中在了AI的创造能力(即谁拥有最强的模型)上,而忽略了AI的消费能力(即谁能最高效地使用模型)。
历史数据表明,技术的发明者往往不一定是最大的受益者,真正的赢家是那些能够将新技术大规模应用到生产生活中的国家。
通过部署国家级的M2基础设施,可以协调不同部门、不同所有制企业之间的资源配置,提升全社会的运转效率。
这不仅能带来GDP的结构性增长,更构建了一种新型的国家竞争力——一种基于算法治理的软实力。

在这个漫长的探索过程中,研究者建立了一个名为SciTheWorld的卓越中心,这是一个99%专注于技术研发、仅留1%精力处理商业事务的独特机构。
这种极度偏向探索(Exploration)而非利用(Exploitation)的架构,让研究者得以避开短期商业变现的压力,专注于攻克那些真正具有长期价值的技术难题。
作者在没有任何外部融资的情况下,依靠技术输出实现了自给自足,这种靴带式(Bootstrapped)的发展模式本身就是对M2架构高效性最好的证明。通过极致的算法化运作,一个小规模的团队完全可以产生世界级的影响力。

未来的十年,将是M2架构全面落地的十年。
我们将看到企业不再是一个个孤立的部门堆叠,而是一个个互联互通的算法节点。
战略咨询、数据科学和定制化SaaS将融为一体,成为驱动企业进化的三驾马车。
正交艺术(Orthogonal Art)的诞生,正是机器在理解了人类艺术风格的本质后,创造出的那些无法通过现有风格线性组合得到的全新艺术形式。这是机器智能在创造力领域的一次示威。
在这个由算法编织的新世界里,判断力将成为最稀缺的资源。
模型可以无限复制,算力可以不断堆叠,但能够在不确定性中做出正确架构决策的判断力,却是无法被自动化的。
这正是人类在未来人机协作中的核心生态位。
我们正在开启一个新的学科——算法化(Algorithmization),它将微观经济学的理论框架变成了可执行的代码,将抽象的效率追求变成了具体的运作机制。
这是一个关于如何构建机器的故事,一个关于如何让智能真正落地的故事,也是一个关于我们如何重新定义未来的故事。
参考资料:
https://arxiv.org/abs/2512.24856
更多推荐


所有评论(0)