2026 趋势前瞻:缩放定律失效?智能体与物理 AI 接棒
2026年AI技术将迎来实用化转型:行业从追求大模型转向小模型微调、世界模型开发和智能体落地。小模型凭借成本效益和边缘计算优势成为企业标配;世界模型通过3D空间学习推动游戏和机器人领域突破;MCP协议加速智能体工作流集成。技术焦点转向增强人类而非替代,物理AI将在可穿戴设备等领域普及。行业趋于理性,从规模扩张转向针对性部署,标志着AI发展进入新阶段。
如果说 2025 年是 AI 接受现实检验(Vibe Check)的一年,那么 2026 年将是各项技术走向实用化的一年。行业的焦点已经开始转移:不再单纯追求构建规模越来越大的语言模型,而是转向将 AI 变得真正可用的“苦活累活”。在实践中,这意味着在合适的场景部署更小的模型,将智能嵌入物理设备,以及设计能够无缝集成到人类工作流程中的系统。
2026年将会是一个转型之年:从暴力计算的规模扩张进化到新架构的探索,从炫技般的演示进化到针对性的部署,从承诺完全自动化的智能体进化到真正增强人类工作能力的工具。
盛宴虽未落幕,但行业已日趋理性。
缩放定律(Scaling laws)不再万能
2012 年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 发表的 ImageNet 论文展示了 AI 系统如何通过观察数百万个示例来“学习”识别图片中的物体。这种方法计算成本高昂,但 GPU 的出现使其成为可能。结果如何?随之而来的是十年的硬核 AI 研究,科学家们致力于为不同的任务发明新的架构。
这一切在 2020 年左右达到顶峰,当时 OpenAI 推出了 GPT-3。它表明,仅仅将模型规模扩大 100 倍,就能在无需显式训练的情况下解锁编程和推理等能力。这标志着 AI Agent 平台 Workera 的 CEO 兼创始人 Kian Katanforoosh 所称的“缩放时代(age of scaling)”的到来:这一时期的信念是,更多的算力、更多的数据和更大的 Transformer 模型将不可避免地推动 AI 的下一次重大突破。
如今,许多研究人员认为,AI 行业正开始触及缩放定律的极限,并将再次过渡到一个研究驱动的时代。
Meta 前首席 AI 科学家 Yann LeCun 长期以来一直反对过度依赖规模扩张,并强调需要开发更好的架构。Sutskever 也在最近的一次采访中表示,当前的模型正在进入瓶颈期,预训练结果已经趋于平缓,这表明我们需要新的思路。
“我认为最有可能在未来五年内,我们会找到一种比 Transformer 有显著改进的更好架构,”Katanforoosh 说道,“如果我们做不到这一点,就不能指望模型会有太大的改进。”
有时候,小即是美
大语言模型(LLM)擅长通用知识,但许多专家表示,下一波企业 AI 采用浪潮将由更小、更敏捷的语言模型驱动,这些模型可以针对特定领域的解决方案进行微调。
“微调后的小语言模型(SLM)将成为大趋势,并在 2026 年成为成熟 AI 企业的标配,因为成本和性能优势将推动其使用率超过开箱即用的 LLM,”AT&T 首席数据官 Andy Markus 表示,“我们已经看到企业越来越依赖 SLM,因为如果微调得当,它们在企业业务应用中的准确性可以媲美更大的通用模型,并且在成本和速度方面表现出色。”
我们之前从法国开源权重 AI 初创公司 Mistral 那里也听到过类似的论点:该公司认为,经过微调后,其小模型在多个基准测试中的表现实际上优于大模型。
“SLM 的效率、成本效益和适应性使其成为对精度要求极高的定制化应用的理想选择,”奥斯汀企业 AI 公司 ABBYY 的 AI 策略师 Jon Knisley 表示。
虽然 Markus 认为 SLM 将是智能体时代的关键,但 Knisley 指出,小模型的本质意味着它们更适合部署在本地设备上,“边缘计算的进步加速了这一趋势。”
从经验中学习

人类不仅仅通过语言学习;我们通过体验世界的运作方式来学习。但 LLM 并不真正理解世界;它们只是预测下一个单词或概念。这就是为什么许多研究人员相信,下一个重大飞跃将来自世界模型(World Models):这种 AI 系统能够学习事物在 3D 空间中如何移动和交互,从而进行预测并采取行动。
种种迹象表明,2026 年将是世界模型的大年。LeCun 离开 Meta 创办了自己的世界模型实验室,据报道正在寻求 50 亿美元的估值。谷歌 DeepMind 一直在开发 Genie,并在 8 月推出了其最新模型,能够构建实时交互的通用世界模型。除了 Decart 和 Odyssey 等初创公司的演示外,李飞飞(Fei-Fei Li)的 World Labs 推出了其首个商业世界模型 Marble。像 General Intuition 这样的新入局者在 10 月获得了 1.34 亿美元的种子轮融资,用于教智能体进行空间推理;视频生成初创公司 Runway 在 12 月发布了其首个世界模型 GWM-1。
虽然研究人员看到了其在机器人和自动化领域的长期潜力,但短期影响可能会首先在视频游戏中显现。PitchBook 预测,游戏领域的世界模型市场规模可能从 2022-2025 年间的 12 亿美元增长到 2030 年的 2760 亿美元,这主要得益于该技术生成交互式世界和更逼真 NPC 的能力。
General Intuition 创始人 Pim de Witte 表示,虚拟环境不仅可能重塑游戏业,还可能成为下一代基础模型的关键试验场。
智能体崛起
智能体(Agents)在 2025 年未能达到预期的炒作高度,很大一部分原因是因为很难将它们连接到实际开展工作的系统中。如果没有访问工具和上下文的途径,大多数智能体都被困在试点工作流中,无法落地。
Anthropic 的模型上下文协议(MCP),即一种“AI 版的 USB-C”,允许 AI 智能体与数据库、搜索引擎和 API 等外部工具对话。它被证明是缺失的关键连接纽带,并正迅速成为行业标准。OpenAI 和微软已公开拥抱 MCP,Anthropic 最近将其捐赠给了 Linux 基金会新成立的 Agentic AI 基金会,旨在帮助标准化开源智能体工具。谷歌也开始建立自己的托管 MCP 服务器,以将 AI 智能体连接到其产品和服务中。
随着 MCP 降低了将智能体连接到真实系统的摩擦,2026 年很可能成为智能体工作流最终从演示走向日常实践的一年。
Sapphire Ventures 合伙人 Rajeev Dham 表示,这些进步将导致“智能体优先”的解决方案在各行各业承担起“记录系统(system-of-record)”的角色。
“随着语音智能体处理更多端到端的任务,如信息录入和客户沟通,它们也将开始构建底层的核心系统,”Dham 说,“我们将在家庭服务、房地产科技和医疗保健等各个领域,以及销售、IT 和支持等横向职能部门看到这一点。”
是增强(Augmentation),而非替代(automation)

虽然更多的智能体工作流可能会引发人们对随之而来的裁员的担忧,但 Workera 的 Katanforoosh 并不认为这是主要基调:“2026 年将是‘人类之年’,”他说。
在 2024 年,每家 AI 公司都预测他们将通过自动化取代人类的工作。但技术尚未达到那个水平,而且在不稳定的经济环境中,这并不是一种受欢迎的论调。Katanforoosh 说,明年我们将意识到“AI 并没有像我们想象的那样自主工作”,对话将更多地集中在如何使用 AI 来增强人类工作流,而不是取代它们。
“而且我认为很多公司将开始招聘,”他补充道,并指出他预计 AI 治理、透明度、安全和数据管理方面将出现新的职位。“我对明年平均失业率低于 4% 持相当乐观的态度。”
“人们希望处于 API 之上,而不是被 API 压在下面,我认为 2026 年是实现这一目标的重要一年,”de Witte 补充道。
走向物理世界
专家表示,小模型、世界模型和边缘计算等技术的进步将使机器学习在物理世界中有更多的应用。
“物理 AI(Physical AI)将在 2026 年成为主流,因为包括机器人、自动驾驶汽车(AV)、无人机和可穿戴设备在内的新型 AI 驱动设备将开始进入市场,”AT&T Ventures 负责人 Vikram Taneja 表示。
虽然自动驾驶汽车和机器人是物理 AI 显而易见的使用案例,并且无疑将在 2026 年继续增长,但所需的训练和部署仍然昂贵。另一方面,可穿戴设备提供了一个成本更低且消费者更易接受的切入点。像 Ray-Ban Meta 这样的智能眼镜开始搭载可以回答你所见问题的助手,而 AI 驱动的健康戒指和智能手表等新形态正在使全天候、贴身的 AI 推理变得常态化。
“连接服务提供商将致力于优化其网络基础设施以支持这波新设备浪潮,那些能够灵活提供连接服务的提供商将处于最佳位置,”Taneja 说。
文章来源:AI指南——各种AI模型开通服务商
更多推荐



所有评论(0)