预测编码与自由能:人脑如何启发下一代AI模型
AI正借鉴人脑的预测编码机制,通过最小化预测误差与自由能,并融合记忆的生成与重构,迈向具有类脑认知与持续学习能力的通用人工智能之路。
人脑不是世界的记录仪,而是世界的生成器。它通过预测、能量优化与记忆重构,在不确定中维持确定,在有限能量中生成理解。相比之下,如今的人工智能虽然能记忆与生成,却难以真正“理解”。它能复现模式,却无法像人脑那样在时间中持续更新自己的世界模型。要理解智能的本质,我们必须回到神经系统最深层的逻辑:人脑如何以预测理解世界,以能量维持稳定,以记忆更新自我。
视觉错觉:大脑的预测性生成逻辑
在著名的"凹脸错觉(Hollow-Face Illusion)"中,一个凹陷的面具在视觉上总被感知为凸起。这并非感官缺陷,而是因为大脑高层的"人脸通常是凸起的"这一先验信念过于强大,其生成的预测压制了底层感官的"异常"信号。大脑选择相信它根据经验构建的世界模型,而非被动的感官输入。
这正是预测编码(Predictive Coding)理论的核心:大脑是一个主动的生成模型,它不断基于先验知识预测感官输入,然后将预测与现实的差异(预测误差)向上反馈,用以修正模型。我们"看到"的,并非世界本身,而是大脑为最小化误差而构建的"最可能的世界"。

预测编码理论指出,人脑中存在一个层级的生成模型(Generative Model)。高层通过生成“预测”来拟合输入并向低层传播,低层则将实际输入与预测的误差向上传播,反馈调整高层模型参数,从而使未来预测更准确。

这种预测机制反应更快,更节省资源。大脑在进化过程中逐步搭建了许多先验模型,如物体恒存、因果关系等。这些先验并非硬编码,而是通过交互中的错误修正逐渐习得。以婴儿为例,他们在生活环境中逐渐建构出"物体会继续存在"等先验。这样的模型使得低层感觉输入不会每次都被视为"新奇",因为高层模型已经预测了它们,从而减少了所需处理的"预测误差量"。
自由能原理:能量与认知的平衡
预测带来了效率,但错误的预测需要能量来修正。于是大脑必须在准确性与能耗之间寻找平衡,这便是 自由能原理(Free Energy Principle,FEP)的物理内涵。英国神经科学家 Karl Friston 提出:所有智能系统都在最小化自由能(Free Energy),即减少对世界的不确定性与解释代价。由于从现实的感官证据中推导真实后验几乎不可能,大脑或AI使用一个"近似后验"来猜测,其数学形式为变分自由能(Variational Free Energy)
它平衡了两项:复杂性(内部信念与真实后验的差异)和准确性(模型对观测数据的解释程度)。因而,大脑或AI的学习/推理过程,就是一场永不停歇的自由能最小化运动
-
当“复杂性”太高时:能量消耗大,系统倾向于回到常识先验。
-
当“准确性”太低时:模型解释不了证据,系统会更新模型,去更好地匹配数据。
这种机制让大脑成为一台“能量最优”的预测机器。对AI而言,这意味着智能的终极目标不是追求更大的参数量,而是追求更低的自由能。自适应强化学习正是自由能理论的AI化版本:智能体不再被动响应输入,而是主动选择行为来降低不确定性。这一思想正在催生“具身智能”与“世界模型AI”的新范式。
记忆再重构:动态更新的世界模型
大脑的世界并非静态,当外部环境改变时,高层模型也随之更新。现代认知神经科学研究认为,“记忆”并非如同硬盘那样简单“记录与读取”,而更像是一个生成模型+再重构 的过程。
当我们回忆一段经历时,神经系统重新激活相关的神经模式,利用真实经验中可预测、规律化的部分(“概念”成分)加上新的/意外的“感官”成分,输入hippocampus(海马体)→ 重放 → 训练 neocortex(新皮层)中的生成模型。这使得记忆系统极其节能:可预测的部分由模型生成,只需存储那些意外且重要的细节。

因而,记忆再重构并非单纯回放,而是对已有模型+新经验的融合,体现了“学习(模型参数更新)”+“推断(隐藏状态估计)”+“生成(回忆/想象)”的循环。这与 AI 系统中“每次训练都存档大量数据再反复训练”的模式有本质不同,展现了人脑在持续学习和能源效率上的卓越能力。
-
先验模型(在预测编码/自由能框架下)负责“已知规律”“常规结构”的预测。
-
记忆生成/重构机制负责将新经验纳入,并用于训练这些模型。下次遇到类似情形时,可以更快预测、更少误差。
从统计记忆到生成世界:AI的认知跃迁
人脑的智能,是宇宙中已知最高效的智能架构。它通过预测编码、自由能原理、记忆再重构,用极少的能量构建并维护着一个复杂、统一且动态更新的世界模型。当前AI与人脑的核心差距在于,AI更多是数据的统计者,而人脑是世界的生成者,看似神秘的神经过程,或许正是未来AI的蓝图。
未来的AI,须从"参数优化"迈向"自由能最小化",从"数据记忆"迈向"预测记忆"。其发展方向可能是"全局工作空间理论(Global Workspace Theory)" 的实践:通过预测编码实现模块间信息整合,利用自由能优化资源分配,借助记忆再构支持持续学习。这一架构或能赋予AI真正的"常识推理"能力。
-
Rao, R. P., & Ballard, D. H. (1999). Predictive coding in the visual cortex. Nature Neuroscience.
-
Stefanics, G., Kremláček, J., & Czigler, I. (2014). Visual mismatch negativity: a predictive coding view. Frontiers in human neuroscience.
-
Friston, K. (2010). The free-energy principle: a unified brain theory? Nature Reviews Neuroscience.
-
Spens, E. & Burgess, N.(2024). A generative model of memory construction and consolidation. Nature Human Behaviour.
-
Feldman, R. S. (2013). 发展心理学:人的毕生发展 (第 6 版). 世界图书出版公司
更多推荐


所有评论(0)