谷歌 DeepMind 创始人2025 年总结：通往 AGI，还差 4 块关键拼图！

Demis 回顾了 AI 从大语言模型向代理式 AI (Agentic AI) 的重心转移，重点阐述了 DeepMind 利用 AI 解决材料科学、可控核聚变等科学突破。他坦诚剖析了当前大模型参差不齐的智力表现，指出通往 AGI (通用人工智能) 仍需补齐规划、推理和在线学习等关键拼图，并强调了世界模型在理解物理现实中的核心地位。面对堪比工业革命十倍速的社会变革，Demis 探讨了后稀缺时代的经济

莫尔索_

621人浏览 · 2026-01-23 17:08:42

莫尔索_ · 2026-01-23 17:08:42 发布

本期播客是谷歌 DeepMind 创始人 Demis Hassabis 与 Hannah Fry 教授的年度深度对谈。Demis 回顾了 AI 从大语言模型向代理式 AI (Agentic AI) 的重心转移，重点阐述了 DeepMind 利用 AI 解决材料科学、可控核聚变等科学突破。他坦诚剖析了当前大模型参差不齐的智力表现，指出通往 AGI (通用人工智能) 仍需补齐规划、推理和在线学习等关键拼图，并强调了世界模型在理解物理现实中的核心地位。面对堪比工业革命十倍速的社会变革，Demis 探讨了后稀缺时代的经济重构、国际协作的紧迫性，以及他对计算极限与人类意识本质的终极哲学思考。

欢迎订阅合集 AI 播客捕手：专门面向文字内容爱好者分享 AI 领域优质播客。如需加入 AI 交流群，后台回复交流，请务必备注（城市+行业+岗位+一句话介绍），否则不予通过。

AI 科学突破回顾：从 AlphaFold 到可控核聚变
通往 AGI 的技术鸿沟：参差的智力与缺失的拼图
世界模型：构建理解物理现实的数字基座
变革的量级：十倍于工业革命的社会与经济重构
终极哲学：图灵机、意识与宇宙的计算本质
个人思考

AI 科学突破回顾：从 AlphaFold 到可控核聚变

过去这一年对 AI 领域而言是非凡的，我们见证了技术重心从单纯的大语言模型向代理式 AI 转移，同时也看到多模态模型在机器人和自动驾驶领域的深度整合。对于 Demis Hassabis 而言，这一年不仅是技术迭代的一年，更是他长期坚持的「根节点问题 (Root Node Problems)」策略持续开花结果的一年。

所谓的「根节点问题」，是指那些位于科学探索最上游、一旦被解决就能解锁巨大的下游应用潜力的基础性难题。五年前，AlphaFold 的问世证明了这一策略的可行性——通过解决蛋白质折叠这一生物学基础难题，AI 为药物发现和生物学研究打开了全新的大门。如今，DeepMind 正将这一逻辑复制到更多领域：

材料科学与电池技术：Demis 透露，团队正在利用 AI 探索新材料，目标直指室温超导体和更高效的电池技术。这些基础材料的突破将直接重塑能源存储和传输的效率，是现代科技的基石。
可控核聚变：这是一个可能从根本上改变人类文明进程的领域。DeepMind 宣布了与 Commonwealth Fusion 的深度合作伙伴关系。Commonwealth Fusion 被认为是目前最接近实现可行的托卡马克 (Tokamak) 反应堆的一家初创公司。DeepMind 的角色是利用机器学习来帮助优化磁体对等离子体的束缚控制，甚至参与反应堆的材料设计。核聚变被视为能源的圣杯。如果能实现模块化的核聚变反应堆，人类将获得几乎无限、清洁且廉价的能源。这不仅能解决气候危机，还将让许多原本因能源成本过高而不可行的项目变得可行，例如大规模海水淡化（解决水资源短缺）或电解海水制氢（低成本生产火箭燃料）。
量子计算纠错：DeepMind 也在与 Google 的量子 AI 团队合作，利用机器学习协助开发纠错码 (Error Correction Codes)。这是一个双向互利的合作：现在经典 AI 帮助量子计算机诞生，未来量子计算机将反过来推动 AI 的发展。

这种科学优先的路径虽然比单纯的商业产品开发更为漫长，但其带来的社会价值是指数级的。Demis 认为，如果能源变得像空气一样廉价和清洁，许多现存的全球性问题（如贫困、资源争夺）将迎刃而解。这是 AI 作为科学工具所能展现的最宏大的图景——它不仅仅是聊天机器人，更是解锁物理世界限制的钥匙。

通往 AGI 的技术鸿沟：参差的智力与缺失的拼图

尽管 Gemini 3 等模型在各项基准测试中表现优异，甚至在国际数学奥林匹克竞赛中摘得金牌，但在处理一些高中水平的简单数学题或逻辑问题时，AI 仍可能犯下令人错愕的低级错误。Demis 将这种现象称为「参差的智力 (Jagged Intelligence)」：AI 在某些维度上达到了博士级水平，而在其他维度上甚至不如高中生。

这种不一致性揭示了当前模型距离真正的 AGI 还有相当的距离，Demis 认为目前我们可能只走完了 50% 的路程。为了跨越这一鸿沟，必须补齐以下几个关键拼图：

一致性与可靠性 (Consistency)：AGI 的标志之一应当是跨领域的稳定表现，而不是在此处惊才绝艳，在彼处错漏百出。
推理与思考 (Reasoning & Thinking)：目前的模型在推理时开始引入「思考时间 (Thinking Time)」，即在输出答案前进行更多的内部计算。这是一种进步，但 AI 尚未学会如何持续、稳定地利用这段时间来通过工具进行自我核查。
在线学习与持续学习 (Online Learning)：这是一个巨大的缺失。目前的大模型在训练完成后，其知识库就固化了（除了上下文窗口内的短期记忆）。它们无法像人类一样，在与世界的交互中实时学习新知识并更新自我。目前的流程依然是：训练 -> 部署 -> 冻结。
从模仿到探索：AlphaGo vs AlphaZero：当前的大语言模型更像早期的 AlphaGo，它们通过学习人类产生的海量数据（互联网文本）来模仿人类的知识。它们是对人类现有知识的压缩和提取。下一阶段的目标是构建类似 AlphaZero 的系统。AlphaZero 不依赖人类棋谱，而是通过自我博弈发现了人类未曾掌握的策略。未来的 AGI 需要具备这种脱离人类现有数据，通过自我探索发现新知识（如新的科学原理）的能力。

关于「Scaling Laws 撞墙」的讨论，Demis 并不认同。他指出，扩展定律 (Scaling Laws) 并非在指数增长和停滞之间二选一，中间存在广阔的收益递减但依然显著的区域。DeepMind 的策略是 50% 的精力用于扩展 (Scaling)，利用强大的算力（TPU 集群）挖掘现有架构的潜力；50% 的精力用于创新 (Innovation)，探索新的架构和算法以解决上述的逻辑推理和记忆问题。只有两者结合，才能最终抵达 AGI。

此外，幻觉依然是一个核心痛点。虽然对于创造性任务来说，幻觉（即发散性思维）是种优势，但对于科学和事实性任务，它是致命的。未来的模型需要具备类似 AlphaFold 的置信度评分机制，能够内省并诚实地告诉用户：“这个问题我不知道”，或者“我对这个答案的信心只有 30%”。

世界模型：构建理解物理现实的数字基座

语言是人类智慧的结晶，包含的信息量远超预期，但它并不是世界的全部。世界上存在大量无法用语言精确描述的空间动力学和物理直觉——比如骑自行车时的平衡感、闻到气味时的感受、物体碰撞时的反作用力。为了让 AI 真正理解并在物理世界中行动（例如通用机器人或数字助理），我们需要构建世界模型。

世界模型不仅仅是生成视频，它是对物理世界因果关系和运行机制的深层模拟。DeepMind 在此领域做出了多项前沿探索：

Genie 与 SIMA 的结合：SIMA (Simulated Agents) 是 DeepMind 开发的能在各种 3D 环境（如《无人深空》）中听懂自然语言指令并执行任务的智能体。Genie 是一个能够从视频数据中学习并生成可交互虚拟世界的模型。DeepMind 尝试将 SIMA 放入 Genie 生成的世界中。这是一个盗梦空间式的场景：SIMA 在探索，而 Genie 根据 SIMA 的动作实时生成后续的世界反馈。这对两个 AI 来说都是一种极致的训练——SIMA 获得了无限的、难度动态调整的训练环境，而 Genie 则通过与智能体的互动验证了其物理生成的连贯性。
物理基准测试 (Physics Benchmark)：现在的视频生成模型（如 Sora 或 Veo）生成的画面虽然逼真，但物理规律往往经不起推敲（例如反射错误、重力异常）。为了解决这个问题，DeepMind 正在构建基于游戏引擎的物理基准测试，类似于高中的物理实验（如小球滚下斜坡、钟摆运动），用来严格测试 AI 生成的世界是否符合牛顿运动定律。只有通过了这些严苛的物理测试，世界模型才能真正被用于指导机器人或科学模拟。
模拟作为科学工具：模拟不仅是训练 AI 的场域，更是科学发现的工具。Demis 设想，如果我们能构建足够精确的生物或气候模拟系统，就能以极低的成本进行数百万次对照实验，从而解开生命起源、意识诞生等复杂谜题。这种在模拟中重演进化的能力，可能是人类理解自身起源的终极手段。

变革的量级：十倍于工业革命的社会与经济重构

当谈及 AI 对社会的影响时，Demis 并没有回避泡沫这一话题。他坚持认为：AI 在短期内被过度炒作，但在长期内仍被低估。虽然部分初创企业的估值可能存在泡沫，但 AI 技术的底层变革力量是真实的。

他将即将到来的变革与工业革命进行了类比，但指出了两个关键区别：

规模更大：这次变革的影响力可能是工业革命的 10 倍。
速度更快：工业革命跨越了近百年，让社会有几代人的时间去适应；而 AI 革命可能在短短十年内展开，速度也是以前的 10 倍。

这种剧变将深刻挑战现有的经济和社会结构：

劳动与资源的脱钩：传统的出卖劳动换取资源的经济契约在后 AGI 时代可能不再适用。如果 AI 能完成大部分工作，且核聚变带来了能源的极大丰富，我们可能进入「后稀缺社会 (Post-Scarcity Society)」。
新经济模型的探索：Demis 提到，我们需要社会学家、经济学家和政府共同构想新的分配模式。除了普遍讨论的全民基本收入 (UBI)，或许还有更激进的方案，例如基于积分的直接民主形式——社区成员利用分配的资源投票决定公共设施的建设（如网球场还是新教室），从而让资源分配更贴近民意。
意义的重塑：当生存不再是问题，工作的定义被改写，人类将面临哲学的拷问：我们的目的是什么？ 很多人通过工作和养家糊口获得尊严与意义，在一个自动化丰饶的世界里，人类需要寻找新的精神支柱。

在国际层面，Demis 对目前的割裂状态表示担忧。面对如此强大的技术，全球缺乏统一的协作框架。他推测，或许只有当某些「流氓行动者 (Rogue Actors)」利用 AI 造成了一次中等规模的危机后，世界各国才会真正坐下来制定具有约束力的国际标准。目前的商业竞争反而成了一种某种程度上的安全过滤器，因为企业客户需要可靠、安全的 AI，这在一定程度上抑制了不负责任的开发。

终极哲学：图灵机、意识与宇宙的计算本质

访谈的最后，话题升华到了 Demis 毕生的科学追求：图灵机 (Turing Machine) 的极限在哪里？

Demis 自少年时代起就对这个问题着迷。如果宇宙中的一切都是可计算的，那么理论上，一台足够强大的图灵机（计算机）应该能够模拟宇宙中的一切，包括人类的大脑和意识。

这一假设的唯一变数：除非如物理学家罗杰·彭罗斯 (Roger Penrose) 所言，大脑中存在某种不可计算的量子效应。如果是这样，经典计算机将永远无法产生意识，我们将需要量子计算机。
Demis 的赌注：目前为止，物理学界尚未发现宇宙中存在任何不可计算的事物。因此，Demis 倾向于认为，通过经典计算架构（或许结合量子数据的输入），我们最终能够模拟出与人类心智无异的智能。
模拟作为镜像：一旦我们构建出 AGI 并将其作为心智的模拟，我们就可以将其与人类真实的思维进行对比。这种对比将不仅揭示智能的原理，更将让我们看清什么是人类独有的——也许是某种特定的创造力，也许是做梦的能力，或者是情感的微妙之处。

Demis 坦言，站在科学前沿既令人兴奋也令人倍感压力。他不仅是在构建工具，更是在试图解开「作为人类意味着什么」这一终极谜题。他的终极使命是协助全人类将 AGI 安全地护送过线，之后，他希望能休一个长假，去享受那个由人类与超级智能共存的新世界。

个人思考

从 Demis Hassabis 的访谈中，可以看到几个关键的思考方式，用于指导在 AI 时代的认知与行动：

“根节点”解题法：不要只盯着表层的应用（如聊天机器人），要寻找那些位于因果链条最上游的“根节点问题”（如材料科学、能源获取）。解决这些问题虽然周期长、难度大，但一旦突破，就能通过连锁反应解锁巨大的下游价值。做难而正确的事，往往也是壁垒最高的事。
50/50 的资源配比哲学：在面对技术变革时，DeepMind 采取了“50% 扩展+ 50% 创新”的策略。这启示我们：既要利用现有成熟技术（榨取最大红利，保持竞争力；又要投入同等资源去探索未知的非连续性创新，以防止在下一波范式转移中掉队。
模拟即理解： Demis 认为“如果你能完美模拟它，你就理解了它”。这是一种强有力的认知验证标准。无论是物理世界还是商业逻辑，尝试构建一个能自行运转的模型，是检验我们是否真正掌握了系统底层规律的最佳方式。在 AGI 时代，构建和利用模拟器将是最高效的学习与创造路径。