本期播客是谷歌 DeepMind 创始人 Demis Hassabis 与 Hannah Fry 教授的年度深度对谈。Demis 回顾了 AI 从大语言模型向代理式 AI (Agentic AI) 的重心转移,重点阐述了 DeepMind 利用 AI 解决材料科学、可控核聚变等科学突破。他坦诚剖析了当前大模型参差不齐的智力表现,指出通往 AGI (通用人工智能) 仍需补齐规划、推理和在线学习等关键拼图,并强调了世界模型在理解物理现实中的核心地位。面对堪比工业革命十倍速的社会变革,Demis 探讨了后稀缺时代的经济重构、国际协作的紧迫性,以及他对计算极限与人类意识本质的终极哲学思考。

欢迎订阅合集 AI 播客捕手:专门面向文字内容爱好者分享 AI 领域优质播客。如需加入 AI 交流群,后台回复交流,请务必备注(城市+行业+岗位+一句话介绍),否则不予通过。

目录

  • AI 科学突破回顾:从 AlphaFold 到可控核聚变
  • 通往 AGI 的技术鸿沟:参差的智力与缺失的拼图
  • 世界模型:构建理解物理现实的数字基座
  • 变革的量级:十倍于工业革命的社会与经济重构
  • 终极哲学:图灵机、意识与宇宙的计算本质
  • 个人思考

AI 科学突破回顾:从 AlphaFold 到可控核聚变

过去这一年对 AI 领域而言是非凡的,我们见证了技术重心从单纯的大语言模型向代理式 AI 转移,同时也看到多模态模型在机器人和自动驾驶领域的深度整合。对于 Demis Hassabis 而言,这一年不仅是技术迭代的一年,更是他长期坚持的「根节点问题 (Root Node Problems)」策略持续开花结果的一年。

所谓的「根节点问题」,是指那些位于科学探索最上游、一旦被解决就能解锁巨大的下游应用潜力的基础性难题。五年前,AlphaFold 的问世证明了这一策略的可行性——通过解决蛋白质折叠这一生物学基础难题,AI 为药物发现和生物学研究打开了全新的大门。如今,DeepMind 正将这一逻辑复制到更多领域:

  1. 材料科学与电池技术:Demis 透露,团队正在利用 AI 探索新材料,目标直指室温超导体和更高效的电池技术。这些基础材料的突破将直接重塑能源存储和传输的效率,是现代科技的基石。
  2. 可控核聚变:这是一个可能从根本上改变人类文明进程的领域。DeepMind 宣布了与 Commonwealth Fusion 的深度合作伙伴关系。Commonwealth Fusion 被认为是目前最接近实现可行的托卡马克 (Tokamak) 反应堆的一家初创公司。DeepMind 的角色是利用机器学习来帮助优化磁体对等离子体的束缚控制,甚至参与反应堆的材料设计。核聚变被视为能源的圣杯。如果能实现模块化的核聚变反应堆,人类将获得几乎无限、清洁且廉价的能源。这不仅能解决气候危机,还将让许多原本因能源成本过高而不可行的项目变得可行,例如大规模海水淡化(解决水资源短缺)或电解海水制氢(低成本生产火箭燃料)。
  3. 量子计算纠错:DeepMind 也在与 Google 的量子 AI 团队合作,利用机器学习协助开发纠错码 (Error Correction Codes)。这是一个双向互利的合作:现在经典 AI 帮助量子计算机诞生,未来量子计算机将反过来推动 AI 的发展。

这种科学优先的路径虽然比单纯的商业产品开发更为漫长,但其带来的社会价值是指数级的。Demis 认为,如果能源变得像空气一样廉价和清洁,许多现存的全球性问题(如贫困、资源争夺)将迎刃而解。这是 AI 作为科学工具所能展现的最宏大的图景——它不仅仅是聊天机器人,更是解锁物理世界限制的钥匙。

通往 AGI 的技术鸿沟:参差的智力与缺失的拼图

尽管 Gemini 3 等模型在各项基准测试中表现优异,甚至在国际数学奥林匹克竞赛中摘得金牌,但在处理一些高中水平的简单数学题或逻辑问题时,AI 仍可能犯下令人错愕的低级错误。Demis 将这种现象称为「参差的智力 (Jagged Intelligence)」:AI 在某些维度上达到了博士级水平,而在其他维度上甚至不如高中生。

这种不一致性揭示了当前模型距离真正的 AGI 还有相当的距离,Demis 认为目前我们可能只走完了 50% 的路程。为了跨越这一鸿沟,必须补齐以下几个关键拼图:

  • 一致性与可靠性 (Consistency):AGI 的标志之一应当是跨领域的稳定表现,而不是在此处惊才绝艳,在彼处错漏百出。
  • 推理与思考 (Reasoning & Thinking):目前的模型在推理时开始引入「思考时间 (Thinking Time)」,即在输出答案前进行更多的内部计算。这是一种进步,但 AI 尚未学会如何持续、稳定地利用这段时间来通过工具进行自我核查。
  • 在线学习与持续学习 (Online Learning):这是一个巨大的缺失。目前的大模型在训练完成后,其知识库就固化了(除了上下文窗口内的短期记忆)。它们无法像人类一样,在与世界的交互中实时学习新知识并更新自我。目前的流程依然是:训练 -> 部署 -> 冻结。
  • 从模仿到探索:AlphaGo vs AlphaZero:当前的大语言模型更像早期的 AlphaGo,它们通过学习人类产生的海量数据(互联网文本)来模仿人类的知识。它们是对人类现有知识的压缩和提取。下一阶段的目标是构建类似 AlphaZero 的系统。AlphaZero 不依赖人类棋谱,而是通过自我博弈发现了人类未曾掌握的策略。未来的 AGI 需要具备这种脱离人类现有数据,通过自我探索发现新知识(如新的科学原理)的能力。

关于「Scaling Laws 撞墙」的讨论,Demis 并不认同。他指出,扩展定律 (Scaling Laws) 并非在指数增长和停滞之间二选一,中间存在广阔的收益递减但依然显著的区域。DeepMind 的策略是 50% 的精力用于扩展 (Scaling),利用强大的算力(TPU 集群)挖掘现有架构的潜力;50% 的精力用于创新 (Innovation),探索新的架构和算法以解决上述的逻辑推理和记忆问题。只有两者结合,才能最终抵达 AGI。

此外,幻觉依然是一个核心痛点。虽然对于创造性任务来说,幻觉(即发散性思维)是种优势,但对于科学和事实性任务,它是致命的。未来的模型需要具备类似 AlphaFold 的置信度评分机制,能够内省并诚实地告诉用户:“这个问题我不知道”,或者“我对这个答案的信心只有 30%”。

世界模型:构建理解物理现实的数字基座

语言是人类智慧的结晶,包含的信息量远超预期,但它并不是世界的全部。世界上存在大量无法用语言精确描述的空间动力学和物理直觉——比如骑自行车时的平衡感、闻到气味时的感受、物体碰撞时的反作用力。为了让 AI 真正理解并在物理世界中行动(例如通用机器人或数字助理),我们需要构建世界模型。

世界模型不仅仅是生成视频,它是对物理世界因果关系和运行机制的深层模拟。DeepMind 在此领域做出了多项前沿探索:

  1. Genie 与 SIMA 的结合SIMA (Simulated Agents) 是 DeepMind 开发的能在各种 3D 环境(如《无人深空》)中听懂自然语言指令并执行任务的智能体。Genie 是一个能够从视频数据中学习并生成可交互虚拟世界的模型。DeepMind 尝试将 SIMA 放入 Genie 生成的世界中。这是一个盗梦空间式的场景:SIMA 在探索,而 Genie 根据 SIMA 的动作实时生成后续的世界反馈。这对两个 AI 来说都是一种极致的训练——SIMA 获得了无限的、难度动态调整的训练环境,而 Genie 则通过与智能体的互动验证了其物理生成的连贯性。

  2. 物理基准测试 (Physics Benchmark):现在的视频生成模型(如 Sora 或 Veo)生成的画面虽然逼真,但物理规律往往经不起推敲(例如反射错误、重力异常)。为了解决这个问题,DeepMind 正在构建基于游戏引擎的物理基准测试,类似于高中的物理实验(如小球滚下斜坡、钟摆运动),用来严格测试 AI 生成的世界是否符合牛顿运动定律。只有通过了这些严苛的物理测试,世界模型才能真正被用于指导机器人或科学模拟。

  3. 模拟作为科学工具:模拟不仅是训练 AI 的场域,更是科学发现的工具。Demis 设想,如果我们能构建足够精确的生物或气候模拟系统,就能以极低的成本进行数百万次对照实验,从而解开生命起源、意识诞生等复杂谜题。这种在模拟中重演进化的能力,可能是人类理解自身起源的终极手段。

变革的量级:十倍于工业革命的社会与经济重构

当谈及 AI 对社会的影响时,Demis 并没有回避泡沫这一话题。他坚持认为:AI 在短期内被过度炒作,但在长期内仍被低估。虽然部分初创企业的估值可能存在泡沫,但 AI 技术的底层变革力量是真实的。

他将即将到来的变革与工业革命进行了类比,但指出了两个关键区别:

  1. 规模更大:这次变革的影响力可能是工业革命的 10 倍。
  2. 速度更快:工业革命跨越了近百年,让社会有几代人的时间去适应;而 AI 革命可能在短短十年内展开,速度也是以前的 10 倍。

这种剧变将深刻挑战现有的经济和社会结构:

  • 劳动与资源的脱钩:传统的出卖劳动换取资源的经济契约在后 AGI 时代可能不再适用。如果 AI 能完成大部分工作,且核聚变带来了能源的极大丰富,我们可能进入「后稀缺社会 (Post-Scarcity Society)」。
  • 新经济模型的探索:Demis 提到,我们需要社会学家、经济学家和政府共同构想新的分配模式。除了普遍讨论的全民基本收入 (UBI),或许还有更激进的方案,例如基于积分的直接民主形式——社区成员利用分配的资源投票决定公共设施的建设(如网球场还是新教室),从而让资源分配更贴近民意。
  • 意义的重塑:当生存不再是问题,工作的定义被改写,人类将面临哲学的拷问:我们的目的是什么? 很多人通过工作和养家糊口获得尊严与意义,在一个自动化丰饶的世界里,人类需要寻找新的精神支柱。

在国际层面,Demis 对目前的割裂状态表示担忧。面对如此强大的技术,全球缺乏统一的协作框架。他推测,或许只有当某些「流氓行动者 (Rogue Actors)」利用 AI 造成了一次中等规模的危机后,世界各国才会真正坐下来制定具有约束力的国际标准。目前的商业竞争反而成了一种某种程度上的安全过滤器,因为企业客户需要可靠、安全的 AI,这在一定程度上抑制了不负责任的开发。

终极哲学:图灵机、意识与宇宙的计算本质

访谈的最后,话题升华到了 Demis 毕生的科学追求:图灵机 (Turing Machine) 的极限在哪里?

Demis 自少年时代起就对这个问题着迷。如果宇宙中的一切都是可计算的,那么理论上,一台足够强大的图灵机(计算机)应该能够模拟宇宙中的一切,包括人类的大脑和意识。

  • 这一假设的唯一变数:除非如物理学家罗杰·彭罗斯 (Roger Penrose) 所言,大脑中存在某种不可计算的量子效应。如果是这样,经典计算机将永远无法产生意识,我们将需要量子计算机。
  • Demis 的赌注:目前为止,物理学界尚未发现宇宙中存在任何不可计算的事物。因此,Demis 倾向于认为,通过经典计算架构(或许结合量子数据的输入),我们最终能够模拟出与人类心智无异的智能。
  • 模拟作为镜像:一旦我们构建出 AGI 并将其作为心智的模拟,我们就可以将其与人类真实的思维进行对比。这种对比将不仅揭示智能的原理,更将让我们看清什么是人类独有的——也许是某种特定的创造力,也许是做梦的能力,或者是情感的微妙之处。

Demis 坦言,站在科学前沿既令人兴奋也令人倍感压力。他不仅是在构建工具,更是在试图解开「作为人类意味着什么」这一终极谜题。他的终极使命是协助全人类将 AGI 安全地护送过线,之后,他希望能休一个长假,去享受那个由人类与超级智能共存的新世界。

个人思考

从 Demis Hassabis 的访谈中,可以看到几个关键的思考方式,用于指导在 AI 时代的认知与行动:

  1. “根节点”解题法:    不要只盯着表层的应用(如聊天机器人),要寻找那些位于因果链条最上游的“根节点问题”(如材料科学、能源获取)。解决这些问题虽然周期长、难度大,但一旦突破,就能通过连锁反应解锁巨大的下游价值。做难而正确的事,往往也是壁垒最高的事。
  2. 50/50 的资源配比哲学:    在面对技术变革时,DeepMind 采取了“50% 扩展+ 50% 创新”的策略。这启示我们:既要利用现有成熟技术(榨取最大红利,保持竞争力;又要投入同等资源去探索未知的非连续性创新,以防止在下一波范式转移中掉队。
  3. 模拟即理解:    Demis 认为“如果你能完美模拟它,你就理解了它”。这是一种强有力的认知验证标准。无论是物理世界还是商业逻辑,尝试构建一个能自行运转的模型,是检验我们是否真正掌握了系统底层规律的最佳方式。在 AGI 时代,构建和利用模拟器将是最高效的学习与创造路径。
Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐