FermiNet:从第一性原理探索量子物理与化学

使用深度学习解决计算量子化学的基本问题

在一篇发表于《物理评论研究》的文章中,展示了深度学习如何帮助解决真实世界系统的量子力学基本方程。这不仅是一个重要的基础科学问题,未来还可能带来实际应用,使研究人员能够在实验室尝试合成之前,通过计算机模拟来原型化新材料和化学合成。

我们的神经网络架构FermiNet(费米子神经网络)非常适合模拟大量电子(化学键的基本构建块)的量子态。我们发布了这项研究的代码,以便计算物理和化学界能够在此基础上构建并应用于各种问题。

FermiNet是第一个通过深度学习从第一性原理计算原子和分子能量且精度足以实用的演示,而基于自注意力的新颖架构Psiformer至今仍是最精确的AI方法。

量子力学简史

提到"量子力学",你更可能感到困惑而非启发。这个短语让人联想到薛定谔的猫——可以悖论性地既生又死,以及本质上也是波的基本粒子。

在量子系统中,像电子这样的粒子并没有精确的位置,如同经典描述那样。相反,其位置由概率云描述——它在所有允许存在的位置上弥散开来。这种反直觉的情况使得理查德·费曼宣称:“如果你认为你理解量子力学,那你就不理解量子力学。”

尽管存在这种诡异的怪诞,但理论的核心可以简化为几个简单的方程。其中最著名的是薛定谔方程,它描述了量子尺度上粒子的行为,就像牛顿运动定律描述我们更熟悉的人类尺度上的物体行为一样。

这些方程足以在原子和原子核水平上描述我们周围所有熟悉物质的行为。它们的反直觉性质导致了各种奇异现象:超导体、超流体、激光和半导体都只有通过量子效应才可能实现。但即使是普通的共价键——化学的基本构建块——也是电子量子相互作用的结果。

费米子神经网络

尽管现有的计算量子力学工具范围广泛,但我们觉得需要一种新方法来解决高效表示的问题。最大的量子化学计算即使使用最近似的方法也只能处理数万电子,而经典化学计算技术如分子动力学可以处理数百万原子,这是有原因的。

经典系统的状态可以轻松描述——我们只需要跟踪每个粒子的位置和动量。表示量子系统的状态则更具挑战性。必须为电子位置的每种可能配置分配概率。这被编码在波函数中,它为电子的每种配置分配正数或负数,波函数的平方给出了在该配置中找到系统的概率。

所有可能配置的空间是巨大的——如果你尝试将其表示为每个维度有100个点的网格,那么硅原子的可能电子配置数量将大于宇宙中的原子数量。这正是我们认为深度神经网络可以提供帮助的地方。

在处理电子时有一个难点。电子必须遵守泡利不相容原理,这意味着它们不能同时处于同一空间。这是因为电子是一种称为费米子的粒子类型,包括大多数物质的构建块:质子、中子、夸克、中微子等。它们的波函数必须是反对称的。如果交换两个电子的位置,波函数会乘以-1。这意味着如果两个电子重叠,波函数(以及该配置的概率)将为零。

这意味着我们必须开发一种对其输入具有反对称性的新型神经网络,我们称之为FermiNet。在大多数量子化学方法中,反对称性是通过称为行列式的函数引入的。矩阵的行列式具有这样的特性:如果交换两行,输出会乘以-1,就像费米子的波函数一样。

因此,你可以取一堆单电子函数,对系统中的每个电子进行评估,并将所有结果打包到一个矩阵中。该矩阵的行列式就是一个适当反对称的波函数。这种方法的主要限制是所得函数——称为斯莱特行列式——不够通用。

真实系统的波函数通常要复杂得多。改进这一点的典型方法是取斯莱特行列式的大线性组合——有时是数百万或更多——并添加一些基于电子对的简单修正。即便如此,这可能仍不足以准确计算能量。

深度神经网络在表示复杂函数方面通常比基函数的线性组合更高效。在FermiNet中,这是通过使进入行列式的每个函数成为所有电子的函数来实现的。这远远超出了仅使用单电子和双电子函数的方法。

我们通过最小化系统的能量来拟合FermiNet。要精确做到这一点,我们需要在所有可能的电子配置处评估波函数,因此我们必须近似地进行。我们随机选择一组电子配置,在每种电子排列处局部评估能量,将每种排列的贡献相加,并最小化这个值而不是真实能量。这被称为蒙特卡洛方法,因为它有点像赌徒反复掷骰子。

验证FermiNet的准确性

为了确保FermiNet代表了最先进技术的进步,我们首先研究了简单、经过充分研究的系统,比如周期表第一行的原子(氢到氖)。这些都是小系统——10个或更少电子——简单到可以用最精确(但指数级扩展)的方法处理。

FermiNet在性能上远超可比较的VMC计算——通常将相对于指数级扩展计算的误差减少一半或更多。在更大的系统上,指数级扩展方法变得难以处理,因此我们改用耦合簇方法作为基准。

我们将FermiNet应用于逐渐增大的分子,从氢化锂开始,一直到 bicyclobutane,这是我们研究的最大系统,有30个电子。在最小的分子上,FermiNet捕获了耦合簇能量与单斯莱特行列式能量之间差异的惊人99.8%。在 bicyclobutane上,FermiNet仍然捕获了97%或更多的这种关联能,对于如此简单的方法来说是一个巨大成就。

计算激发态的新方法

我们于2024年8月在《科学》杂志上发表了这项工作的下一阶段。我们的研究提出了解决计算量子化学中最困难挑战之一的方案:理解分子在受刺激时如何过渡到激发态以及从激发态返回。

FermiNet最初专注于分子的基态,即给定原子核组周围电子的最低能量配置。但当分子和材料受到大量能量刺激时,比如暴露在光或高温下,电子可能会被踢到更高的能量配置——激发态。

激发态对于理解物质如何与光相互作用至关重要。吸收和释放的确切能量量为不同分子和材料创造了独特的指纹,影响着从太阳能电池板和LED到半导体、光催化剂等技术性能。它们还在涉及光的生物过程中发挥关键作用,如光合作用和视觉。

准确计算激发态的能量比计算基态能量更具挑战性。我们开发了一种计算激发态的新方法,比先前的方法更稳健和通用。我们的方法可以应用于任何类型的数学模型,包括FermiNet和其他神经网络。它通过找到具有额外粒子的扩展系统的基态来工作,因此可以几乎不加修改地使用现有的优化算法。

我们在广泛的基准测试上验证了这项工作,结果非常有希望。在一个称为碳二聚体的小而复杂的分子上,我们实现了4 meV的平均绝对误差,这比先前达到20 meV的黄金标准方法接近实验结果五倍。

今天我们开源了我们最新的工作,希望研究界将在我们的方法基础上构建,探索物质与光相互作用的意外方式。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐