此前,生成式蛋白质设计模型 RFdiffusion 主要通过对理想活性位点的描述,实现精确固定位点的蛋白质结构生成。然而,该方法存在难以解决的 2 大局限:

  • 活性位点几何形状只能在残基级别指定,研究人员必须通过枚举侧链旋转异构体来确定残基骨架可能位置;

  • 催化残基的位置必须在序列中预先设定,极大地限制了可采样解的空间。

针对相关挑战,2025 年 4 月,华盛顿大学蛋白质设计研究所发布了全新生成模型 Rosetta Fold diffusion 2(RFdiffusion2),实现了根据简单的化学反应描述,生成具有定制活性位点的蛋白质骨架的优化路径,突破了长期以来在催化剂设计上的技术瓶颈, 为包括塑料降解在内的多种应用提供了强有力的技术支撑。

RFdiffusion2 采用了一种新的深度生成方法,能够基于与序列无关的功能团位置描述进行蛋白质设计,而无需进行反向旋转异构体生成。相对于前代模型,RFdiffusion2 的优化主要集中在 3 个方面:

  • 取消了对残基枚举和序列索引的依赖,引入流匹配(Flow Matching)与随机居中(Stochastic Centering)技术,使得模型可以直接在原子级别生成蛋白质骨架;

  • 支持无索引的原子级活性位点生成,能够处理配体信息并在生成过程中自动采样配体构象,提高了设计灵活性;

  • 采用了全新的 AME 基准,包含 41 个不同活性位点(前代仅覆盖 16 个)的计算机蛋白质设计基准。

在进一步的实验中,研究团队围绕 3 个不同催化位点设计蛋白质。实验结果显示,RFdiffusion2 相较于前代方法有显著的性能提升,在 41 个案例中都能成功生成满足约束条件的蛋白质骨架,成功率高达 100%; 而相同条件下,RFdiffusion1 成功率仅约为 39%。可以说,RFdiffusion2 的推出,标志着人工智能驱动的蛋白质设计迈出了关键一步。

「RFdiffusion2:蛋白质设计工具」现已上线 HyperAI超神经官网(hyper.ai)的「教程」板块,一键运行即可体验最新的蛋白质生成工具~

教程链接:

https://hyper.ai/cn/tutorials/44096

Demo 运行

1.在浏览器输入网址 hyper.ai,进入首页后,点击「教程」页面,并选择「RFdiffusion2:蛋白质设计工具」,点击「在线运行此教程」。

在这里插入图片描述
在这里插入图片描述

2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

在这里插入图片描述

3.选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,并点击「继续执行」。OpenBayes 平台提供了 4 种计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

HyperAI超神经专属邀请链接(直接复制到浏览器打开):

https://openbayes.com/console/signup?r=Ada0322_NR0n

在这里插入图片描述
在这里插入图片描述

4.等待分配资源,首次克隆需等待约 2 分钟左右的时间。当状态变为「运行中」后,点击「打开工作空间」旁边的跳转箭头,即可跳转至 Demo 页面。

在这里插入图片描述

效果演示

进入 Demo 运行页面后,输入 benchmarks 并点击运行即可得到输出结果。

此处以「active_site_indexed_atomic」为例进行展示

在这里插入图片描述

  • 显示最终的蛋白质设计文件

在这里插入图片描述

  • 显示扩散过程中每个时间的去噪后结构,部分示例如下:

在这里插入图片描述

  • 显示最终结构预测轨迹文件,部分示例如下:
    在这里插入图片描述
    在这里插入图片描述

以上就是 HyperAI超神经本期推荐的教程,欢迎大家前来体验!

教程链接:

https://go.hyper.ai/DhRS9

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐