Science | 基于RoseTTAFold All-Atom的通用生物分子建模与设计

  • A+

为大家分享一篇发表在Science上的文章Generalized biomolecular modeling and design with RoseTTAFold All-Atom,通讯作者是来自华盛顿大学的David Baker教授,他是蛋白质建模与设计的领军科学家。


1
深度神经网络模型如AlphaFold2(AF2)、RoseTTAFold(RF)能够从氨基酸序列高精度地预测蛋白质结构。然而在自然界中,蛋白质很少单独起作用,而是与其它蛋白质、DNA、RNA、小分子等相互作用,对这类多肽链、共价修饰氨基酸、核酸或任意小分子组成的一般性生物分子组装体进行建模仍然是一个重大挑战。通过RoseTTAFoldNA(RFNA),作者团队已经可以建模蛋白与DNA/RNA的相互作用;在本文中,作者着手进一步开发RoseTTAFold All-Atom(RFAA),以应对广义生物分子系统建模问题。
2
现有的蛋白质结构预测网络将蛋白质表示为氨基酸的线性链,这种表示可以很容易地扩展到核酸,但目前尚不清楚如何将小分子建模为线性序列。一种自然的小分子表示方法是以原子为节点、边为键连关系的图模型,但这种表示又不适用于包含数千个原子的蛋白质。因此,RFAA试图将基于序列的生物大分子(蛋白质和核酸)表示和小分子、共价修饰等原子图表示相结合。
在网络结构上,RFAA基于RoseTTAFold2,蛋白质和核酸链仍以线性序列表示,任意小分子、共价修饰和非天然氨基酸被表示为原子键图,包含了1D的元素类型信息、2D的键连信息和3D的手性信息。这些信息经过三轨神经网络,最终输出预测的原子坐标,同时还预测原子和残基的置信度pLDDT和成对置信度PAE指标。
3
作者在本文中展示了RFAA的几种应用。第一个案例作者使用RFAA建模蛋白-小分子复合物。对于配体盲对接CAMEO评估,RFAA对43%的靶标进行了高置信度的预测,在这些高置信度结构中,77%的配体RMSD<2A,领先其它深度学习方法。第二个案例作者使用RFAA建模蛋白上的共价修饰和非天然氨基酸,方法是将修饰残基和修饰基团一起作为原子图,而将其余部分视为残基链。作者发现能够对糖基化修饰、酶的辅因子和共价结合药物的构象进行预测,低PAE分数的预测效果往往更好,这类任务是其它深度学习工具尚未报道的。在第三个案例中,作者推断RFAA可以在非蛋白类生物分子的背景下进行蛋白质设计。类似于RFDiffusion,作者开发了RFDiffusion All-Atom(RFDiffusionAA),通过对蛋白质-小分子训练集的输入结构进行加噪,并训练去噪扩散概率模型(DDPM)以消除噪声。作者展示了针对心脏病治疗药物地高辛(DIG)、血红素配体Heme、以及针对胆色素分子Bilins的结合蛋白设计,并通过实验表征了这些新型结合蛋白,这些结合剂任何已知蛋白都不具有序列相似性。
4
总之,作者的预测和设计结果表明,RFAA已经了解了蛋白-小分子复合物的详细相互作用特征,拥有巨大的应用前景。

本文作者:WFZ
责任编辑:ZJ
原文链接:https://www.science.org/doi/10.1126/science.adl2528
文章引用:DOI:10.1126/science.adl2528



weinxin
我的微信
关注我了解更多内容

发表评论

目前评论:0