文献分享:PhiGnet准确预测蛋白质功能
2024-08-13
来源:
浏览量:

背景

了解蛋白质功能对于理解许多关键生物活动的复杂机制至关重要,对医学、生物技术和药物开发领域具有深远的影响。然而,超过2亿种蛋白质仍未得到表征,计算工作严重依赖蛋白质结构信息来预测不同功能的注释。

2024年8月4日牛津大学的研究人员在Nature Communications上发表了一篇名为“Accurate prediction of protein function using statistics-informed graph networks”的研究成果。该研究设计了一种基于统计的学习方法PhiGnet,以促进蛋白质的功能注释和功能位点的识别。该方法固有地表征了进化特征,允许对执行特定功能的残基的重要性进行定量评估。与其他方法相比,PhiGnet不仅表现出优越的性能,而且即使在缺乏结构信息的情况下,也缩小了序列-函数的差距。我们的研究结果表明,将深度学习应用于进化数据可以在残基水平上突出功能位点,为研究和生物医学中解释蛋白质的现有特性和新功能提供有价值的支持。

文献分享:PhiGnet准确预测蛋白质功能

PhiGnet用于蛋白质功能注释

PhiGnet可以在没有结构信息的情况下,仅根据序列预测蛋白质功能。给定一个序列,PhiGnet使用堆叠的GCN学习预嵌入、EVC 和RC,以推断蛋白质功能注释。研究人员计算了含丝氨酸-天冬氨酸重复序列的蛋白D(SdrD)的RC。两个RC被映射到完全β片层折叠上,该折叠与三个Ca2+离子结合。从EVC中鉴定出的大多数残基与三个Ca2+离子,共同作用以稳定SdrD折叠。这表明,即使EVC稀疏地分布在RC中,EVC也包含推断残基功能作用的基本信息。使用PhiGnet来计算MgIA蛋白功能位点的激活分数,PhiGnet计算的活化分数用于衡量每个残基的重要性,分数越高,该残基在生物活性中发挥功能作用的可能性就越大。

文献分享:PhiGnet准确预测蛋白质功能

PhiGnet注释蛋白质功能位点

鉴于氨基酸的功能贡献在不同功能之间可能存在显著差异,PhiGnet的一个关键特性是它能够定量评估单个氨基酸对特定功能的重要性,使我们能够识别与不同生物活性相关的残基。通过PhiGnet评估了九种蛋白质中残基的重要性,激活分数可以指示必需的配体/离子接触残基,这表明从不同层次的进化知识中学习可以识别残基水平的结合界面。

文献分享:PhiGnet准确预测蛋白质功能

PhiGnet相对于其他方法的优势

PhiGnet方法展示了在两个测试集中为蛋白质分配功能注释的预测能力,PhiGnet能够实现对蛋白质的EC编号的准确分配。比较GO术语的预测性能,PhiGnet在准确性和稳健性方面均名列第一。PhiGnet在泛化方面具有稳健性,可以测试与训练集中的蛋白质具有不同序列同一性阈值的蛋白质。PhiGnet能够在没有结构信息的情况下,通过氨基酸序列预测蛋白质功能,并量化每个残基对特定功能的重要性,这对于鉴定功能关键位点具有重要意义。

文献分享:PhiGnet准确预测蛋白质功能

由进化特征驱动的PhiGnet

研究人员通过进行大量实验,发现PhiGnet预测的残基与通过实验测定确定的功能位点的残基一致。进化信息,特别是RC中包含的信息,足以指定蛋白质的功能并定量表征功能位点上的残基。此外,结果表明RC包含的进化知识处于更高阶水平,而EVC中的信息处于较低阶水平。同时,RC中包含的信息在增强PhiGnet在残基水平上识别功能相关位点的能力方面发挥着重要作用。

文献分享:PhiGnet准确预测蛋白质功能

研究人员还将PhiGnet应用于一些未知功能的蛋白质,通过实验验证发现PhiGnet的高置信度预测与实验注释高度一致,这表明它将有助于为具有未知标签的蛋白质分配功能注释的计算工作。

 

 

总结

该研究设计了一种基于统计的学习方法PhiGnet,以促进蛋白质的功能注释和功能位点的识别。该方法固有地表征了进化特征,允许对执行特定功能的残基的重要性进行定量评估。PhiGnet与其他方法相比表现优异,即使在缺乏结构数据的情况下,也能量化特定功能的个别残基的重要性。该研究结果表明将深度学习应用于进化数据可以突出显示残基级别的功能位点,为解释研究和生物医学中蛋白质的现有特性和新功能提供宝贵支持。

 文献分享:PhiGnet准确预测蛋白质功能