自从DeepMind在2020年结构预测关键评估(CASP14)会议上展示了这一领域的显著进展以来,科学家们已经等待了数月,以获得高度精确的蛋白质结构预测。等待现在结束了。西雅图华盛顿大学医学院蛋白质设计研究所(UW Medicine)的研究人员在很大程度上再现了DeepMind在这项重要任务上的表现。
与DeepMind不同的是,华盛顿大学医学团队的这种名为RoseTTAFold的方法是免费提供的。来自世界各地的科学家现在正在使用它来建立蛋白质模型,以加速他们自己的研究。自7月以来,该程序已被140多个独立研究团队从GitHub下载。
蛋白质由氨基酸串组成,折叠成复杂的微观形状。这些独特的形状反过来又产生了生物体内几乎所有的化学过程。通过更好地了解蛋白质的形状,科学家们可以加快新疗法的开发癌症,新型冠状病毒肺炎,以及成千上万的其他健康问题。
“在蛋白质设计研究所,这是忙碌的一年,设计COVID-19疗法和疫苗,并将其投入临床试验,同时开发用于高精度蛋白质结构预测的RoseTTAFold。我很高兴科学界已经在使用RoseTTAFold服务器来解决突出的生物学问题,”华盛顿大学医学院生物化学教授、蛋白质设计研究所主任、资深作者大卫·贝克说。
在这项新研究中,由贝克领导的一个计算生物学家团队开发了RoseTTAFold软件工具。它使用深度学习在有限的信息基础上快速准确地预测蛋白质结构。没有这类软件的帮助,仅仅确定一种蛋白质的结构就需要数年的实验室工作。
另一方面,RoseTTAFold在一台游戏电脑上只需10分钟就能可靠地计算出蛋白质结构。
该团队使用RoseTTAFold计算了数百种新的蛋白质结构,包括许多人类基因组中鲜为人知的蛋白质。它们还产生了与人类健康直接相关的结构,包括与问题脂质代谢、炎症失调和癌细胞生长相关的蛋白质。他们表明,RoseTTAFold可以用以前所需时间的一小部分来构建复杂的生物组件模型。
RoseTTAFold是一个“三轨道”神经网络,意味着它同时考虑蛋白质序列的模式,蛋白质的氨基酸如何相互作用,以及蛋白质可能的三维结构。在这种结构中,一、二、三维信息来回流动,从而使网络能够共同推断蛋白质的化学成分与其折叠结构之间的关系。
在华盛顿大学医学院贝克实验室领导该项目的博士后学者白敏京(Minkyung Baek)表示:“我们希望这个新工具将继续造福整个研究团体。”
这些结果已经发表在该杂志上科学.
来源:华盛顿大学医学院