在其正在进行的揭露内部运作的运动中SARS-CoV-2美国能源部(DOE)的阿贡国家实验室(Argonne National Laboratory)正在牵头对病毒进行配对人工智能(AI)和前沿模拟工作流程,以更好地理解生物观察和加速药物发现.
Argonne与学术和商业研究伙伴合作,在模拟和人工智能方法之间实现近乎实时的反馈,以了解SARS-CoV-2病毒基因组中的两种蛋白质,nsp10和nsp16,如何相互作用,以帮助病毒复制和逃避宿主的免疫系统。
该团队通过耦合两种不同的硬件平台实现了这一里程碑:Cerebras CS-1,一种处理器封装的硅片深度学习加速器;ThetaGPU是Theta超级计算机的一个支持人工智能和模拟的扩展,位于Argonne领导计算设施,能源部科学用户设施办公室。
为了实现这一能力,该团队开发了Stream AI MD,这是一种称为深度学习的AI方法的新应用,用于以流方式驱动自适应分子动力学(MD)模拟。来自模拟的数据从TAGPU传输到大脑CS-1平台,以同时分析两种蛋白质如何相互作用。
研究小组成员、阿贡计算生物学家Arvind Ramanathan表示:“这需要以前所未有的规模进行,因为数据生成和人工智能组件必须并行运行。”Ramanathan解释说:“我们的想法是,如果一台机器擅长进行MD模拟,而另一台机器擅长人工智能,那么为什么不将两者结合起来,生产一个更大的系统,提供更多的人工智能吞吐量。”
他们正在使用的一种人工智能技术叫做变分自动编码器,它学习从MD模拟中捕获最基本的信息。为了使研究人员更容易理解模拟中发生的动态,模拟数据集的大小减小了。
通过运行深度学习作为大脑CS-1的一种组分,他们可以识别在形成两种蛋白质的过程中可能形成的结合口袋和微小空间,这两种蛋白质可以作为小分子药物设计的靶点。
Ramanathan说,这些工作流程最终将使治疗SARS-CoV-2病毒和其他疾病的药物发现成为可能,当特定生物功能的物理过程得到表征时。虽然目前的研究并不专注于疫苗,但开发更复杂的模型可能会导致疫苗设计。
Ramanathan说:“这种在新兴硬件平台上支持流人工智能和MD技术的迭代工作流,将为推进我们对蛋白质功能的了解铺平道路。”“在SARS-CoV-2病毒的背景下,对nsp16-nsp10相互作用等分子过程的基本理解,对于我们想要设计能够阻止病毒传播的药物非常重要。”
资料来源:阿贡国家实验室