研究人员分析了1790个家庭的基因组,其中一个孩子患有自闭症谱系障碍,而其他成员没有。该方法从12万个突变中挑选出影响自闭症患者基因行为的突变。尽管研究结果并没有揭示自闭症病例的确切原因,但它们揭示了数千个可能的原因,供研究人员进行研究。
以前的很多研究都集中在识别基因本身的突变上。基因本质上是制造许多蛋白质的指令,这些蛋白质构成并控制身体。基因突变导致蛋白质突变,其功能被破坏。然而,其他类型的突变破坏了基因的调节方式。这些区域的突变影响的不是基因产生什么,而是它们产生的时间和数量。
研究人员说,到目前为止,还不可能在整个基因组中寻找调节基因的DNA片段,并预测这种调节DNA的突变如何可能导致复杂的疾病。这项研究首次证明,调控DNA的突变可以导致一种复杂的疾病。
该研究的资深作者、计算机科学和基因组学教授奥尔加·特罗扬斯卡亚(Olga Troyanskaya)说:“这种方法为分析任何疾病提供了一个框架。”这种方法可能对神经系统疾病、癌症、心脏病和其他许多无法确定遗传原因的疾病特别有帮助。
“这改变了我们思考这些疾病可能原因的方式,”Troyanskaya说,她也是纽约西蒙斯基金会Flatiron研究所基因组学副主任,在那里她领导了一组共同作者。
该团队还包括由洛克菲勒大学的神经透明度罗伯特·达尔纳领导的集团。The first authors of the paper are Jian Zhou and Christopher Park, who earned Ph.D.s at Princeton and are now visiting collaborators at the Lewis-Sigler Institute for Integrative Genomics and researchers at the Flatiron Institute, and Chandra Theesfeld at Princeton’s Lewis-Sigler Institute for Integrative Genomics.
此前,大多数关于疾病遗传基础的研究都集中在2万个已知基因以及控制这些基因的DNA周围部分。然而,即使是如此庞大的基因信息也只占人类基因组32亿化学配对的1%多一点。另外的99%通常被认为是“黑暗”或“垃圾”,尽管最近的研究已经开始颠覆这一观点。
在新发现中,研究团队提供了一种方法来了解这种大量基因组数据。该系统使用称为深度学习的人工智能技术,其中算法执行连续分析,以了解否则无法辨别的模式。在这种情况下,该算法教导本身如何识别DNA的生物相关部分并预测这些片段是否在任何已知影响基因调节的2,000个蛋白质相互作用中发挥作用。该系统还预测了破坏单对DNA单元对这些蛋白质相互作用具有显着影响。
Troyanskaya表示,在其周围的1,000个化学对的背景下,算法“沿着基因组沿着基因组的载玻片”分析了每一个化学对。因此,该系统可以预测突变整个基因组中的每种化学单位的效果。最后,它揭示了可能调节可能干扰该调节的基因和突变的DNA序列的优先级列表。
在这一计算成就之前,收集这些信息的传统方法是对每个序列和该序列中每个可能的突变进行艰苦的实验室实验。这种可能的功能和突变的数量太大了,无法考虑——一种实验性的方法将需要针对2000多种蛋白质相互作用测试每个突变,并在组织和细胞类型中反复进行这些实验,总计达数亿次实验。其他研究小组试图通过将机器学习应用于DNA的目标部分来加速这一发现,但还没有实现查看每个DNA单元、每个可能的突变以及整个基因组中2000多种调节相互作用对每一种的影响的能力。
“我们的论文真的允许你做的是占据所有这些可能性并对他们进行排名,”公园说。“那个优先级本身非常有用,因为现在您也可以继续进行实验,只需最高的优先案例。”
最后,该系统基于已知的疾病引发突变校准其预测,并产生“疾病影响评分”,对给定突变有多可能对疾病产生影响的评估。
在自闭症的案例中,研究人员分析了1790个患有“单纯性”自闭症谱系障碍的家庭的基因组,这意味着这种情况在一个孩子身上很明显,而在这个家庭的其他成员身上却不明显。(这些数据来自Simons Simplex Collection收集的2000多个自闭症家庭。)在这个样本中,只有不到30%的孤独症谱系障碍患者有先前确定的遗传病因。研究人员说,新发现的突变可能会显著增加这一比例。
预测每个突变的功能影响的能力是这项新研究的关键创新。之前的研究发现,要发现自闭症患者与正常人在调节突变数量上的任何差异都是很有挑战性的。然而,这种新方法观察了预计会产生高功能影响的突变,并发现受影响人群中此类突变的数量要高得多。
当研究人员观察哪些基因会受到这些突变的影响时,发现它们是与大脑功能密切相关的基因。这些新发现的突变和以前发现的突变一样,会影响相似的基因和功能。“现在我们打开了这个领域,去了解所有可能与自闭症有关的因素,”Theesfeld说。
这些信息对家庭及其医生来说也很重要,以更好地诊断这种疾病,并避免避免过度普遍的假设一个人的自闭症如何与他人分类。“他们说,当你遇到一个患有自闭症的人时,你已经遇到了一个有自闭症的人,因为没有案件是相似的,”菲尔德说。“基因上,似乎是相同的。”
来源:普林斯顿大学