这种新的数据发现工具将允许研究人员快速和容易地分类致命的病毒,如新型冠状病毒肺炎这一过程和速度对大流行期间的战略规划和调动医疗需求具有高度重要性。该研究还支持了一种科学假设,即COVID-19 (SARS-CoV-2)起源于蝙蝠的萨尔贝病毒,这是贝塔冠状病毒的一个亚组。
“超快、可扩展和高度精确”的分类系统使用了一种新的基于图形的专业软件和决策树方法来说明分类,并从所有可能的结果中得出最佳选择。整个方法使用一种新的基于图形的专门软件来说明所有测试可能结果中的最佳选择。生物学教授凯瑟琳·希尔(Kathleen Hill)与计算机科学、统计和精算科学领域的西方合作者以及滑铁卢大学计算机科学系的其他同事共同领导了这项研究。
的机器学习该方法实现了对COVID-19序列的100%准确分类,更重要的是,在几分钟内再次发现5000多个病毒基因组之间最相关的关系。“我们所需要的就是COVID-19 DNA序列,以发现其自身的内在序列模式。我们使用了这种签名模式和一种逻辑方法来匹配这种模式,使其尽可能接近于其他病毒,并在几分钟内实现了精细的分类级别——不是几天,也不是几个小时,而是几分钟,”Hill说。
该分类工具已被用于分析5000多个独特的病毒基因组序列,包括1月27日获得的29个COVID-19序列。希尔认为,该工具能够对任何新发现的COVID-19或其他病毒序列进行分类,将成为疫苗和药物开发人员、一线卫生保健工作者、研究人员和科学家在这场全球大流行期间及以后的工具包中的一个重要组成部分。
来源:西方的大学