昼夜节律,例如睡眠-觉醒周期,是大多数生物体固有的,对地球上的生命至关重要。circadian这个词来源于拉丁语circa diem,意思是“大约一天”。
生物学上,昼夜节律钟在24小时的昼夜循环中适时地协调生理、生物化学和新陈代谢。这就是为什么失衡会影响我们的健康水平、健康或生存能力。例如,经历时差是一个时间生物学问题——我们的生物钟不同步,因为正常的外部信号,如光或温度发生了变化。
生物钟并不是人类独有的。在植物中,一个准确的时钟有助于调节开花,并对同步新陈代谢和生理与日出和日落至关重要。了解昼夜节律有助于改善植物生长和产量,更不用说揭示解决人类疾病的新途径了。
除了植物
对于这项最新的研究,研究人员申请了机器学习预测模式植物拟南芥中复杂的时间昼夜节律基因表达模式。利用新生成的数据集、发布的时间数据集和拟南芥基因组,科学家团队训练ML模型来预测昼夜节律基因调控和表达模式。
这项工作证明了人工智能和基于ml的方法的力量,能够实现更经济有效的分析,并更深入地了解昼夜节律钟的功能及其调节。这些方法重新定义了科学家如何使用公共数据,并生成可验证的假设,以理解植物和人类的基因表达控制。
该研究的第一作者、IBM欧洲研究院的劳拉-杰恩·加德纳博士说:“从本质上讲,我们的内在节奏是由生物钟驱动的,这是一种与太阳时间或太阳在天空中的位置同步的生化振荡器。在大多数生物中,包括动物、植物、真菌甚至蓝藻细菌,内部同步的昼夜时钟使生物体能够预测与昼夜循环相对应的每日环境变化,并相应地调整其生物学和行为。”
检测昼夜节律
厄勒姆研究所的小组负责人安东尼·霍尔教授说:“与生物钟有关的基因在24小时内通常会在开关状态下的节奏模式之间振荡。这种模式被称为昼夜节律。利用现有方法检测昼夜节律具有挑战性,因为它需要使用测序技术生成长、高分辨率、时间序列的转录组数据集,以测量全天的基因表达。这不仅昂贵,而且对实验室的科学家来说也很耗时。因此,迄今为止,我们对基因如何在生物钟中控制和调节的知识是有限的。”
基于人工智能和ML技术的发展最初应用于模型植物拟南芥,并逐步测试其他复杂或时间基因表达模式以及拟南芥生态型中的其他物种。此外,该团队已经将ML方法应用于小麦,表明所使用的方法允许对关键粮食作物进行精确分析。
拟南芥(Arabidopsis thaliana)是一种广泛应用于植物生物学和遗传学的科学模型生物。作为第一个基因组测序的植物,它已经被用来理解许多植物性状的分子生物学和遗传学,包括昼夜节律调节。
Hall教授解释说:“我们的ML模型使用迭代较少的转录组时间点对昼夜节律表达模式进行分类,与现有最先进的模型相比,这在准确性上有了提高。”“我们开发了一个ML模型,它生成一个代理基因集,从一天中的单个转录组取样时间点预测昼夜节律时间(相位)。有成千上万的公共转录组数据集,通过将预测时间与实验时间进行比较,我们可以识别改变时钟功能的特定基因或条件。从而增加我们对时钟机制和功能的理解。”
他补充说:“我们通过开发ML模型来重新定义该领域,以区分不使用转录组时间点信息的昼夜节律转录本,而是从公共基因组资源生成的DNA序列特征。因此,我们可以通过分析基因组DNA序列来预测基因的昼夜节律调节。”
研究人员的研究基于这样一种理论,即基因表达控制的一个主要机制,无论是昼夜节律还是其他机制,都是通过转录因子(和其他因子)与调节DNA序列结合。
转录因子是控制基因表达的重要分子,指导基因表达的时间、地点和程度。它们与特定的DNA序列结合,并控制DNA转录成mRNA。
可辩解的人工智能
加德纳博士补充道:“随着农业科学家和农民开始使用ML模型来理解他们种植和收获的植物的内在节律,我们的ML模型及其在作物上的应用可能会提高产量,因为昼夜节律对保持健康的生长和发育至关重要。”
“然而,我们开发的技术超出了植物的范围。我们现在正在研究不同的物种,以研究昼夜节律钟及其与人类疾病的关系,例如,昼夜节律钟失调与从抑郁症到癌症等一系列疾病有关。”
加德纳博士很清楚ML和人工智能在深入了解昼夜节律方面的价值:“我们使用了可解释的人工智能算法,这让我们的模型更具信息价值。”“我们想用我们的ML模型的解释来阐明内部是什么。黑盒,这样我们就能更好地理解它们做出的预测。我们使用局部模型解释转录特异性排序DNA序列特征,这为每个转录提供了一个潜在昼夜节律调节机制的详细概况。利用从排序DNA序列特征导出的局部解释,使我们能够区分转录表达的时间阶段,在这样做的同时,揭示昼夜节律类内隐藏的子类。例如,一份转录是否可能在上午、下午、晚上或晚上表现出高峰。”
这项研究发表在美国国家科学院院刊.
来源:厄勒姆学院