医生越来越多地使用电子医疗记录的数据来评估病人的风险、预测结果、推荐和评估治疗方法。的应用机器学习然而,临床环境中的算法因缺乏可解释性而受到阻碍。模型通常充当黑匣子:您看到进入(数据)以及出现的内容(预测),但您无法看到之间发生的事情。因此,它可以很难解释为什么模特在说他们所说的话。
这破坏了医疗专业人员对机器学习算法的信任,并限制了它们在日常临床决策中的使用。当然,可解释性也是欧盟隐私法规(GDPR)的一个关键要求,因此改进它也有法律上的好处。
引起神经网络
为了解决这个问题,工业工程与创新科学系的博士生陈培培,与其他来自成都理工大学和杭州浙江大学的研究人员一起,测试了一种基于注意力的方法神经网络对中国心脏病患者的影响基于注意力的网络能够利用上下文信息关注数据中的关键细节。
这是人类采取的相同方法,以评估它们周围的世界。当人们看看达尔马提亚的照片时,他们立即专注于图像中心的四足黑斑的白色形状,并识别它是一只狗。为此,他们将从上下文中收集的Intuition和信息应用。关注的神经网络基本上是相同的。
由于他们对上下文的敏感性,这些神经网络不仅擅长制定预测,它们也允许您完全看看哪些功能负责什么结果。当然,这显着提高了您预测的可解释性。基于关注的网络传统上用于图像识别和语音识别,其中上下文是了解发生的内容。最近,它们也已应用于其他域名。
实验
陈培培和她的同事跟踪调查了中国一家医院的736名心力衰竭患者。根据患者的特点,他们试图预测和解释患者出院后12个月内的再次入院情况。研究人员观察了105个特征,包括年龄和性别、血压和心率、疾病(如糖尿病和肾脏问题)、住院时间和药物使用情况。
基于关注的模型预测了所有入伍的三分之二,略微改善了三个其他流行的预测模型。更重要的是,该模型能够指定风险因素对每位患者的入伍的机会贡献(见图),使预测对医生更有用。此外,该模型为所有患者样品提供了最重要的风险因素。这样做,研究人员确定了三种超声心动图测量,其未被另一个模型识别。
在医生实现基于注意力的模型之前,它需要在更大的数据集上进行验证。陈还希望通过将出院时获得的文本数据和每日病程记录纳入电子健康记录中来扩展这项研究。
这项工作已发表在医学信息学与决策.
来源:埃因霍温科技大学