这样的系统可以成为医院急诊科评估潜在威胁生命的中风患者症状的一个不可或缺的工具,允许快速应用正确的治疗。
尽管不断增强的计算能力和大数据集的可用性改善了机器学习,但仍有一些重要的障碍阻碍着这些系统被整合到临床决策中。这些问题包括对大型且有良好注释的数据集的需求——先前开发的成像分析系统能够复制医生的表现,并接受了超过10万张图像的训练——以及“黑匣子”问题,即系统无法解释它们是如何做出决定的。美国食品和药物管理局要求任何决策支持系统提供数据,允许用户审查其发现背后的原因。
哈佛大学工程与应用科学学院(Harvard School of Engineering and Applied Sciences)研究生、该研究的两名主要作者之一李玄光(Hyunkwang Lee)表示:“用‘小数据’或‘可解释的’来描述一项使用深度学习的研究,多少有些矛盾。”“然而,在医学领域,收集高质量的大数据尤其困难。让多个专家对一个数据集进行标签,以确保数据的一致性,这是至关重要的。这个过程非常昂贵和耗时。”
MGH放射学的Sehyo Yune博士补充说:“一些批评人士认为,机器学习算法不能用于临床实践,因为算法不能为他们的决定提供理由。我们意识到,必须克服这两个挑战,以促进机器学习在医疗保健领域的应用,这在提高医疗保健质量和获取机会方面具有巨大潜力。”
训练他们的系统,MGH团队始于904头CT扫描,每个大约40个人组成的图片,是由一组五MGH神经放射标记是否描述五出血亚型之一,基于大脑内的位置,或没有出血。为了提高这个深度学习系统的准确性,由资深作者Synho Do博士领导的团队模仿放射科医生分析图像的方式一步步构建。Synho Do博士是MGH放射医学成像和计算实验室的主任,也是哈佛医学院的放射学助理教授。这包括调整因素,如对比度和亮度,以揭示不立即明显的细微差异,滚动相邻CT扫描切片,以确定出现在单个图像上的东西是真实的问题,还是无意义的伪影。
一旦创建模型系统,研究人员测试了它在两个不同的CT扫描一个回顾之前设置了系统开发,包括扫描与100和100没有颅内出血,和一组潜在的79扫描和117没有出血,之后创建的模型。在回顾性分析中,该模型系统在检测和分类颅内出血方面与回顾扫描结果的放射科医生一样准确。在对未来集合的分析中,它甚至被证明比非专业的人类读者更好。
为了解决“黑盒”问题,研究小组对系统进行了回顾,并保存了训练数据集中的图像,这些图像最清晰地代表了五种出血亚型的经典特征。利用这个特征图谱,该系统能够显示一组与正在分析的CT扫描相似的图像,以解释其决定的基础。
“快速识别颅内出血,导致对急性中风症状患者的及时适当治疗,可以预防或减轻重大残疾或死亡,”合著者Michael Lev医学博士说,他是MGH放射学的。“许多设施没有经过专门训练的神经放射专家,特别是在夜间或周末,这可能需要非专业的提供者来确定出血是否是病人症状的原因。可靠的‘虚拟的第二意见’——由神经放射学家培训——可以使这些提供者更有效率、更有信心,并帮助确保患者得到正确的治疗。”
该系统的合著者、MGH放射学医学博士Shahein Tajmir补充说:“除了提供非常需要的虚拟第二意见外,该系统还可以直接部署到扫描仪上,在患者离开扫描仪之前就提醒护理团队出现出血,并触发适当的进一步测试。下一步是将该系统部署到临床领域,并在更多的案例中进一步验证其性能。我们目前正在建立一个平台,以便在整个部门广泛应用这些工具。一旦我们在临床环境中运行,我们就可以评估它对周转时间、临床准确性和诊断时间的影响。”
来源:马萨诸塞州综合医院