为了回答可以应用于广泛患者群体的医学问题,机器学习模型依赖于来自不同机构的庞大、多样的数据集。然而,由于法律、隐私和文化方面的挑战,卫生系统和医院往往拒绝分享患者数据。宾夕法尼亚大学佩雷尔曼医学院放射学、病理学和实验室医学讲师、资深作者Spyridon Bakas博士领导的一项研究表明,一种名为“联合学习”的新兴技术可以解决这一困境。
联合学习-首先实施的方法谷歌对于键盘的自动校正功能——在多个分散的设备或服务器上训练一种算法,这些设备或服务器保存着本地数据样本,而不需要交换它们。虽然这种方法有可能被用来回答许多不同的医学问题,但宾夕法尼亚大学医学院的研究人员已经证明,联合学习在大脑方面是成功的成像,通过分析核磁共振成像扫描脑部肿瘤患者,区分健康的脑组织和癌变的脑组织。
例如,一个在宾夕法尼亚大学医学院培训的模型可以分发到世界各地的医院。然后,医生可以通过输入他们自己的病人,在这个共享模型上进行训练大脑扫描.然后,他们的新模型将被转移到一个中央服务器。这些模型最终将被整合成一个共识模型,这个模型已经从每个医院获得了知识,因此在临床上是有用的。“计算模型看到的数据越多,它对问题的了解就越好,也就能更好地解决它设计来回答的问题,”Bakas说。“传统上,机器学习使用单一机构的数据,然后很明显,这些模型在其他机构的数据上表现不佳,也不能很好地概括。”
联邦学习模式需要经过美国食品和药物管理局的验证和批准,才能获得许可并作为医生的临床工具商业化。但如果该模型商业化,它将有助于放射科医生、放射肿瘤学家和神经外科医生做出有关病人护理的重要决定,Bakas说。据美国脑瘤协会(American brain tumor Association)称,今年将有近8万人被诊断出患有脑瘤。他说:“研究表明,当涉及到肿瘤边界时,不仅不同的医生有不同的意见,而且同一名医生在评估同一次扫描时,在一周的某一天和下一天看到的肿瘤边界定义可能会不同。”人工智能让医生能够更准确地了解肿瘤的终点,从而直接影响患者的治疗和预后。”
为了测试联邦学习的有效性,并将其与其他机器学习方法进行比较,Bakas与来自德克萨斯大学MD安德森癌症中心、华盛顿大学和匹兹堡大学希尔曼癌症中心的研究人员合作,英特尔公司也为该项目提供了隐私保护软件。
这项研究从一个模型开始,该模型预先接受了来自一个名为国际脑肿瘤分割(BraTS)挑战的开源知识库的多机构数据的训练。BraTS目前提供的数据集包括660名患者通过磁共振成像(MRI)捕获的2600多张大脑扫描图。接下来,10家医院参与了这项研究,用自己的患者数据训练人工智能模型。然后使用联合学习技术来聚合数据并创建共识模型。
研究人员将联合学习与单一机构培训的模式以及其他合作学习方法进行了比较。每一种方法的有效性是通过测试它们与手动注释的扫描神经学家.与使用不保护患者隐私的集中数据训练的模型相比,联合学习的表现几乎(99%)相同。研究结果还表明,通过数据私人、多机构合作增加对数据的获取,有助于模型的绩效。
推荐的文章
这项研究的发现为宾大医学、英特尔和30个合作机构之间更大的、雄心勃勃的合作铺平了道路。这项合作得到了美国国立卫生研究院(National Institutes of Health)国家癌症研究所(National Cancer Institute of The National Health)今年早些时候授予Bakas的120万美元资助。英特尔今年5月宣布,Bakas将领导该项目,在该项目中,来自9个国家的30家机构将使用联邦学习方法,训练一个关于脑瘤数据的共识人工智能模型。该项目的最终目标是创建一个开源工具,供任何医院的任何临床医生使用。宾夕法尼亚大学生物医学图像计算与分析中心(CBICA)的该工具的开发由高级软件开发人员Sarthak Pati MS领导。
该研究的合著者、匹兹堡大学医学院放射学副教授Rivka Colen医学博士说,这篇论文和更大的联合学习项目为人工智能在医疗保健领域的更多应用开辟了可能性。“我认为这是一个巨大的游戏规则改变者,”科伦说。“放射学之于放射学,就像基因组学之于病理学。人工智能将彻底改变这个领域,因为,现在,作为一名放射科医生,我们做的大部分工作都是描述性的。通过深度学习,我们能够提取隐藏在这一层数字化图像中的信息。”
这项研究发表在杂志上科学报告。
来源:宾夕法尼亚大学