30.07.2021•

深度学习帮助在3D中可视化x射线数据

Argonne国家实验室的科学家们已经利用人工智能来训练计算机，以跟上先进光子源所获取的大量x射线数据。

计算机能够快速处理二维图像已经有一段时间了。你的手机可以抓拍数码照片，并以多种方式处理它们。然而，更困难的是处理三维图像，并及时处理。数学运算更加复杂，即使是在超级计算机上，计算这些数字也需要时间。

这正是美国能源部(DOE)阿贡国家实验室的一组科学家正在努力克服的挑战。人工智能已经成为解决大数据处理问题的万能解决方案。对于使用先进光子源(APS)的科学家来说，APS是美国能源部位于阿贡的科学用户设施办公室，它可能是将x射线数据以更快速度转化为可见、可理解形状的关键。这个领域的突破可能会对天文学和电子学产生影响显微镜以及其他依赖大量3D数据的科学领域。

该研究团队包括来自阿贡三个部门的科学家，他们开发了一种新的计算框架，称为3D- cdi - nn，并表明它可以从APS收集的数据中创建3D可视化，其速度比传统方法快数百倍。

CDI代表的是相干衍射成像，这是一种x射线技术，涉及到反弹超亮x射线样品光束。探测器将收集这些光束作为数据，并将这些数据转化为图像需要一些计算工作。阿贡x射线科学部(XSD)计算x射线科学小组的负责人Mathew Cherukara解释说，部分挑战在于探测器只能从光束中捕获部分信息。

但是，缺失的数据中包含着重要的信息，科学家们依靠计算机来填补这些信息。正如Cherukara所指出的，虽然在2D图像中这需要一些时间，但在3D图像中则需要更长的时间。因此，解决方案是训练人工智能直接从原始数据中识别物体及其微观变化，而不需要填充缺失的信息。

为了做到这一点，研究小组从模拟x光数据开始训练神经网络．该框架标题中的NN，神经网络是一系列算法，可以教计算机根据接收到的数据预测结果。论文的第一作者、纳米尺度材料中心(CNM)的博士后研究员亨利·陈(Henry Chan)领导了这部分工作。CNM是美国能源部在阿贡的科学用户设施办公室。

“我们使用计算机模拟来创建不同形状和大小的晶体，并将它们转换成图像和衍射模式，供神经网络学习，”Chan说。“快速生成许多现实水晶训练的好处是模拟．”

这项工作是利用Argonne的系统评估联合实验室的图形处理单元资源完成的，该实验室部署了前沿的测试平台，以实现对新兴高性能计算平台和能力的研究。

物理学家、阿尔贡材料科学分部组长Stephan Hruszkewycz说，一旦这个网络得到训练，它就可以非常快地接近正确答案。然而，仍然有改进的空间，所以3D-CDI-NN框架包括一个过程，以获得网络的其余方式。Hruszkewycz与西北大学研究生Saugat Kandel一起从事该项目的这方面工作，这减少了耗时的迭代步骤的需要。

Hruszkewycz说:“材料科学部门关注相干衍射，因为你可以看到几纳米长度尺度的材料——大约比人类头发的宽度小10万倍——x射线可以穿透环境。”“这篇论文是这些先进方法的一个演示，它极大地方便了成像过程。我们想知道一种物质是什么，以及它如何随时间变化，这将有助于我们在进行测量时更好地绘制它的图像。”

作为最后一步，3D- cdi - nn填充缺失信息并生成3D可视化的能力在APS的34-ID-C束收集的黄金微粒的真实x射线数据上进行了测试。其结果是，在模拟数据上的计算速度快了数百倍，在真实APS数据上的计算速度几乎与此相同。测试还表明，该网络可以用比通常所需的更少的数据重建图像，以补偿探测器未捕获的信息。

根据Chan的说法，这项研究的下一步是将网络整合到APS的工作流程中，这样它就可以在获取数据时进行学习。他说，如果网络从波束的数据中学习，它将不断改进。

对这个团队来说，这项研究也有时间因素。Cherukara指出，APS正在进行大规模升级，一旦项目完成，现在生成的数据量将呈指数增长。升级后的APS将产生亮度高达500倍的x射线束，而且光束的相干性将大大提高——光束的特性使其衍射，从而编码更多关于样本的信息。

这意味着，虽然现在从样本中收集相干衍射成像数据并获得图像需要2到3分钟，但该过程的数据收集部分很快将快500倍。将数据转换成可用图像的过程也需要比现在快几百倍才能跟上。

Cherukara表示:“为了充分利用升级后的APS的能力，我们必须重新设计数据分析。”“我们目前的方法不足以跟上潮流。机器学习能够充分利用并超越目前的可能性。”

该团队的研究发表在《纽约时报》上应用物理评论