使用 GPU 发现人脑连接，大规模 GPU 实现了 100 倍的加速-轻识

来源：ScienceAI
本文约3500字，建议阅读5分钟
研究人员克服了 LiFE 算法的关键限制，以生成更稀疏和更准确的连接组。

扩散磁共振成像和纤维束成像能够估测人脑中的解剖连接。然而，如果没有 ground-truth 验证，不同的纤维束成像算法可能会产生差异很大的连通性估计。尽管流线型修剪技术缓解了这一挑战，但缓慢的计算时间妨碍了它们在大数据应用程序中的使用。

印度科学研究所神经科学中心的研究人员提出了「Regularized, Accelerated, Linear Fascicle Evaluation」(ReAl-LiFE)，这是一种基于 GPU 的最先进流线修剪算法（LiFE）的实现，与以前基于 CPU 的实现相比，它实现了 100 倍以上的加速。利用这些加速，研究人员克服了 LiFE 算法的关键限制，以生成更稀疏和更准确的连接组。

该研究以「GPU-accelerated connectome discovery at scale」为题，于 2022 年 5 月 30 日发布在《Nature Computational Science》。

大脑区域之间完整的解剖连接对认知至关重要。体内解剖连接的准确估计不仅对于揭示人类行为的神经基础至关重要，而且对于了解神经系统疾病的遗传基础也至关重要。

扩散磁共振成像（dMRI），然后是纤维束成像，能够在体内估测人脑中的解剖连接。dMRI 测量水分子在大脑白质中的扩散，纤维束成像算法基于受限扩散估测轴突结构。然而，dMRI 和纤维束成像算法容易遇到诸如采集噪声和冗余纤维几何形状等挑战。

最近的一项研究汇集了 20 个团队的努力，这些团队从模拟的 dMRI 扫描中估测了全脑连接组，而这反过来又是由模拟的「真实」纤维束生成的。不同团队的不同成功率，反映了这一挑战的重要性。由于大脑中的实际 ground-truth 连接，通常在体内是不可用的，因此对人脑中的纤维束成像的直接验证仍然难以捉摸。

流线型修剪和评估算法代表了应对这些挑战的最先进的后处理方法。线性分束评估（LiFE）是一种最新的最先进的模型，它根据对基础扩散信号的拟合质量来修剪杂散纤维。然而，LiFE 的算法是在中央处理单元（CPU）上实现的，并且存在速度和内存瓶颈，这妨碍了它在大规模连接组评估中的应用。

印度科学研究所神经科学中心的研究人员，提出了对 LiFE 的改进——Regularized、Accelerated、Linear Fascicle Evaluation 或 ReAl-LiFE——用于大规模快速和准确的连接组评估。他们通过在其目标函数中引入显式正则化（稀疏性）惩罚来改进 LiFE 算法，并提出了一种可扩展图形处理单元（GPU）实现，该实现比通常 CPU 实现加速了 100× 的数量级，同时还估计了更稀疏和更一致的连接体。

之后，研究人员展示了 ReAl-LiFE 在估计具有高重测可靠性的流线方面的表现与其他最先进的方法（例如，SIFT2 和 COMMIT2）相当，甚至优于其他方法。

同时，该团队应用 ReAl-LiFE 来识别来自人类连接组项目 (HCP) 数据库的 200 名参与者的行为的结构连接相关性。研究人员建议将 ReAl-LiFE 作为一种有效的工具，超越最先进的技术，用于快速、准确地大规模发现连接组。

在早期的研究中，该团队介绍了 ReAl-LiFE 算法的初步版本；这个实现比 LiFE 的 CPU 实现加速了 50-100 倍。新的研究中，研究人员进一步优化算法以实现更大的加速（>100×，最高达 155×）。该团队用三个不同的扩散 MRI 数据集证明了这些加速。

图示：使用 ReAl-LiFE 算法进行快速可靠的连接组评估。（来源：论文）

首先，他们使用来自 HCP 数据库的最先进的扩散 MRI 数据集测试了加速。研究人员生成了七种不同大小的连接组，从 50,000 到 200 万根纤维。然后使用 CPU 实现以及 LiFE 的 GPU 实现来修剪这些连接组中的流线。GPU 实现产生了显著的加速，从具有 50,000 根光纤的连接组的 62 倍到具有 150 万根光纤的连接组的 129×。

研究人员还在另外两个独立获取的数据集上评估了这些加速：内部获取的 dMRI 数据集和原始 LiFE 研究中使用的数据集。同样，具有 150 万根光纤的连接组的最大加速为 124× 和 155×。

研究人员还测试了加速如何随着体素数量 (Nv) 和扩散方向数量 (Nθ) 的增加而变化。总体而言，加速比随着扩散方向的数量增长最快，其次是体素的数量。另外，将 ReAl-LiFE 的收敛时间与其他两种修剪算法 SIFT 和 COMMIT2 进行了比较。ReAl-LiFE 的性能与 SIFT 和 COMMIT2 相当，但是在更大的连接组尺寸下，该团队的方法更具优势。

结合稀疏诱导先验使 ReAl-LiFE 能够生成更稀疏和更准确的连接组。然而，先前的研究表明，这种导致稀疏的先验可能会增加假阴性的机会，特别是当连接组中出现重复纤维时。研究人员通过构建完全由几乎相同的重复流线组成的人工连接组来解决这一挑战，并表明使用 ReAl-LiFE 进行修剪在很大程度上改善了这一挑战。此外，与 LiFE 相比，ReAl-LiFE 减少了过度拟合并产生了更一致的连接组。

接下来，研究人员量化了 ReAl-LiFE 算法的可靠性，并将其与 LiFE、SIFT2 和 COMMIT2 的可靠性进行了比较。使用从 HCP 数据库中抽取的 n = 5 参与者的样本，进行了重测可靠性分析。对于每个参与者，计算成对的半球内连通性，其总变异性被划分为参与者之间和参与者内部的成分。

在使用 LiFE 进行修剪后，参与者内部和参与者之间的变异性具有可比性，但是，在 ReAl-LiFE 修剪之后，参与者内部的变异性显著低于参与者之间的变异性。因此，ReAl-LiFE 修剪增加了估计连接权重的重测可靠性。此外，ReAl-LiFE 修剪后的参与者间变异性显著低于 LiFE 修剪后的差异（P < 0.001）。

研究人员进一步用信度指数量化了重测信度。更高的可靠性指数是有效修剪的标志。与 LiFE 相比，使用 ReAl-LiFE 进行修剪产生了显著更高的可靠性指数。使用 SIFT2 修剪产生的可靠性指数与 ReAl-LiFE 相当，而使用 COMMIT2 修剪产生的可靠性指数略低于 ReAl-LiFE。

接下来，研究人员根据图的每个象限中的连接比例来量化可靠性的提高：与 IV 象限相比，II 象限中的比例越大，表明剪枝效率越高。与未修剪的连接组相比，使用 LiFE 进行流线式修剪在高可靠性 (6.8%) 中产生的连接比在低可靠性象限 (11.1%) 中产生的连接更少，尽管与偶然性没有区别。

另一方面，与低可靠性象限相比，使用 ReAl-LiFE 进行修剪在高可靠性（13.2%）中产生了更多的连接。使用 SIFT2 和 COMMIT2 进行修剪在高可靠性和低可靠性象限中产生了相当比例的连接。

最后，该团队确定了在 ReAl-LiFE 修剪后表现出极值重测可靠性的连接。额叶和顶叶之间的远程连接具有最高的重测信度，这些连接与已建立的白质束强烈重叠，包括上、下纵束 (SLF/ILF)、弓状束 (AF) 和额枕下束（IFOF）。相反，对于短程连接，重测信度最低，尤其是那些连接颞中回与相邻颞枕区域的连接。

作为 ReAl-LiFE 的实际应用，该团队询问使用 ReAl-LiFE 进行流线式修剪是否能够识别行为的结构连接相关性。为此，他们预测了 200 名参与者的 60 个行为测试分数，涵盖认知、情感和人格三个类别。行为评分预测是通过使用递归特征消除 (RFE) 的支持向量回归 (SVR) 模型进行的。具体来说，他们使用 ReAl-LiFE 连接权重作为特征做出的预测，与基于未修剪连接组中纤维数量的预测进行了比较。

图示：使用 ReAl-LiFE 连接权重预测关键认知分数。（来源：论文）

在一系列显著性阈值中，基于纤维数量和 ReAl-LiFE 权重的连接组特征显著预测的行为分数数量没有差异。然而，基于 ReAl-LiFE 权重的预测比基于纤维数量的预测更准确，更高的平均相关性证明了这一点。当分别预测每个类别的分数（认知、情感和个性）时，观察到了类似的趋势。

总之，对于认知和人格得分，在整个显著性阈值范围内，真实生活权重产生的预测准确度（平均 r 值）始终高于纤维数量。

接下来，询问了哪一组连接组特征——ReAl-LiFE 权重或未修剪的连接组纤维——更可靠地预测了行为得分。为此，研究人员结合了两组特征，并量化了 RFE 算法选择的 ReAl-LiFE 特征的比例，以对每个行为得分进行最佳预测。对于超过 95% (58/60) 的分数预测，与未修剪连接组的特征相比，RFE 倾向于更高比例的 ReAl-LiFE 特征。

研究人员还分析了这些预测背后的解剖特征，重点关注「认知」分数。简而言之，阅读能力与左侧额叶皮层的连通性显著相关，而图片词汇得分与右侧顶叶皮层的连通性显著相关。

研究结果表明，除了产生更准确的连接组外，ReAl-LiFE 连接权重还可以对一系列行为分数进行更准确的预测，所有这些都是在扫描仪环境之外获得的。在连接组评估后量化的基于 dMRI 的结构连接可能为关键认知特征提供可靠的基于神经成像的生物标志物。

ReAl-LiFE 算法可以在几个关键方面进行开发和改进，以克服其当前的局限性。

首先，当前版本的 ReAl-LiFE 算法没有利用跨多个 GPU 的并行计算。此外，ReAl-LiFE 目前还没有与多 CPU 加速方案集成，尽管他们的加速超过了（~8.7 倍）为这些方法报告的最新数字。将这些基于 CPU 的方案与他们的 GPU 实现相结合，或在多个 GPU 上实现并行计算，可能会进一步提高算法的速度。

其次，ReAl-LiFE 的优化目标，包括稀疏诱导先验，可能会进一步提高。使用 ReAl-LiFE 进行正则化修剪的一个关键特性是能够使用基于 L1 范数的正则化生成各种所需稀疏度的连接组，这是原始 LiFE 算法中不具备的特性。

然而，如此严格的正则化增加了假阴性（遗漏纤维）的机会。虽然测试了这种可能性，但需要系统地评估其他类型的正则化（例如，基于 L2 范数），以识别那些最小化连接组中的假阴性的正则化。尽管如此，加入这种惩罚后，ReAl-LiFE 在减少过度拟合、产生更一致的连接组和提高重测可靠性方面优于 LiFE。尽管仅在有限数量的参与者（n = 5）中进行了重测信度分析，但具有最高重测信度的 ReAl-LiFE 连接映射到已建立的白质束。在目标函数中加入额外的特征和约束——例如，基于大脑解剖学，与 COMMIT2 一样——可能会在未来改进 ReAl-LiFE 算法。

第三，对 ReAl-LiFE 与其他最先进的算法（SIFT/SIFT2 和 COMMIT2）之间存在差异的原因进行原则性评估仍有待进行。ReAl-LiFE 修剪时间在很大程度上与其他方法相当，但对于较大的连接组尺寸表现出边际优势。

此外，ReAl-LiFE 与其他方法的不同之处在于修剪后保留的高可靠性连接的比例。这些差异的原因需要仔细调查。最后，需要将 ReAl-LiFE 与这些竞争方法直接进行比较，就它们各自的成功率而言，将结构连接性映射到行为。这种原则性比较对于识别高阶认知功能（例如注意力、学习和决策）的稳健结构连接基础至关重要。

更一般地说，作为 ReAl-LiFE 核心的 Subspace Barzilai-Borwein 非负最小二乘（SBB-NNLS）算法广泛适用于许多实际应用中的优化问题，包括医疗保健。研究人员认为，他们对 SBB-NNLS 算法的 GPU 加速实现，具有在连接组修剪之外的不同领域广泛应用的潜力。

论文链接：https://www.nature.com/articles/s43588-022-00250-z

相关报道：https://neurosciencenews.com/ai-gpu-brain-network-20955/

编辑：黄继彦

校对：林亦霖