Rong Zhou1,Houliang Zhou1,Brian Y. Chen1,Li Shen2,Yu Zhang3,Lifang He1
(1. Department of Computer Science and Engineering,Lehigh University,Bethlehem,PA,USA,
2. Department of Biostatistics,Epidemiology and Informatics,University of Pennsylvania,Philadelphia,PA,USA,
3. Department of Bioengineering,Lehigh University,Bethlehem,PA,USA)
阿尔茨海默病(Alzheimer’s Disease,AD)是一种不可逆的神经退行性疾病,影响着全世界数百万人。近年来,脑成像遗传学已成为阿尔茨海默病及其前驱期轻度认知障碍(Mild Cognitive Impairment,MCI)诊断和预测的一个有前景的领域。这种方法主要集中于使用神经成像技术,来识别与特定遗传变异(如单核苷酸多态性(Single Nucleotide Polymorphisms,SNPs))相关的大脑区域。这些分析已经产生了大量的研究发现,这些研究发现表明了AD的成像特征与遗传学之间的显著关联,并且具有识别影响特定大脑系统的新的多模态生物标志物的巨大潜力,并为药物发现提供了巨大的动力。
目前已经提出了各种脑成像遗传学分析方法。例如典型相关分析(Canonical Correlation Analysis,CCA)是一种强大的多元统计技术,用于量化不同数据集之间的关联。CCA及其扩展变体由于其在生物学解释方面的优势,在成像遗传学研究中得到了广泛的应用。例如,Du等人提出了一种联合多任务稀疏典型相关分析和分类(Multitask Sparse Canonical Correlation Analysis And Classification,MTSCCALR)来识别AD的成像遗传生物标志物。Kim等人介绍了一种基于多任务学习的结构化稀疏典型相关分析(Multi-Task Learning-Based Structured Sparse Canonical Correlation Analysis,MTS2CCA),用于识别与睡眠相关的脑成像遗传学。Moon等人提出了一种监督深度广义典型相关分析(Supervised Deep Generalized Canonical Correlation Analysis,SDGCCA),用于改善阿尔茨海默病的表型分类和揭示与表型相关的生物标志物。尽管在这一领域取得了很大进展,基于CCA的传统浅层模型假设基因和脑成像数据之间的关系是线性的。然而,情况并非总是如此,脑成像遗传学数据中可能存在非线性关系,导致结果有偏差。另一方面,现有的基于CCA的深度模型并不能直接解释观察到的基因和成像数据之间关联的潜在生物学机制。他们中的大多数探索事后解释作为模型预测的理由。这可能会限制研究结果转化为临床应用。
本文提出了一种新的关注深度典型相关分析(Attentive Deep Canonical Correlation Analysis,ADCCA)模型,用于诊断AD疾病并利用多模态脑成像遗传学数据发现生物标志物。所提出的框架包括三个关键组成部分:(i)深度神经网络建模,用于生成每个模态的潜在表示,以捕获模态内相关性;(ii)注意更新机制,集中注意输入数据的最突出区域;(iii)非线性监督CCA模型,用于整合多种模式来区分表型组。通过结合这些技术的力量,ADCCA方法有效地模拟多模态成像遗传学数据之间的非线性关系,并提供同步预测和解释。使用分类和相关损失的组合对模型进行端到端训练。
通过使用三种成像方式和遗传SNPs数据对真实ADNI数据集进行广泛的实验,我们表明我们的模型在AD与健康控制对照组(Healthy Control,HC)、AD与MCI以及MCI与HC的分类方面取得了出色的表现。此外,该模型解释可以揭示与神经科学发现相一致的疾病特异性生物标志物。最后,我们证明了分类模型和相关模型的结合可以提高疾病预测的性能。
资料来源:
根据Rong Zhou等于2023年发表在Medical Image Computing and Computer Assisted Intervention题目为《Attentive Deep Canonical Correlation Analysis for Diagnosing Alzheimer’s Disease Using Multimodal Imaging Genetics》的文章缩写整理而成。
(本文责任编辑:陈劭)