学术动态
您当前的位置: > 动态研究  > 学术动态

从图结构数据中提取特征的最大互信息:在阿尔茨海默病分类中的应用

  • 期号:2023-08 总116期

Jiawei Yang1 · Shaoping Wang1,2 · Teresa Wu3

1. School of Automation Science and Electrical EngineeringBeihang UniversityBeijing 100191China

2. Beijing Advanced Innovation Center for Big Data-Based Precision MedicineBeihang UniversityBeijing 100191China

3. School of ComputingInformaticsand Decision Systems EngineeringArizona State University and ASU-Mayo Center for Innovative ImagingTempe AZ 85287USA

 

阿尔茨海默病(Alzheimer’s diseaseAD)是最常见的神经退行性痴呆类型,也是一个日益严重的健康问题,已经成为美国第六大死因。迫切需要尽早发现患者大脑的异常变化,及时实施治疗,减缓病情进展。目前世界已经进行了广泛的研究来开发具有可靠生物标志物的诊断技术,例如磁共振成像(Magnetic Resonance ImagingMRI),这是一种对大脑结构、功能和连接性的无创检查。可以通过MRI定量分析AD引起的大脑生理变化,以检测和监测疾病的进展。

人脑是一个极其复杂的结构,由神经元和连接组成。因此,研究人员从大脑网络的角度研究大脑功能,其中节点代表大脑区域,边缘连接各区域。图分析通常用于检测大脑区域之间的连接模式以诊断AD。两种数据类型在图中表示大脑网络:图信号和图权重。图信号指的是每个节点的属性,通常是大脑感兴趣区域(Region Of InterestROI)。节点的属性可以是使用分割技术检测到的大脑结构的定量测量(例如体积、厚度、面积)或融合特征。图权重描述了每对节点之间的连接性。

使用图模型来描述大脑网络是一种简单的方法。然而,以有意义的方式从图中提取特征以进行AD诊断具有挑战性。研究人员们使用了一些常见的图特征,包括节点度、聚类系数和小世界。例如,Wee等人计算聚类系数(大脑网络中用于测量大脑区域之间连接性的常用指标)作为支持向量机的特征,以区分轻度认知障碍个体和认知正常个体。尽管这种方法取得了成功,但研究主要集中在推导特征上,而没有考虑数据的随机性。这种方法可能存在问题,因为由于患者的异质性和变异性,数据普遍存在随机性。

其他研究使用数据驱动的方法进行特征提取,不需要先验的大脑网络拓扑。主成分分析(Principal Component AnalysisPCA)是一种常用的降维技术;它将数据转换为维度较少的主成分。Salvatore等人使用PCA来减少白质和灰质密度图的维度。结果被输入支持向量机,用于对可能或不太可能患AD的患者进行分类。数据驱动的方法具有计算效率高、解决维数灾难以及较少依赖领域知识等优点。然而,我们认为忽略固有的拓扑特性可能会出现问题,因为提取的特征可能难以解释。在这里,我们认为,关于大脑ROI之间连接性的研究应该侧重于改进临床解释和使用领域知识(例如,大脑图谱)。

AD诊断的挑战是有效地降低特征维度,同时保留特征的可解释性。特征的高可解释性将促进机器学习方法在临床诊断中的应用。然而,脑网络分析的最新研究并没有充分解决这个问题。

本文提出了一种基于最大互信息的图结构数据特征提取方法(Graph-Structured Data based on Maximum Mutual InformationMMI-GSD)。所提出的MMI-GSD可以有效地降低图结构数据的维数,同时保留提取特征的可解释性。本文为神经影像数据开发了高斯图形模型(Gaussian Graphical ModelGGM)。利用注意力尺度(Scale Of AttentionSOA)概念,描述网络中特定节点的连接权重范围;利用信息熵来量化变量的不确定性;利用互信息作为决策准则来降低相对于来自其他变量的知识的不确定性程度。具体而言,构建了一个互信息优化问题,以选择不同SOA的显著特征。由于这些特征源自领域知识定义的ROI,因此它们提供了有意义的临床解释,推进发现新的生物标志物的进程。本文使用合成数据集和真实AD数据集来验证所提出的方法,结果优于传统的网络指标和现有的特征提取方法。

 

 

资料来源:

根据Jiawei Yang等于2023年发表在Applied Intelligence刊题目为《Maximum mutual information for feature extraction from graph-structured data: Application to Alzheimer's disease classification》的文章缩写整理而成。

(本文责任编辑:陈劭)

 


Copyright © 2021 RESEARCH INSTITUTE OF SMART SENIOR CARE. All rights reserved

京ICP备18021587号-6