Ruhul Amin Hazarika1,2,Debdatta Kandar1,Arnab Kumar Maji1
(1 .Department of Information Technology,North Eastern Hill University,Shillong 793022,Meghalaya,India,
2 .Department of Information Technology,Manipal Institute of Technology Bengaluru,Manipal Academy of Higher Education,Manipal 576104,India)
阿尔茨海默病(AD)是一种慢性神经退行性疾病,其特征是记忆力和认知能力明显下降。随着时间的推移,症状变得越来越严重,最终导致患者死亡。根据AD International的报告,2018年,全球约有5000万人患有AD相关的脑部疾病,预计到2050年,这一数字将增加三倍。老年痴呆症的主要目标年龄是60岁出头的人。在阿尔茨海默病中,大脑发生了显著的变化,特别是在涉及记忆和其他认知功能的区域,如海马和杏仁核。认知神经元首先受损,然后更多的灰色细胞萎缩,使患者无法进行最基本的操作,并与严重的认知障碍作斗争。
轻度认知障碍(Mild cognitive impairment,MCI)是一种过早的智力障碍,表现为一个或多个认知领域的临床退化,如记忆、认知和推理。MCI可以被认为是介于AD和认知正常(Cognitively Normal,CN)之间的痴呆阶段。MCI大致可分为两个主要部分:a)早期MCI(Eealy-MCI,EMCI),b)晚期MCI(Late-MCI,LMCI)。LMCI患者的痴呆症状比EMCI患者更严重。此外,从LMCI转化为AD的几率比EMCI大得多。因此,LMCI有时被称为AD的早期阶段(Eealy-AD,EAD)。研究表明,如果能够充分识别EAD,通过进行康复训练和治疗,可以减少约30%的AD转换。
在手工方法中,医学专家通过心理和身体检查来诊断AD。医生很难通过人工程序诊断AD,因为并非所有的身体检查都能产生可靠的结果,而且大脑的身体、精神和分子变化难以评估。此外,手工技术需要更多的时间和身体接触患者。正确处理神经图像可以产生相关的特征/生物标记物,可用于成功地对AD的不同阶段进行分类。由于复杂的组织结构,传统的成像工具很难从大脑图像中识别出有用的特征。因此,在这项工作中开发了基于深度神经网络(Deep Neural Network,DNN)的架构,以从每个类中提取最大数量的特征。
本文的工作框架可以分为三个部分;i)使用提出的DNN模型进行特征提取,ii)使用主成分分析(Principal Component Analysis,PCA)进行最佳特征选择,以及iii)使用随机森林(Random Forest ,RF)算法进行分类。以下是对这项工作的主要贡献摘要:
1、特征提取:主要动机是从输入类中提取最大可能的特征。
本文使用VGG-19设计了一个DNN用于特征提取。我们采用密集块方法来减少梯度消失和信息损失。不同的卷积滤波可以帮助模型学习更重要的特征,并通过整合各个方面来增强特征表示[39]。我们使用初始块概念将所有卷积层替换为三个同时较小的核卷积层(1×1,3×3和5×5),以提取异构特征。
在核磁共振图像(Magnetic Resonance Images,MRI)等低对比度图像中,低值和高值特征可能具有同等的相关信息。因此,从之前的工作中获得灵感,本文创建了一个新的池化层(MinPooling)来吸收最低值的特征。我们在模型中集成了MaxPooling和MinPooling层,并替换了所有的MaxPooling层。
2、特征选择:在提取尽可能多的特征后,想得到模型中最合适的特征。
特征选择是一种预测哪些特征在分类中最突出的方法。主成分分析(Principal Component Analysis,PCA)是一种广泛应用于各个领域的特征选择工具。由于PCA能够通过变异比计算选择最合适的参数,因此在医疗保健领域得到了广泛的应用。我们在研究中采用了基于PCA的特征选择策略。为了检验所选特征的有效性,我们使用了三个分类器(RF、ANN和SVM)来测试同一组特征,结果发现这三个分类器的效果都令人信服。
3、分类:对EAD和其他痴呆阶段进行分类。
随机森林(Random Forest, RF)易于设置和使用,采用聚合来提高预测性能,并通过在多个可能批次的数据上拟合许多分类树来最小化过拟合。在本研究中,为了对AD的早期和其他痴呆阶段进行分类,我们使用了基于RF的分类器。值得注意的是,该模型在对CN和EAD进行分类时的平均执行率为98%。该模型正确分类了EAD与AD、CN与AD、CN与EAD与CN,准确率分别为96 .67%、97 .5%和97.5%。同时,该方法在多类(CN、EAD和AD)分类测试中表现良好。与各种分类器(包括SVM和20个最流行的DNN模型)进行比较,评估了所建议方法的有效性。所提出的方法比任何其他已经讨论过的技术性能更加优秀。
资料来源:
根据Ruhul Amin Hazarika等于2024年发表在Multimedia Tools and Applications题目为《A novel machine learning based technique for classification of early-stage Alzheimer’s disease using brain images》的文章缩写整理而成。
(本文责任编辑:陈劭)