Tianxiang Wang,Qun Dai *
College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China
阿尔茨海默病(Alzheimer’s disease,AD)是一种起病隐匿、进行性发展的神经退行性疾病。 虽然阿尔茨海默病本身并不是一种致命的疾病,但该病很容易出现肺炎、褥疮和营养不良等并发症。研究表明,阿尔茨海默病患者的平均寿命比其他健康同龄人短5-10年。 因此,该病的危害不可低估。 迄今为止,阿尔茨海默病尚无治愈方法,只能通过改善患者的生活质量、药物及非药物治疗来减缓病情进展。 早期预防和治疗仍然是解决这一症状的最佳策略。 阿尔茨海默病的整个过程大致可分为四个诊断类别:正常认知(Normal Cognition,NC)、稳定型轻度认知障碍(stable Mild Cognitive Impairments,MCI)、进行性轻度认知障碍(progressive MCI,pMCI)和阿尔茨海默病。研究一种可以帮助神经病学专家准确有效地检测阿尔茨海默病早期症状的模型是有益的。
磁共振成像(Magnetic Resonance Imaging,MRI)由于具有非电离辐射、无骨伪影、多层面、多参数成像能力、软组织分辨率高、无需造影剂即可显示血管结构等优点,具有显着的优势。因此,大多数现有的阿尔茨海默氏症患者脑部扫描结果都以结构化磁共振成像(structured MRI,sMRI)的形式存储。 传统的基于 sMRI 的阿尔茨海默病诊断方法通常涉及将整个MRI分割成不同尺度的多个区域,以利于提取局部异常特征。 目前,基于sMRI的研究大致可分为四类:(1)体素级(2)区域级(3)切片级(4)补丁级。以补丁级方式保存的患者图像可以看作是多实例(将一个样本看成多个实例组成的“包”)学习的领域,即在阿尔茨海默病患者的扫描图像中,只有局部信息包含阿尔茨海默病的病理特征,而其余成像与普通患者的图像无法区分。在这项研究中,我们从补丁级别的角度模拟了阿尔茨海默病的检测问题。之后,基于多实例学习框架,我们引入了补丁内局部注意力机制和补丁外全局注意力机制来构建网络。 这种策略不仅减少了成像中无效信息的干扰,而且提高了模型对“包”中更重要实例的关注度。
随着数据挖掘技术和科学水平的进步,无数基于深度学习的方法已被应用于现实场景并具有出色的性能。 基于深度学习的模型可以拟合大量可训练数据的任意映射。然而,由于扫描医学图像的成本高昂以及手动标注的困难,大量可训练数据的条件在医学场景中不具备。 为了解决这个问题,出现了弱监督学习、半监督学习、迁移学习、数据增强、集成学习、主动学习等策略。 其中,弱监督学习使用比完全标记数据不太准确或不太完整的标签来训练模型,可以有效减少注释的成本和时间。 然而,在这种方法中,弱标签可能无法提供足够的信息来训练准确的模型,导致性能下降,此外,弱标签中的噪声也会对模型的训练和预测结果产生显著的负面影响。半监督学习是一种利用有限数量的标记数据和丰富的未标记数据进行训练和预测的技术,可以直接降低标注成本。然而,这种方法需要大量高质量的未标记数据,这些数据在医疗场景中的获取可能具有挑战性甚至不可行。因此,半监督学习策略可能并不总是代表医学应用的最佳解决方案。 迁移学习利用预先标记的数据集和模型在新领域快速训练高性能模型,从而降低新数据集的注释成本。 尽管如此,在迁移学习中,如果没有识别适当的源域和目标域,模型的准确性可能会受到严重影响。 数据增强是一种扩展和转换现有标记数据以增加样本多样性、降低注释成本并增加可训练样本数量的方法。然而,增强的数据可能会改变训练集中的样本分布,导致测试集的准确性下降。 集成学习结合了多个模型的预测,以提高其准确性和鲁棒性,从而减少错误标记数据的影响。 然而,集成学习的计算成本很高,其最终预测结果取决于集成模型之间的多样性。 主动学习通过选择信息量最大的样本供人类专家进行注释来降低注释成本,可以有效解决或避免上述问题。 该策略特别适合标注难度高、可训练样本数量有限的医疗场景。
因此,我们的工作设计了一种基于实例的补丁级分布式主动学习策略来诊断阿尔茨海默病。 我们的主要贡献总结如下:
(1)由于整个MRI图像中存在大量背景和无效区域,将整幅图像输入网络会导致时间和空间消耗增加,并引入大量噪声。 因此,本研究将每个补丁视为一个特征,并提出基于Relief模型的补丁预选模块。 然而,用于测量斑块之间差异的传统欧几里德距离可能会导致斑块内空间信息的丢失。为了克服这个问题,该研究引入了分块哈希差异度量来代替欧几里德距离,这显著保留了每个补丁内的空间和结构信息。 随后,计算每个块的重要性,并选择重要性相对较高的块作为模型中后续实验的候选块。
(2)在补丁预选模块之后,为了进一步减少“包”中不相关实例的负面影响,我们将sMRI诊断阿尔茨海默病的问题表述为基于补丁的多实例问题。本文设计了一种基于补丁级全局和局部注意力的多实例深度学习模型(Patch-Level Global and Local Attention-based Multi-Instance Deep Learning Model,PLGLA),该模型利用注意力机制来提高阿尔茨海默病的诊断性能。此外,该模型也为后续主动学习模块中实例级数据分布任务的学习奠定了基础。
(3)针对医学图像样本有限和标注困难带来的挑战,本文构建了基于补丁级实例分布的主动学习策略(Patch-Level Instance Distribution-based Active Learning Strategy,PIDAC)。最初,我们设计了一个网络,可以针对不同类别的样本隐式学习PLGLA模型中关注度最高的几个块的高斯分布。然后,我们利用高斯分布的可加性属性来计算这些块在各个类别中的数据分布。 最后,我们根据样本级和决策级高斯分布从候选数据集中选择最具辨别力的样本,并将其合并到训练集中以最小化标记成本。
资料来源:
根据Tianxiang Wang等于2024年发表在Pattern Recognition题目为《A patch distribution-based active learning method for multiple instance Alzheimer’s disease diagnosis》的文章缩写整理而成。
(本文责任编辑:陈劭)