HAIC-NET: Semi-supervised OCTA vessel segmentation with self-supervised pretext task and dual consis
HAIC-NET:结合自监督预训练任务与双重一致性训练的半监督OCTA血管分割方法摘要光学相干断层扫描血管成像(OCTA)血管分割是一项具有挑战性的任务。一方面,结构复杂,给实现精确的血管分割带来了显著困难;另一方面,当前关于OCTA血管分割的研究严重依赖高质量的人工标注,尤其是在全监督方法中。然而,对OCTA图像进行像素级标注既耗时又费力。为解决上述问题,我们提出了一种名为HAIC-Net的半监
HAIC-NET:结合自监督预训练任务与双重一致性训练的半监督OCTA血管分割方法
摘要
光学相干断层扫描血管成像(OCTA)血管分割是一项具有挑战性的任务。一方面,毛细血管网络结构复杂,给实现精确的血管分割带来了显著困难;另一方面,当前关于OCTA血管分割的研究严重依赖高质量的人工标注,尤其是在全监督方法中。然而,对OCTA图像进行像素级标注既耗时又费力。为解决上述问题,我们提出了一种名为HAIC-Net的半监督方法,该方法融合了自监督学习中的同源增强图像分类预训练任务,以及包含数据扰动一致性和拓扑连通性一致性的双重一致性训练机制。
首先,我们设计了一种自监督的同源增强图像分类预训练任务,引导模型关注同源增强图像中相似的血管特征,从而从未标注图像中提取丰富的血管信息,降低对人工标注的依赖。其次,我们引入了一种双重一致性结构,其中特别加入了拓扑连通性一致性约束,从拓扑角度对分割结果施加符合血管网络拓扑特性的先验知识,以增强分割网络对血管连通性的敏感度,并减少分割结果中的拓扑错误。
我们在两个公开数据集和一个私有数据集上进行了实验,验证了所提方法的先进性能。在ROSE-1数据集上,我们的方法取得了0.9143的准确率和0.7658的Dice系数,不仅优于当前其他半监督方法,而且接近最先进的全监督方法的性能。在OCTA500数据集和我们的私有数据集上也观察到了类似的结果,充分证明了本方法的有效性与优越性。
1.引言
眼睛在感知外部世界中起着至关重要的作用,是人体最重要的器官之一。它们接收外部信息并将其传递至大脑进行处理。研究表明,大脑处理的信息中有超过80%来源于眼睛,这凸显了预防视力丧失的重要性。视网膜病变是导致视力损伤的主要原因之一,因此,早期干预对于减缓其进展所引发的视力损失至关重要。相应地,对这类疾病的检查与诊断具有极其重要的意义。
光学相干断层扫描血管成像(OCTA)是一种快速、无创的技术,能够获取视网膜血管层的高分辨率深度图像。OCTA已在临床实践中被广泛用于描绘视网膜血管系统。常见的视网膜疾病(如糖尿病视网膜病变和青光眼)所引起的显著血管改变均可在OCTA图像中观察到。然而,尽管OCTA图像的高分辨率提供了更详细的视网膜血管信息,但其成像过程的复杂性使得专家解读OCTA血管造影图像既耗时又费力。因此,开展OCTA血管自动分割研究对于辅助临床诊断具有重要意义。
近年来,该领域的研究持续取得进展。然而,由于OCTA血管造影图像本身的复杂性,自动化血管分割的难度客观上显著增加。当前的方法通常高度依赖人工标注数据的数量与质量,以实现更优的分割性能。此外,分割精度仍有较大的提升空间。
在早期研究阶段,研究人员主要采用图像处理技术处理血管图像,并结合机器学习方法进行血管分割,例如条件随机场(CRF)和多尺度滤波等。然而,这些方法需要手动提取特征,而血管结构的独特性使得特征提取过程繁琐且耗时。此外,经过精心设计和特征提取的机器学习算法通常仅适用于特定场景,泛化能力有限,且在准确性方面有待提高。
随着深度学习的不断发展,近年来涌现出大量基于深度学习的血管分割方法。早期的深度学习方法主要关注网络架构和模块设计,并采用全监督方式进行训练。例如,经典方法CE-Net通过密集空洞卷积设计特征提取模块,并采用全监督策略对眼底图像中的血管进行分割。这些全监督方法在血管分割任务中表现出色。然而,专门针对OCTA图像的血管分割方法仍然相对较少。尽管已有部分深度学习方法被应用于OCTA血管分割任务并取得了令人满意的结果,但值得注意的是,这些方法均依赖于全监督,需要大量标注数据。鉴于血管结构的复杂性,像素级的人工标注是一项劳动密集型工作,需要专业人员的深度参与,导致标注过程耗费大量时间和人力成本。
为解决上述问题,采用半监督学习进行血管分割是一种可行的选择。半监督学习旨在利用大量未标注数据中的有用知识,从而降低对目标任务人工标签的依赖。目前,半 supervised 学习大致可分为两类范式:自训练(self-training)和一致性学习(consistency learning)。
在自训练中,模型对未标注数据的高置信度预测被用作伪标签,并加入训练集。例如,有研究提出了一种类别平衡的自训练框架,以避免大类别在伪标签生成中逐渐占据主导地位;另有方法利用联合域感知标签和双分类器来确保伪标签的质量;还有研究将自训练引入三维医学图像分割,通过人工选择具有代表性的三维切片进行训练。然而,这些方法都需要可靠的机制来筛选伪标签。由于图像级分割结果的置信度分布不均,伪标签的质量控制和筛选变得更加困难。
另一方面,一致性学习期望网络在对同一输入施加不同扰动后仍能产生相似的输出。例如,著名的FixMatch方法对同一图像同时施加弱增强和强增强,并使用两个不同的分类头进行预测,从而在两者之间建立一致性约束。
类似地,自监督方法也被证明能够有效利用未标注数据中的潜在信息,为下游任务提取有价值的表征。基于判别学习的自监督方法通过在未标注数据上引入一个简单的预训练任务(pretext task),利用数据中易于获取的内在表征信息作为监督信号。以拼图任务为例,模型的预训练目标是准确预测将原始图像打乱成拼图所使用的顺序。为此,构建一个分类型预训练任务,将一组随机生成的拼图序列作为真实标签,对应的拼图图像作为输入进行训练。在完成拼图任务的过程中,模型同时学习到输入图像中与任务相关的知识,且所需标注成本极低,尤其在标注数据有限的情况下可显著提升性能。
基于上述进展,近年来有研究将自监督引入半监督OCTA血管分割,提出了DCSS-Net。该方法通过多尺度自监督拼图任务,并结合数据扰动和特征扰动进行双重一致性训练,实现OCTA图像的血管分割。在此预训练任务中,原始图像按固定拼图序列被划分为若干块后再重新拼接,模型需识别所使用的拼图序列。然而,拼图任务的目标是建立增强图像与拼图序列之间的映射关系,并以拼图序列为分类依据。这种做法可能导致具有不同血管特征的图像因使用相同拼图序列而被归为同一类别,从而使模型过度关注不同图像块边缘像素之间的空间关系,而非学习血管本身的特征,进而阻碍血管特征的提取和分割结果中全局连通性的保持。
虽然DCSS-Net引入的特征扰动一致性为一致性正则化提供了新视角,但其本质上与数据扰动一致性相似,可视为在图像变换过程中对高层特征图施加的数据扰动一致性,未能有效监督分割结果的结构完整性,导致生成的分割结果中存在大量分散的假阳性像素和错误的血管连接。
图1展示了当前最先进的半监督OCTA血管分割方法DCSS-Net的一些分割示例,进一步说明了现有方法面临的挑战。基于上述考虑,我们旨在寻找一种更简单且更有效的策略,聚焦于OCTA图像中的血管特征以实现精准分割。
本文提出了一种结合自监督同源增强图像分类预训练任务(HAIC)与双重一致性正则化的OCTA血管分割网络。该双重一致性包括数据扰动一致性和拓扑连通性一致性(TCC)。在HAIC自监督预训练任务中,我们将原始图像的编号作为所有由该图像经不同随机增强策略生成的增强图像的预训练标签,要求模型识别这些增强图像源自哪一张原始图像。这一任务迫使模型在各种数据扰动下仍能关注同源增强图像中相似的血管结构,避免了拼图任务中可能过度关注不同图像块边缘像素位置信息的问题。通过训练该同源增强图像分类预训练任务,模型能够以极低的标注成本有效挖掘OCTA图像中固有的血管特征,从而提升整体血管分割性能。
此外,为解决DCSS-Net中双重一致性所提供的监督信息不足的问题,我们引入拓扑连通性一致性来替代特征扰动一致性,对分割结果的连通性施加约束,从而提供更加多样化的监督信号。具体而言,通过在分割结果与真实标签(或伪标签)的血管中心线图之间建立一致性,加大对分割结果中拓扑错误(如血管缺失或中断)的惩罚力度。因此,在进行像素级分类时,模型会倾向于给出更多正向预测,以尽可能降低拓扑错误带来的惩罚,从而增强分割结果的整体连通性。
为验证所提方法的可行性,我们在两个公开数据集(ROSE-1和OCTA-500)以及一个私有数据集上进行了实验。本研究的主要贡献如下:
- 提出了一种新颖的半监督OCTA血管分割网络HAIC-Net,该网络包含一个自监督的同源增强图像分类任务和一个由拓扑连通性一致性与数据扰动一致性构成的双重一致性结构。HAIC-Net能够从大量未标注数据中有效提取血管特征,并从拓扑角度提供额外的监督信息。
- 设计了一种基于不同增强图像间相似性匹配的自监督同源增强图像分类预训练任务。该任务在识别同源增强图像的同时,促使模型从未标注图像中提取对下游任务有益的血管特征,从而减少对人工标签的依赖。
- 提出了一种拓扑连通性一致性方法,通过最小化分割预测与真实标签(或伪标签)之间血管中心线图的差异,从拓扑角度提供监督,增强网络对血管网络整体结构连通性的敏感度。同时,构建了由拓扑连通性一致性和数据扰动一致性组成的双重一致性训练范式,用于无监督训练,进一步提升血管分割的准确性。
- 在两个公开OCTA数据集(ROSE-1和OCTA-500)及一个私有数据集上进行了对比实验。定量结果与可视化结果均证明了所提方法的有效性。此外,我们还进行了消融实验,验证了自监督同源增强图像分类任务和拓扑连通性一致性的有效性。
本文其余部分组织如下:第2节简要阐述相关领域的研究背景与现状,包括机器学习方法、全监督方法、半监督方法和自监督方法;第3节详细描述所提模型的训练流程、自监督预训练任务及双重一致性训练框架;第4节展示定量实验结果与可视化效果,以验证所提方法的有效性;第5节对全文进行总结,并讨论当前方法的局限性及未来可能的改进方向。
图1. 示例图进一步说明当前OCTA血管分割方法所面临的挑战。(a)为原始OCTA图像,(b)为人工标注结果,(c)为当前最先进的半监督方法DCSS-Net的分割结果。由于毛细血管网络结构复杂,人工标注任务工作量和成本极高。因此,采用半监督学习以降低模型对人工标注的依赖具有实际意义。然而,现有半监督方法仍存在血管分割精度不足、拓扑错误较多、分割结果中存在大量分散的假阳性点以及连通性保持不佳等问题。
2.相关工作
2.1 医学图像处理相关研究
在早期研究阶段,研究人员通常结合图像处理技术与机器学习方法来实现目标。例如,有研究采用训练好的全连接条件随机场(CRF)完成血管分割任务;另有工作利用多尺度滤波进行血管分割。近年来,机器学习方法的潜力再次受到关注:一些研究将二维Curvelet变换与混沌樽海鞘群算法相结合,并引入深度学习模型,用于从胸部X光图像中诊断新冠肺炎;还有研究融合二维平稳小波变换、K近邻算法和混沌粒子群优化算法,并结合经典的深度学习网络RNN-LSTM,提出一个四阶段模型以提取彩色眼底图像的特征。然而,这些基于机器学习的方法仍依赖于从图像中人工提取血管特征,过程繁琐,且在泛化能力和准确性方面存在局限。
随后,随着深度学习的快速发展,深度神经网络被广泛应用于血管分割任务。例如,有研究提出了CE-Net(上下文编码网络),该网络由密集非局部空洞卷积和残差多核池化模块组成,其中密集空洞卷积有助于扩大感受野并在图像中聚合远距离特征,但该方法难以有效实现毛细血管网络的精确分割。另有研究引入像素级自适应滤波器,以细化局部血管细节的特征提取,重点改善视网膜血管末端的分割效果,但其计算开销较大,且分割精度仍有提升空间。Vessel-Net认为不同尺度的特征图包含所有所需特征,因此采用多路径监督方式训练模型,但该方法仅优化了网络中的特征传播路径,虽能有效聚合多尺度特征信息,却缺乏针对血管分割的专门设计。RV-GAN基于“粗-精”思想,设计了两组生成器与判别器,分别提取全局血管结构特征和局部上下文信息,通过对抗生成网络实现粗分割与精细调整,但其血管分割精度仍需提高。
上述方法在眼底图像的血管分割任务中取得了良好效果,但OCTA图像中的血管网络更为复杂,需要更精细的网络设计。针对OCTA血管分割,研究者也开展了一系列探索:有工作将血管分割分为粗分割与细化两个阶段,设计了粗-精网络架构以分别感知粗细血管;另有研究融合通道注意力与空间注意力机制,以更好地提取血管特征;还有研究设计了一种端到端的图像投影网络,将输入的三维OCTA图像直接转换为二维血管分割结果。然而,这些方法大多仅通过卷积模块的设计与堆叠对OCTA血管分割进行初步探索,对毛细血管网络的预测精度仍然较低。同时,由于采用全监督训练策略,这些方法高度依赖人工标注的质量与数量,而OCTA血管的人工标注成本较高。
2.2 基于半监督的方法
随着Mean Teacher和FixMatch等方法的提出,半监督学习在各类任务中得到广泛应用。MixMatch在一致性正则化基础上引入Mix-up作为额外的数据增强手段,进一步提升了半监督方法在分类任务中的效果。有研究提出交叉伪标签(Cross-pseudo Labeling),通过约束两个施加不同扰动的网络对同一输入产生高度相似的预测,从而加强一致性。半监督方法也被引入医学图像处理领域:有工作将数据扰动一致性应用于皮肤病变区域分割;另有研究进一步引入Mean Teacher中的学生-教师结构,并采用指数移动平均算法更新参数,从而提升分割精度。近期,还有研究提出一种面向硬正样本的对比学习框架(HPC),构建了半监督医学图像分割方法,取得了显著成果。
此外,一种独特的思路是“部分监督”方法,该方法通过在每次训练迭代中选择信息量最丰富且不确定性最高的图像块所对应的标注进行监督,从而减少对完整人工标注的依赖。这种策略会动态更新所使用的标注集合。与典型的半监督学习不同,该方法在训练过程中并未严格区分监督阶段与无监督阶段,其分割精度仍有提升空间。
2.3 基于判别式的自监督方法
早期的自监督方法利用自然图像固有的颜色或空间信息设计预训练任务。例如,有研究提出灰度图像着色作为自监督辅助任务;另有工作通过预测图像中两个随机选取图像块之间的相对位置关系进行自监督训练;还有方法采用拼图任务(jigsaw puzzle)对模型进行预训练。这些方法通过构建正负样本对,结合对比学习,使网络能够学习到对图像变换具有不变性的特征表示。此外,有研究将预测图像旋转角度的预训练任务与自蒸馏相结合,为自监督任务提供更强的监督信号,并实现跨样本知识迁移。还有工作将自监督与半监督学习相结合,应用于图像分类任务。
尽管这些自监督方法在自然图像分割中表现优异,但由于医学图像具有数据量小、噪声和伪影多、分割目标难以区分等特点,上述方法无法直接迁移到医学图像分割任务中,需进行针对性改进。为此,DCSS-Net首次将拼图任务引入OCTA血管分割,并结合精心设计的双重一致性正则化结构构建损失函数,在该任务上达到了当时最先进的性能。
然而,如第1节所述,一方面,拼图预训练任务可能导致模型过度关注图像块边缘像素之间的空间关系,而忽略血管本身的特征;另一方面,其双重一致性正则化(即数据扰动一致性和特征扰动一致性)提供的监督视角较为单一——因为特征扰动本质上与数据扰动高度相似,可视为在特征层面实施的数据扰动。这些不足限制了模型对有效血管特征的提取能力,也削弱了双重一致性结构的监督作用,亟需进一步优化。
更多推荐


所有评论(0)