本文是一篇计算机论文,本文的主要创新点和贡献可以总结如下:(1)在原始U-Net网络的基础上改进编码器和解码器结构,使其能够适应前列腺MRI分割任务,提出基于边缘信息的网络AIM-U-Net。AIM-U-Net通过重新设计编码器和解码器结构,利用深度可分离卷积替换原有卷积方式减少空间信息丢失,利用通道注意力机制优化解码器特征,设计边缘信息模块和边缘信息金字塔模块实现增强和恢复边缘特征,结合深度监督机制提高网络的收敛速度。
第1章 绪论
1.1 研究背景与意义
前列腺癌是一种主要发生在前列腺上皮组织的恶性肿瘤,其在恶性肿瘤疾病谱中占据显著地位。自20世纪90年代中期以来,随之血清前列腺特异性抗原检测技术的迅猛发展,前列腺癌的早期诊断精度得到了显著提升。尽管如此,前列腺肿瘤在初期往往隐匿无状,且缺乏明确的临床参考指标,这导致了其病变范围和病理过程的诊断困难。因此,及早发现潜在的前列腺病变对降低前列腺癌的致死率有至关重要的意义。
磁共振成像(Magnetic Resonance Imaging,MRI)作为一种无损无创的影像学检查工具,是临床上检测前列腺最常用的成像方式之一。相较于计算机断层成像(Computed Tomography,CT)和直肠探头超声(TRUS),MRI在前列腺癌的检查效果及分期准确度上均展现出显著优势。MRI具备多角度观察病灶的能力,并能清晰显现骨盆骨骼形状,有助于医生精准检测、定位和分期前列腺癌,为患者制定出个性化的治疗方案,并在术后评估疗效或复发情况。此外,MRI在引导穿刺活检、近距离放疗以及手术计划和术后随访等方面发挥着不可或缺的作用,凸显其在前列腺癌诊断与治疗中的不可替代性。
前列腺癌诊断核心在于实现前列腺的快速、自动和精准分割。如前所述,尽管MRI在前列腺癌的诊断中具有显著的优势,但前列腺周围复杂的组织结构以及个体间前的形态差异,使得从MRI中准确分割出称为一项挑战。有时,即使依赖专业医生的肉眼识别,也难以精确区分前列腺与邻近组织。尽管手工分割具有较高的精度,但其主观性强且耗时较长,难以满足日益增长的临床需要。因此,实现MRI精准的自动分割对前列腺癌的治疗至关重要。
1.2 国内外研究现状
1.2.1 基于传统方法的图像分割方法研究
分析医学图像分割技术的演进轨迹,可以清晰看到是一个由人工分割逐步向半自动乃至全自动分割转变的渐进过程。初始阶段,通常是由医生根据自身专业知识和经验,在MRI图像上手动描绘出目标区域。然而,手工分割耗费大量人力物力,且易受医生主观经验的影响,容易出现分割结果与实际结果不符的情况,导致分割准确率不高。在过去的几十年里,研究者们提出了许多基于传统方法的MRI前列腺分割方法,主要包括基于区域增长的分割方法、基于边缘检测的分割方法、基于机器学习的分割方法和基于阈值的分割方法等。
基于区域生长的分割方法通过选择代表性的种子像素,并逐步合并符合特定条件的邻近像素来形成目标区域。然而,这种方法对于初始种子像素的选择和生长准则的合理性高度依赖。所以,对于前列腺MRI中边缘模糊和灰度分布不均的情况,容易导致过分割,从而限制了其泛化能力。
基于边缘检测的图像分割算法则是通过检测MRI不同区域之间的边缘来实现分割。尽管它早期广泛研究的方法之一,但由于前列腺MRI中组织与器官边界的模糊性,因此在前列腺MRI的分割任务中表现不佳。
基于阈值的分割方法则是根据图像的灰度特征计算阈值,并根据像素的灰度值与阈值的比较结果进行像素分类。然而,由于前列腺MRI的灰度分布不均以及目标区域与背景之间灰度值的大范围差异,因此基于阈值分割的方法并不适用于前列腺MRI的分割。
第1章 绪论
1.1 研究背景与意义
前列腺癌是一种主要发生在前列腺上皮组织的恶性肿瘤,其在恶性肿瘤疾病谱中占据显著地位。自20世纪90年代中期以来,随之血清前列腺特异性抗原检测技术的迅猛发展,前列腺癌的早期诊断精度得到了显著提升。尽管如此,前列腺肿瘤在初期往往隐匿无状,且缺乏明确的临床参考指标,这导致了其病变范围和病理过程的诊断困难。因此,及早发现潜在的前列腺病变对降低前列腺癌的致死率有至关重要的意义。
磁共振成像(Magnetic Resonance Imaging,MRI)作为一种无损无创的影像学检查工具,是临床上检测前列腺最常用的成像方式之一。相较于计算机断层成像(Computed Tomography,CT)和直肠探头超声(TRUS),MRI在前列腺癌的检查效果及分期准确度上均展现出显著优势。MRI具备多角度观察病灶的能力,并能清晰显现骨盆骨骼形状,有助于医生精准检测、定位和分期前列腺癌,为患者制定出个性化的治疗方案,并在术后评估疗效或复发情况。此外,MRI在引导穿刺活检、近距离放疗以及手术计划和术后随访等方面发挥着不可或缺的作用,凸显其在前列腺癌诊断与治疗中的不可替代性。
前列腺癌诊断核心在于实现前列腺的快速、自动和精准分割。如前所述,尽管MRI在前列腺癌的诊断中具有显著的优势,但前列腺周围复杂的组织结构以及个体间前的形态差异,使得从MRI中准确分割出称为一项挑战。有时,即使依赖专业医生的肉眼识别,也难以精确区分前列腺与邻近组织。尽管手工分割具有较高的精度,但其主观性强且耗时较长,难以满足日益增长的临床需要。因此,实现MRI精准的自动分割对前列腺癌的治疗至关重要。
1.2 国内外研究现状
1.2.1 基于传统方法的图像分割方法研究
分析医学图像分割技术的演进轨迹,可以清晰看到是一个由人工分割逐步向半自动乃至全自动分割转变的渐进过程。初始阶段,通常是由医生根据自身专业知识和经验,在MRI图像上手动描绘出目标区域。然而,手工分割耗费大量人力物力,且易受医生主观经验的影响,容易出现分割结果与实际结果不符的情况,导致分割准确率不高。在过去的几十年里,研究者们提出了许多基于传统方法的MRI前列腺分割方法,主要包括基于区域增长的分割方法、基于边缘检测的分割方法、基于机器学习的分割方法和基于阈值的分割方法等。
基于区域生长的分割方法通过选择代表性的种子像素,并逐步合并符合特定条件的邻近像素来形成目标区域。然而,这种方法对于初始种子像素的选择和生长准则的合理性高度依赖。所以,对于前列腺MRI中边缘模糊和灰度分布不均的情况,容易导致过分割,从而限制了其泛化能力。
基于边缘检测的图像分割算法则是通过检测MRI不同区域之间的边缘来实现分割。尽管它早期广泛研究的方法之一,但由于前列腺MRI中组织与器官边界的模糊性,因此在前列腺MRI的分割任务中表现不佳。
基于阈值的分割方法则是根据图像的灰度特征计算阈值,并根据像素的灰度值与阈值的比较结果进行像素分类。然而,由于前列腺MRI的灰度分布不均以及目标区域与背景之间灰度值的大范围差异,因此基于阈值分割的方法并不适用于前列腺MRI的分割。
第2章 相关理论及技术
2.1 MRI分割
MRI是一种利用磁共振现象从人体中获取电磁信号,进而重建人体结构信息的医学诊断工具。与PET和SPECT相比,MRI的磁共振信号直接来源于物体本身,无需注射放射性同位素,这使其在安全性上具有显著优势。然而,MRI也存在局限性,例如对患者体内金属异物的严格限制、空间分辨率相对较低、价格昂贵、较长的扫描时间以及可能产生较多的伪影。
前列腺肿瘤在MRI上的表现特征为正常高信号的前列腺组织中出现低信号结节。计算机辅助诊断技术在此发挥了关键作用,它利用计算机算法从医疗影像数据中提取这些代表性特征,结合机器学习算法,实现前列腺MRI的自动分割。
目前,MRI已成为临床医疗影像检查中的核心手段,尤其是因为其能够提供任意方向断层图像的优势。在众多的MRI分割算法中,U-Net[4],聚类,FCNN[5]等方法备受关注。其中,U-Net网络已成为医学图像分割领域的主流深度学习算法之一。因此,本文提出的两个优化模型均构建在U-Net网络框架基础之上。关于U-Net网络的原理和结构,将在第三章进行详细阐述。
2.2 生成对抗网络
2.3.1生成对抗网络的基本结构
生成对抗网络(Generative Adversarial Networks,GAN)在2014年由Goodfellow[17]等人提出的无监督学习框架。该框架由两个核心组件构成:生成模型(Generator,G),其主要目标是学习输入数据的分布概率;判别模型(Discriminator,D),其任务是区分输入样本究竟是真实的还是由生成模型生成的。GAN的框架结构如图2-1所示。
根据图2-1所示,生成器G从噪声先验分布中抽取样本以构建由其决定的生成分布。G的目标是使生成分布尽可能接近真实样本的分布,从而诱导D将其生成的样本错误地分类为真实样本。与此相反,D力求正确地区分真实样本与G生成的样本。为了实现这一目标,GAN设计了损失函数,通过比较生成分布与真实分布的差异来调整G的参数,从而促使生成分布逐渐逼近真实分布。
第3章 基于改进的U-Net的前列腺MRI分割网络 ............................ 13
3.1 引言 .......................................... 13
3.2 改进的U-Net网络模型结构 ................................. 13
第4章 基于生成对抗网络的小样本学习图像分割网络......................... 26
4.1 引言 ................................. 26
4.2 改进的SegAN网络 ........................ 26
第5章 总结与展望....................................... 40
5.1 总结 ....................................... 40
5.2 展望 ......................................... 40
第4章 基于生成对抗网络的小样本学习图像分割网络
4.2 改进的SegAN网络
4.2.1 SegAN网络模型结构
SegAN是基于U-Net无法有效解决图像中像素类别不平衡的问题而提出的一种分割模型。作者借鉴了GAN的思路设计分割网络模型,并提出了Multi-scale L1 Loss来进一步优化模型性能。如图4-1所示,该网络核心结构分为生成器(Segmentor,S)和判别器(Critic,C)两部分。S部分借鉴了U-Net的架构,呈现出一个典型的U型结构,包含了编码器和解码器。编码器由4层步长为2的卷积层组成,而解码器则由4层上采样层构成,最终输出预测的前列腺二值图像。C部分则接受两个输入:一是原始图像与S部分预测结果的乘积,二是原始图像与真实标签的乘积。
在训练过程中,采用min-max的对抗学习模式来训练S和C。首先,固定S,对C进行一轮训练,以使其损失输出值最小化。接着,固定C,对S进行一轮训练,以使其损失输出值最大化。如此反复,能够有效地优化分割网络性能,提升模型的整体表现。
第5章 总结与展望
5.1 总结
近年来,深度学习技术取得了突飞猛进的发展,广泛应用于各个领域,尤其在医学图像处理领域。通过将深度学习技术与医学影像处理相结合,显著提高了医学图像分割的精度和效率。然而,前列腺MRI具有组织与器官对比度低、边界模糊和噪声大等特点,同时不同研究机构的私有数据集也存在很大差异,导致研究者难以获取足够的训练数据来进行前列腺MRI分割。为了解决上述问题,本文决定在U-Net基础上,采用生成对抗网络和小样本学习方法,使模型能够利用少量样本实现新类型前列腺图像的泛化。
本文的主要创新点和贡献可以总结如下:(1)在原始U-Net网络的基础上改进编码器和解码器结构,使其能够适应前列腺MRI分割任务,提出基于边缘信息的网络AIM-U-Net。AIM-U-Net通过重新设计编码器和解码器结构,利用深度可分离卷积替换原有卷积方式减少空间信息丢失,利用通道注意力机制优化解码器特征,设计边缘信息模块和边缘信息金字塔模块实现增强和恢复边缘特征,结合深度监督机制提高网络的收敛速度。此外,通过与其他经典分割算法对比分析,揭示了所提出的AIM-U-Net模型在捕获前列腺组织边缘特征方面的优越性,进而实现了更为精准的分割表现。(2)在AIM-U-Net的基础上,整合生成对抗网络原理与迁移学习策略在小样本条件下的应用,进而提出基于生成对抗网络的小样本学习图像优化模型AIM-GAN。首先,利用公开数据集PROMISE12获取AMI-U-Net预训练模型作为分割网络的生成器,优化ECA注意力机制以增强模型捕捉多层特征的能力,并设计分类矫正器模块以缓解分割网络对不含前列腺组织图像的过分割问题,提高了模型分割精度。此外,为了验证提出分割网络的性能,在NCI-ISBI-2013-03数据集上,与其他经典网络模型方法进行对比,验证其有效性。
参考文献(略)