代写计算机论文范本:基于深度生成网络的地震相分析

发布时间:2023-06-10 16:42:03 论文编辑:vicky

本文是一篇计算机论文,本文主要探讨了基于深度生成模型的地震相分析模型,其中分别包含基于自编码器的自监督学习、基于深度生成模型的深度聚类模型,基于生成对抗网络的半监督语义分割模型以及基于不变信息聚类的无监督语义分割模型。

第一章  绪论

1.1 研究背景及意义

地震相是由地震反射参数所限定的三维地震反射单元,是特定沉积相的地震响应,有助于油气藏勘探和储层预测[1]。地震相分析是根据地震反射分析地层、岩性及油气分布情况,不仅是地震相还是地质地层分析的关键技术,而且还在油气田的勘探、评价、开发、生产等阶段都有着广泛的应用[2]。物探包含重力、电法、磁法、地震四类,而在油气勘探中应用最多的还是地震勘探,地震勘探分为地震采集、处理、解释三大环节,地震解释是地震勘探的重中之重[3]。

计算机论文怎么写

地震相分析在油田勘探与开发过程中十分重要,特别是在大数据时代,工作站存储着海量的三维地震数据。而在20世纪90年代以前,解释人员通过视觉逐个确定二维地震数据的振幅、相位、频率等属性[4],然后再根据这些信息,如结构区域的地质构造信息和沉积背景,依据井震标定对地震相进行分析[5],这个方法成为相面法[6-7]。之后出现的海量三维地震数据,用人工逐剖面分析地震相已不现实。而且这些传统的地震相识别结果的主观性强、时间周期长、解释效率低[8]。所以在地震勘探领域,一些研究者借助了大数据挖掘、机器学习和深度学习技术,采用这些方法能有效提升地震处理效率。这些方法已经应用在了地震勘探领域的方方面面,如地震数据解释领域的地震断层识别[9-12],地震层位追踪[13-15],以及地震相分析[16-18]等研究领域。所以对地震数据进行自动解释已经成为重要的研究方向。

随着计算机硬件水平的提高,计算性能的提高,特别是近年来深度学习方法的发展,吸引了不少地震勘探人员在相关领域的研究。但深度学习训练所需的数据大,而在地震勘探领域,公开的标注数据只有有限几个,比如荷兰北海F3数据集等。目前在深度学习中,面向地震相分析的主要有两类模型:一类是图片分类,就是将一个地震剖面切割成多个切片(patch)[19-20],然后对每个切片进行预测,这个切片的类别就是其中心点的类别,最后在拼凑成原始地震剖面,就能得到该剖面的预测结果。另一种是语义分割模型,是直接对一个剖面上的每个采样点进行预测,这样无需引入额外的超参数,而且不会造成切片后的上下文和空间信息丢失。

1.2 国内外研究进展

1.2.1 地震相识别研究进展

随着时代的发展,机器学习技术已应用在地震勘探的很多方面。基于这些机器学习模型的地震相分析主要分为三类,一种是波形分类法[21-22],该方法就是从多个地震道波形中选取几条具有代表意义的地震道,然后通过自组织映射网络,来对每个波进行聚类,该方法最后的结果还要进一步的人工解释。另一种是地震数据特征映射法[23-24],该方法由文献[25]提出,综合了多种地震属性进行地震相分析。最后一种方法是基于地震地貌学的划分方法[26],该方法主要借助于地震振幅。

人工分析地震相耗时耗力,为了解决这些问题,研究者提出了一些基于机器学习方法的模型,如自组织映射[27-29](self-organizing maps, SOM),支持向量机[30](support vector machine, SVM)。然而这些方法有一个明显的缺陷就是需要人工手工设计特征,人工设计特征难免受到主观影响,且在特征较多时并不实用。

相较于传统机器学习方法[31]或者浅层神经网络[32],深度学习可以实现端到端的地震相分类,无需人工设计特征。基于深度学习的地震相分类,将地震剖面看作图像,利用图像处理的方法实现地震相分类。按数据处理方法不同,可以分为两类模型,一类基于卷积神经网络的分类模型,选取地震剖面上某个采样点周围的子区域或三维子立方体作为分类对象,分类结果代表这个采样点的地震相类别,如Dramsch 等[33]和Zhao等[34]使用了一些经典的卷积神经网络如VGG和ResNet,Liu等人[35]使用3D卷积核,这种方法需要引入额外的超参数,会导致计算量较大。另一类基于语义分割,基于编码器-译码器的深度神经网络框架,将从一个地震剖面到地震相映射看作是一个通道数为一的语义分割问题,实现地震剖面级的分类,无需引入超参数,有效降低了计算量,如 Di 等[36]使用的DCNN、Zhang 等[37]的deeplabv3+,都利用语义分割方法实现地震相识别; 闫星宇等[38]在UNET语义分割网络后加入金字塔池化模块(PPM)模块,改进了语义分割网络对与地震相边界刻画的准确度。2022年最新的研究[39]使用HRNet对地震相进行识别。然而这些网络都属于监督学习模型,需要大量标注数据来学习网络参数,但在实际的地震勘探中,获取标注地震数据的难度大、成本高,所以有必要使用无监督学习和半监督学习的模型来识别地震相。

第二章  深度生成模型简介

2.1 生成模型简介

生成模型是概率生成模型(Probabilistic Generative Model,PGM)的简称,用于随机估计可观测数据分布以及从分布中生成新的数据的模型,是概率统计学和机器学习技术中重要模型。

假设在某个连续或离散的高维空间中的随机向量服从一个未知的数据分布,生成模型就是根据这个分布的一些可观测的来训练一个模型来近似这个未知分布,然后用这个近似的分布来生成一些样本,训练目标就是使得“生成”的样本和“真实”的样本尽可能地服从相似的分布。

所以,生成模型的主要功能为:

1. 密度估计,对该可观测数据的密度函数进行估计。

2. 生成样本,从密度函数中生成(采样)新的、服从同分布的数据。 在机器学习领域中,密度估计(Density Estimation)是根据一组可观测数据来估计其分布。而对于某些数据集,如这个数据集每一维都代表图片中不同像素,但不同像素之间存在复杂的依赖关系,因此常常引入隐变量来简化模型,而且隐变量常常假设服从标准高斯分布,其每一维相互独立,这个就是显式的密度模型。生成样本是从某个分布生成或采样一些服从这个分布的样本,为了便于采样,另一个思想就是从一个服从简单分布的采样一个样本,然后用一个模型映射到需要估计的分布,这样就可以降低生成样本的难度,这个就是隐式的密度模型。

近年来,生成模型的发展迅速,如自动画图和作曲,这些都是生成模型的应用。虽然生成模型可以用来建模不同模态的数据,但对于一个高维空间中的复杂分布,密度估计和生成样本通常都不容易实现:一是高维的分布一般比较难以直接建模,需要通过一些条件独立性来进行简化;二是给定一个已建模的复杂分布,也缺乏有效的采样方法。在训练生成模型时,传统模型需要采样和变分法近似推断,而在深度生成模型中,深度神经网络可以对近似任意函数的能力,可直接借助其来对未知分布进行建模。在深度生成模型中,主要分为两种:显式生成模型和隐式生成模型,各自的代表模型就是指变分自编码器(Variational Auto Encoder,VAE)和生成对抗网络(Generative Adversarial Networks,GAN)。

2.2 显式生成模型

2.2.1 自编码器

自编码器(Auto Encoder,AE),也称自动编码器,训练目标是将输入拷贝到输出,用重构误差作为损失函数。自编码器先将原始数据映射到一个特征空间,该特征空间为隐藏层,然后从该特征学习重建原始的数据。是无监督学习和自监督学习中的重要模型结构。

一个典型的自编码器包含编码器和解码器两部分网络。欠完备自编码器(Under-complete Auto Encoder)的编码器将原始的数据映射到更低维度的特征空间,学习比原始数据维度要小的隐藏层特征,这样将会引导自编码器只关注于数据中主要特征,也避免了恒等变换,可以起到压缩或者降维的目的。这与主成分分析(Principal Component Analysis,PCA)的功能类似,但当编码器为深度神经网络时,激活函数可以为非线性激活函数,所以自编码器能学习到比PCA更强大的非线性特征提取能力。自编码器的解码器则是用隐藏层的特征来重建原始数据。

稀疏自编码器(Sparse Auto Encoder,SAE)是自编码器的变种,该自编码器学习到的隐藏层特征的维度可以大于输入维度,并希望隐藏层的特征尽可能稀疏,而稀疏编码的每一维可以看作一种特征,稀疏编码的优点是降低计算量低和增强可解释性。

降噪自编码器(Denoising Autoencoder,DAE)是自编码器的另一个变种,与原始自编码器不同的是,在训练过程中,输入需要加入一些扰动,比如增加噪音或者随机掩盖掉一部分输入。这样的自编码器的重建难度增加,这也使得学习到的隐藏层特征更具有代表性。

第三章  面向地震相识别的特征提取和聚类方法 ........................... 17

3.1 地震数据集 ................................................... 17

3.2 基于自编码器的自监督学习 ......................... 18

第四章  基于半监督和无监督学习地震相分割 ................................ 25

4.1 基于对抗网络的半监督地震相识别 ...................................... 25

4.1.1 基于语义分割的地震相识别 .................................... 25

4.1.2 半监督对抗网络的结构 ......................................... 25

第五章  总结与展望 ................................ 41

5.1 研究内容总结 ....................................... 41

5.2 工作展望 ........................................ 42

第四章  基于半监督和无监督学习地震相分割

4.1 基于对抗网络的半监督地震相识别

4.1.1 基于语义分割的地震相识别

对一个剖面上的地震相识别可以看作一个单通道的图片语义分割问题,即对每个地震剖面上的每个采样点类别进行预测。相较于第三章的图片聚类,语义分割模型无需引入切片大小这一类的超参数,有效降低了计算量,且能够不会引入切片导致的上下文信息和空间信息的损失。

语义分割模型主要分为全卷积网络(fully convolutional networks,FCNs)和编码器-解码器网络。相较于前者,编码器-解码器模型更能融合上下文和空间语义信息,其中以UNet和PSPNet为代表,随后随着空洞卷积的发展出现了更强大的DeepLab系列的语义分割模型,而较为新的研究是HRNet(high-resolution network),HRNet可以处理高分辨率的图片,无需对高分辨率图片进行切片。但这些模型实际上过于复杂且计算量高,与之相对的一些轻量级别的语义分割网络也在发展,比如本节使用BiSeNet[77],轻量级别的语义分割网络是在兼顾准确率的情况下,能有效降低计算量的模型。

计算机论文参考

第五章  总结与展望

5.1 研究内容总结

地震相分析在地震勘探领域中十分重要,而本文主要探讨了基于深度生成模型的地震相分析模型,其中分别包含基于自编码器的自监督学习、基于深度生成模型的深度聚类模型,基于生成对抗网络的半监督语义分割模型以及基于不变信息聚类的无监督语义分割模型。

在本文中首先介绍了深度生成模型的基本概念、优化目标以及训练方法以及比较了三种模型的优缺点,然后又介绍了基于深度生成模型的深度聚类模型,这些模型能用聚类损失引导特征提取器提取出聚类友好的特征,二者相互促进,共同进步。此外本文还介绍了基于掩码模型的自监督预训练任务,即重构掩盖的地震道。最后则是介绍了基于半监督学习和无监督学习的地震相分割网络。

这些方法都在在实际工区数据资料上得到了验证。对比这些实验结果,本文主要得到以下几点结论与认识:

(1)基于自编码器的自监督地震特征提取网络。对比ImageNet图片和纹理图片的异同,地震数据与纹理图片十分类似,且工作站拥有海量的未标注的地震数据。所以如何从这数据中挖掘出一些信息十分必要,通过自监督学习可以从这些无标注地震数据中建立起属于地震数据的预训练模型,为不同的地震勘探领域的下游任务提供一个健壮的骨干网络。

(2)基于深度生成模型的地震相深度聚类模型。将深度学习和聚类结合到一起,就可以得到深度聚类模型,这种模型同时用于无监督学习的无需使用标注数据的特性,而且也拥有深度学习的能有效提取特征的优点,所以相比传统的聚类方法,准确率更高。本文提出了三种不同的深度聚类模型,这三种模型分别使用AE、VAE、GAN作为特征提取器,然后以三个模型损失分别融合聚类损失作为整体损失,训练模型,得到一个能提取聚类友好特征的特征提取器。在对应的实验结果表明,使用深度聚类的地震相聚类准确率得到了显著提升。

参考文献(略)