代写计算机论文题目:基于GAN的面部生成算法探讨

发布时间:2024-05-24 23:55:50 论文编辑:vicky

本文是一篇计算机论文,本文在多姿态以及面部遮挡情况下的面部生成效果虽然取得了一定的成果,为人脸识别领域提供了一些帮助。

第一章 绪论

1.1 研究背景与意

 近年来,随着人工智能技术的发展,图像处理技术的应用越来越广泛,其中面部正面化技术和面部去遮罩技术是比较热门的研究领域。面部正面化技术旨在将人物头像从任意角度的图像中恢复为正面的头像,而面部去遮罩技术则是通过图像处理技术,将头像中的遮罩物去除,得到更为清晰的人物头像。这两种技术的研究和应用对于人脸识别、虚拟现实、安防监控、社交媒体等领域都具有重要的意义。

面部正面化技术对于人脸识别技术的提升具有非常重要的作用。在人脸识别中,一般要求输入的人脸图像为正面图像,而现实生活中,人们在不同的角度和距离下拍摄面部照片,这会导致面部图像中存在姿态、表情、光照和遮挡等方面的差异,这些差异给人脸识别带来了巨大的挑战。通过面部正面化技术,可以将不同角度的人脸图像恢复为正面图像,从而提高人脸识别的准确率和鲁棒性。

面部去遮罩技术也对于人脸识别等应用具有重要的意义。在新冠疫情期间,佩戴口罩成为一种常见的防护措施,但遮挡了人脸的部分特征。这些遮罩物会影响人脸识别的准确性,而通过面部去遮罩技术,可以将遮罩物去除,得到更为清晰的人脸图像,从而提高人脸识别的准确率。

综上所述,多姿态面部正面化和面部去遮罩生成两个任务中具有广泛的应用前景和重要的研究意义。这两种技术可以帮助提高面部识别的准确性和效率,从而为人类社会的发展和安全带来更多的便利和保障。

1.2 国内外研究现状

本小节中主要针对多姿态情况下的面部正面化生成以及面部遮罩情况下的面部生成这两个方面介绍。

1.2.1 面部正面化方法研究现状

多姿态面部正面化是指将具有旋转角度的面部图像生成为正面面部图像,主流的方法分为两类:第一类是通过三维模型对二维图像建模,在三维坐标中将侧面的面部旋转至正面面部;第二类是输入二维图像后,通过生成对抗网络生成至正面面部。三维模型的主要方法包括Blanz等[1]提出了三维变形人脸模型(3DMM):3DMM利用大型人脸数据库构建一个正面面部模板,对输入图像使用模板后微调,该方法的优点是面部结构信息完整,缺点是对大型人脸数据库建模时间慢,效率低;Yin等[2]提出的面部正面化生成网络模型(FF-GAN):FF-GAN以GAN为基础,优化3DMM的后处理部分,生成面部质量高,但是该方法时间消耗高,模型泛化能力差;Zhao等[3]提出了双代理生成对抗网络模型(DA-GAN),DA-GAN与FF-GAN方法类似;Ju等[4]提出的面部恢复网络模型(CFR-GAN):该方法以GAN为基础,通过3DMM建模引导面部生成,模型运行速度快,但是生成的伪影较多,生成图像与基准图像相似度较差。

第二类主要是二维输入的生成对抗网络模型,包括Li等[5]提出基于GAN的面部姿态数据集(M2FPA):M2FPA使用了两种判别器:一种是掩膜判别器,一种是全局判别器,M2FPA通过两个判别器反馈给生成器的细节信息更多,生成的局部信息也较多,但是对于全局的图像连续性较差;Huang等[6]基于GAN提出双路生成对抗网络模型(TP-GAN):TP-GAN整体分为两条通路(局部通路和全局通路),TP-GAN与M2FPA存在同样的问题,局部信息生成能力强,生成全局信息与局部信息的耦合度较差,复杂环境下生成能力较差;Tian等[7]提出非纠缠表征学习生成对抗网络模型(CR-GAN):CR-GAN的设计思路与前两种方法不同:设计两个生成器生成图像,该方法模型复杂且处理时间较长;Zhao等[10]提出姿态不变模型(PIM):PIM优化TP-GAN,增加landmark heatmap先验信息和couple-agent判别器,Yin等[11]提出双流生成对抗网络模型(DA-GAN):DA-GAN优化M2FPA,在M2FPA生成器的基础上增添了注意力机制,PIM和DA-GAN缓解了复杂环境下的面部敏感问题,但是依旧存在生成图像与基准图像相差较大的问题。

第二章 相关技术与基础理论

2.1 深度学习理论基础

(1)机器学习

作为实现人工智能的最重要的方法之一,机器学习是指在算法的指导下,通过对大量的数据进行训练,学习数据中隐藏结构或规律,并对输入数据进行预测。

机器学习在人工智能发展过程中大概分为五个阶段:第一阶段,1949年Donald Hebb提出的赫布理论就标志着机器学习迈出了该领域的第一步;第二阶段,上世纪60年代中叶到70年代初,由于机器学习算法对于计算机的处理速度及内存大小都有较高的要求并且当时计算机技术的发展速度比较缓慢,因此机器学习的发展滞后;第三阶段,70年代由于人工智能不光要研究解法,还得引入知识。专家系统的出现使得人工智能的研究走向了新的高潮;第四阶段,90年代后期支持向量机(SVM)[39]模型的提出,标志着机器学习进入新的时代;第五阶段,21世纪多层连接主义兴起,深度学习再度发展。

(2)深度学习

深度学习方法是由多个网络层组成,通过较庞大的网络结构可学习相对复杂的概念。但是最初的深度学习模型规模扩充时遇到了一些问题,导致发展缓慢:

第一,采用反向传播算法的过程中,会出现梯度为0的情况,因此神经网络前面的权值几乎不会更新,导致了神经网络无法准确拟合数据;

第二,随着神经网络模型的规模不断扩大,网络中的模型参数也越来越多,大规模的神经网络训练比较依赖于计算机硬件资源并且受限于当时技术的因素导致网络参数更新时极易陷入到局部极小值;

第三,较复杂的神经网络结构拟合模型的能力也较强,但是这样会出一个极端情况,即网络过拟合:在训练数据上预测结果好,但在未训练过的数据上预测结果较差。

2.2 卷积神经网络基础理论

本小节中先介绍卷积神经网络兴起与发展,之后详细介绍卷积基本结构(卷积层、池化层),常用的激活函数以及常用的损失函数。

1962年,Hubel等[43]提出了新概念:“感受野”。感受野(Receptive Field)是指特征图上的点映射到输入特征图上的尺寸大小。1982年,卷积神经网络的雏形被提出:Fukushima等[44]基于感受野理论提出了卷积神经层。1989年,LeCun等[45]结合反向传播(BP)算法发明了卷积神经网络,并应用于识别手写字符中。1998年,LeCun等[49]提出了卷积神经网络模型LeN et,该模型提高了手写字符识别的准确率。

卷积神经网络的基本结构由输入层、卷积层、激活层、池化层、全连接层及输出层组成。普通的卷积神经网络中,卷积层后经过激活层提高卷积神经网络的表达能力,然后采用池化层操作降低冗余,依此类推组成一个神经网络。如图2-1所示,卷积神经网络模型为AlexNet。AlexNet网络主要由5层卷积层、3层最大池化层和2层全连接层组成,最后输出一个分类概率值。

计算机论文怎么写

第三章 三通道多姿态面部正面化方法.................... 25

3.1 面部正面化方法 ...................... 25

3.1.1 预处理 ......................................... 25

3.1.2 面部正面化网络结构 ................. 26

第四章 基于GAN的两阶段式面部去遮罩方法...................................... 40

4.1 面部去遮罩方法 .................................... 40

4.1.1 面部遮罩 ......................................... 40

4.1.2 改进可变形卷积块 ........................ 41

第五章 面部图像生成平台.......................................... 53

5.1 需求分析 ....................... 53

5.2 总体设计 ............................................. 53

5.3 数据库设计........................... 53

第五章 面部图像生成平台

5.1 需求分析

在现实生活中,采集的人脸图像可能受到多种因素的影响,例如人脸姿态、遮挡和光照等。本章基于上述方法,使用Python语言和Django Web框架开发了一个基于GAN的面部生成展示平台。用户可以通过注册和登录进入平台,上传需要生成的图像并选择输入类型,平台将自动生成完整的面部正面图像,并在Web页面上进行显示和下载。这个平台可以在安全监控、刑侦调查、等领域发挥重要作用,消除面部遮挡、旋转等因素对人脸识别算法性能的影响,提高识别算法的准确性和效率。

计算机论文参考

第六章 总结与展望

6.1 工作总结

本文研究了极端情况下的面部生成算法,主要从多姿态面部以及面部遮挡情况下的面部生成展开研究,主要工作内容总结如下:

(1)现有面部正面化生成方法都是从全局、局部角度提高网络的生成能力,忽略了局部与全局之间的依赖信息,并且现有方法的生成器和判别器的深度不在同一层面,即使其中增添了简单的注意力机制,生成的图像效果仍然较差。针对这一问题, 提出了三通道面部正面化网络模型,在TP-GAN生成器基础上设计半全局网络,并在半全局网络中设计多时空深度注意力模块,利用像素损失函数约束网络,通过半全局网络融合局部与全局依赖关系来辅助生成器生成图像。

(2)现有面部遮罩去除方法中存在生成图像单一、面部生成模糊等问题,因此借鉴面部正面化生成网络的三通路结构以及跳层拼接,启发设计两阶段式面部生成网络结构,生成器中采用自定义卷积模块以及改进的可变形卷积模块,并在公开数据集的基础上制作面部遮罩数据集,利用该数据集训练网络模型,所提方法整体参数量少,生成的面部图像具有多样性。

(3)设计面部生成展示平台,为人脸识别领域以及安防领域提供预处理服务。

参考文献(略)

提交代写需求

如果您有论文代写需求,可以通过下面的方式联系我们。

代写计算机论文

热词