本文是一篇计算机论文,本文通过分析多气温元素、时间滑窗和距离阈值对预测结果影响,以及各温度预测模型模型在不同时间和空间角度下对气温时间序列的预测表现探究更加准确有效的气温预测算法。
1 绪论
1.1研究背景及意义
1.1.1 研究背景
气象变化对各种人类活动发挥着重要作用,与人类的健康生活、社会的经济发展等活动息息相关[1][73] [74] 。然而气象变化过程复杂难以捉摸,因此长期以来,气象学家一直探索准确及时的气象预测方法[2][75] [76] [77] 。近年来,随着科技进步和国民生活水平提高,不同行业和领域对气象预报的准确性和及时性提出了越来越高的要求[3]。天气与人类的健康生活息息相关,天气直接影响着人类的身体健康,天气气候条件变化能导致人类生理活动的变化,并诱发或加剧多种季节性关节炎、阻塞性肺炎等疾病。同时未来气候变化也将对人类的健康产生较大的影响[4][78] [79] ,人体在外界低温环境下会损失大量热量,如果未能采取有效的保温措施,遭遇气温骤降容易诱发流行性感冒等病症;在高温情况下,人体内热量无法及时排出时,可能会出现中暑或太阳晒伤。同时研究表明,全球气候变暖会为病菌繁殖提供有利环境,导致人类感染疾病;同时,城市热岛效应更加频繁,空气污染状况加剧[5][80] [81] [82] 。
在部分极端恶劣气象条件下,气象灾害会造成大规模经济损失并夺取人类生命。根据世界气象组织(WMO)统计于2021年所发布的数据[6],1970年至2019年间,全球共发生超过11000次气象灾害,死亡人数超过200万,累计损失达3.64万亿美元[7],其中于2005年美国东南部发生的飓风造成2000亿美元经济损失和1883人死亡。根据美国国家气候数据中心(NCDC)提供的数据2012年间,天气原因造成了接近四分之一的汽车交通事故;2019年,大洋洲、亚洲东南部、欧洲等地出现极端高温天气,造成数千人死亡,高温干燥还导致了全球多地出现火灾,该年7月,因炎热干旱发生澳大利亚发生大面积森林火灾,截至2020年7月,已导致近30亿动物死亡[8]。据自然灾害数据库(EM-DAT)统计,上世纪九十年代以来全球自然灾害造成经济损失总量中有17%来自中国,而全国自然灾害损失中有 70%是气象灾害造成的。农业工业是立国之本,近年来随着城市化和气候变暖趋势,我国热浪现象频发,温度等级都越来越高,持续时间不断增长,对作物生长造成严重甚至毁灭性破坏[9][83] [84] [85] 。有研究推测,到 2030年,气温升高所导致的冰川融化等现象,将会造成我国洪涝灾害发生的频率,部分中国沿海地区可能会出现海水倒灌面临洪水灾害风险[10]。
1.2国内外研究现状
对于气象预测的方法,国内外研究常用方法大致可以分为三种[15]。第一种气象学方法,天气变化是大气运动的结果,该方法以人为预测主体,参考已有天气状况信息,根据气象学学相关知识和经验,对未来一段时间的气象进行预测。人工预测法脱离了气象数据的分析,仅通过观测人员的经验和知识进行预测,所以预测准确度通常比较低[16];第二种数学统计方法,通过分析历史气象信息,根据各气象因素之间的关联,利用数学函数模型对气象变化趋势进行拟合处理获得预测公式以对未来气象进行预测。这种方法主要包括Kalman滤波法(KF)[17]和回归分析等;第三种方法为利用机器学习算法构建预测模型进行气象预测,机器学习方法能深度挖掘气象数据各因子间的关联各特征,因此往往能表现出优秀的预测准确性,常用的算法有SVM算法[18]、贝叶斯(Bayes)算法[19]、决策树(Decision Tree)方法、遗传算法(GA)和神经网络(Artificial Neural Networks,简称ANNs)等。
在国外的相关研究中,Kisi等[20]将离散小波变换(Wavelet)和支持向量机(SVM)方法结合,进行未来一日降水预测,预测精度比单一SVM更高,研究还引入人工神经网络模型(ANN)作为对照,提出SVM和ANN在气象预测方面的差别;Yu 等[21]利用风速领域先验知识,基于贝叶斯理论和结构突变原理,构建贝叶斯结构突变结构式风速预测模型,利用从公用事业规模的风力涡轮机收集的实际风速数据对提出的机器学习模型进行了测试;Prasad等[22]针对水旱问题,利用数据挖掘技术提取与降水量关联度高的气象要素,基于GINI指数的决策树算法SLIQ(Supervisive Learning In Quest)构建降雨预报模型,具有分类规则的算法模型完全利用历史数据,深度挖掘大量数据库的隐藏信息,预测降水量的准确率达到72.3%;Liu等[23]设计堆叠式自动编码器模拟30年每小时天气数据逐层细化原始天气数据的特征,并利用深度神经网络(DNN)模型对气象数据进行预测,能够以较高的预测精度地处理大量天气数据,该研究表明经典模型中使用新的表示特征可以在时间序列问题中获得更高的精度;Venkadesh等[24]应用遗传算法(GA)确定输入变量的最佳持续时段和分辨率并作为人工神经网络模型的前置输入,相较于传统GA方法加入神经网络后模型对未来 1、2、8、12小时的气温预测平均绝对误差(MAE)均有提高,研究表明引入ANN神经网络能够优化气温预测模型。
2 相关技术与理论介绍
2.1 时间序列预测方法
时间序列是按照时间顺序排列的一系列数据的集合,时序上的各个数值可以看作代表系统在不同时间点的动态特性,也可以看作是由非线性动力学方程在特定采样间隔内描述被控对象的一系列数据[37] 。常见的时间序列有股市波动、历史降水等。经过合理的函数变换,任何时间序列都可以转换为三个部分即:趋势项部分,周期项部分和随机噪声项部分[41]。
2.2 深度学习模型
2.2.1 LSTM 长短时记忆网络
长短时记忆网络(Long Short-Term Memory Network,LSTM)是循环神经网络(Recurrent Neural Network,RNN)的一个重要分支,具有RNN的优点并在其基础上进行改善。早期的DFN、CNN、BP等深度学习网络的输出都只考虑前一个输入的影响,而不考虑其它时刻输入的影响,对于简单的非时间序列和图像的分析有较好的效果,比如单个词语感情分类、乳腺癌检测等。但是,对于一些与时间先后有关的,比如本文研究的连续时间下一阶段气温预测等等,只考虑前一时刻输入的网络模型预测表现不佳[51] 。在DFN等简单的多层神经网络中,隐藏层之间各个节点分开工作、互不相关。而在RNN中,隐藏层各个节点之间会互相影响,各神经单元之间形成连接,呈现出动态时间序列行为[52] 。
循环神经网络RNN理论上可以处理任意长度的时间序列,如图2-4,但实际上,标准RNN模型在处理时间跨度较长的时序过程中,随着模型信息传递,最早的信息会失去效力,RNN无法建立远程结构连接,存在梯度消失或称梯度爆炸问题,可以通过设置超参数、修改激活函数、Dropout剪枝等方式改善。但这些方法无法从根本上解决RNN梯度消失问题因而精度提升效果较差,为解决时序长时依赖性问题,研究人员提出了基于RNN的长短时记忆网络LSTM [55] 。
3 基于格拉姆角场与图神经网络融合的气温预测 .............................. 20
3.1 问题描述 ......................................... 20
3.2 基于格拉姆角场的时序特征建模 ............................ 21
4 基于全局建模的MTGNN图神经网络的气温预测 ......................... 38
4.1 问题描述 ........................................ 38
4.2 面向气温预测的时空图神经网络设计 ........................................ 40
5 基于时空融合与图神经网络的气温预测系统设计与实现 .............. 52
5.1 需求分析 ....................................... 52
5.2 开发环境 .................................... 53
5 基于时空融合与图神经网络的气温预测系统设计与实现
5.1需求分析
气温预测系是将本文气温预测模型用于实际的应用中,该系统包含有用户管理模块、数据采集模块、数据处理模块、气温预测模块,用例图如5-1所示。
用户模块用来管理用户信息、用户登录和用户权限等,用户只有登录后才能使用气温预测系统。普通用户可以对自己的个人信息进行修改,也可以注销。管理员用户可以对普通用户的权限进行管理,控制普通用户的访问权限。数据采集模块主要通爬虫来采集天气数据,并且将采集到的数据预处理,使用Python自带库提供的填充函数对空值进行填充,然后储存到MySQL数据库中为后续的预测做好数据准备。气温预测模块利用本文中已经训练好的气温预测模型对未来一周的气温进行预测,并且通过可视化的图表页面进行展示,让用户可以清晰的掌握未来一周的气温情况。
6 结论与展望
气象时间序列具有时空多样性,具有非线性、时空尺度冲突性难以预测。为提出准确有效的温度预测方法,本文采用了深度学习方法来代替传统学习算法,通过时空特征融合气温预测框架,并在多元气温预测模型MTGNN模型中引入时序建模模块Transformer和非局部注意力机制,最后在加入长短时记忆神经网络LSTM等深度学习模型进行比较。通过分析多气温元素、时间滑窗和距离阈值对预测结果影响,以及各温度预测模型模型在不同时间和空间角度下对气温时间序列的预测表现探究更加准确有效的气温预测算法。接下来对本文的主要内容进行总结:
在第一章中,首先分析目前气温预测研究的重要背景,阐述气温预测研究的重要意义。接着分析国内外气温预测研究的现状,最后确定本文研究的主要问题。
在第二章中,对气温预测的主要方法进行简要介绍,分析各方法的主要优势和缺陷,针对本文采用的主要算法所需要的基础知识进行介绍,并对本文对比的基准方法进行详细介绍。
在第三章中,为了解决多维数据中空间数据与气温的时序数据进行有效的融合,提出了一种时空特征融合框架。该框架首先基于格拉姆角场将气温数据转换到二维空间中,然后利用基于残差学习的卷积神经网络提取时序特征并作为图的节点特征。然后将距离信息作为图的边特征,最终采用图神经网络预测目标城市未来的气温数据。通过与基准方法相比,证明了提出方法的有效性和优越性。最后探究了不同时间窗口的数据对气温预测结果的影响,结果表明了时间窗口长度为5的时候模型表现最佳。
在第四章中,针对目前多变量的气温数据,采用基于MTGNN的多变量图神经网络作为气温预测的基准模型。为了解决模型在时间序列上建模时序特征能力弱的问题,引入了基于Transformer模型的时序建模单元,并采用非局部神经网络建模长距离特征之间的关联关系,挖掘气温变化的潜在规律。最后在6个城市的气温数据上进行消融实验证明了改进的MTGNN模型在气温预测上具有显著的优势。
参考文献(略)