文档介绍:基于深度LSTM神经网络的大气可降水量估算模型
摘要:基于深度长短期记忆(LSTM)神经网络,分别利用地面气象多要素(气温、气压、露点温度、相对湿度、水汽压、小时降水量)和单要素(水汽压)建立怀化地区GPS大气可降水量估算模型between the estimation precision of the models and altitude of the stations.
Key words: LSTM; GPS/MET; atmospheric precipitable water vapor; estimation model; Huaihua area
水汽在大氣中含量虽少,却影响着能量传输、辐射平衡和成云致雨等大气物理化学过程,是大气的重要组成部分,是天气变化和气候演变的主要驱动力,也是影响灾害性天气形成和发展的关键性因子[1]。实际应用中,一般采用大气可降水量(Precipitable water vapor,PWV),即单位面积大气柱内水汽量来表示大气水汽含量[2]。但大气水汽变化迅速,时空分布较为复杂,作为国内气象部门常规探测手段的无线电探空限于站网分布和观测时次,资料时空分辨率较低[3]。利用全球导航卫星系统(GPS)进行大气水汽探测技术的出现弥补了常规探测手段的不足,其探测精度达毫米级,可提供全天候、高分辨率的水汽信息[4-6]。基于GPS反演的可降水量可以反映特定区域水汽流入、流出情况,因此广泛应用于气象数据融合、数值预报和降水研究及预报等方面[7-9]。湖南省气象局与湖南省国土资源厅合作建设GPS/MET探测网,截至2015年共71个站点建成并投入业务运行,为湖南省天气预报、气候预测及气象防灾减灾提供更高时空分辨率的水汽场。但相较于湖南省近22万km2土地面积,观测站数量仍相对较少,大多数地区无法直接探测得到大气可降水量,因此有必要利用站网密度更大、时间序列更长的地面气象资料估算大气可降水量。国内外相关研究表明,地面气象要素与可降水量之间存在明显相关性,可利用地面气象要素对可降水量进行估算[10-12]。但相关研究一般利用水汽压与可降水量进行线性拟合或二次多项式建模,未考虑地面气象要素与可降水量时间序列上的相关性。20世纪80—90年代,循环神经网络(RNN)能以很高的效率对序列的非线性特征进行学忆神经网络(LSTM)因可有效解决简单RNN的梯度爆炸或消失问题,使其在气象相关时间序列建模和预测方面得到广泛应用[13-16]。本研究基于深度LSTM神经网络模型,利用湖南省怀化市地面气象数据对GPS可降水量进行建模,以改进地面气象要素估算大气可降水量精度。 1 资料与方法
资料选取
本研究选用湖南怀化地区沅陵、溆浦、靖州和通道4个GPS/MET观测站逐小时资料和地面气象观测逐小时资料(观测站位置、海报高度等信息如表1所示),数据时间为2017年1月1日至2017年12月31日。怀化地处湘中丘陵向云贵高原的过渡地带,属中亚热带季风气候区,四季分明,雨量充沛,且雨热同步,对农作物生长有利。但受地形影响,地域差异和垂直差异明显,旱涝等自然灾害时有发生。所有数据均由全台(CIMISS)上获取。考虑到地域性差异,在GPS/MET站探测得到天顶总延迟(ZTD)的基础上,采用本地化的静力延迟模型[5]和加权平均温度模型[6]反演4个观测站的GPS可降水量。
根据大气科学相关知识,对GPS可降水量与各地面气象要素[气温(T)、气压(P)、露点温度(DP)、相对湿度(RH)、水汽压(VAP)和小时降水量(OHP)]进行相关性检验,并计算相关系数如表2所示。由表2可知,除气压外,可降水量与气温、露点温度、相对湿度、水汽压和小时降水量均呈正相关,,。考虑到相关研究[7-9]表明降水与可降水量存在时间上的关联性,初步确定特征向量Xt=[x , x ,…,x ]T,其中x ~x 分别为T、P、DP、VAP和OHP,t为某一特定时刻。考虑时间窗为48 h,即利用过去47 h和当前时刻的特征向量序列X={x(t-47), x(t-46),…,x(t)}作为输入,建模当前时刻的可降水量Y={y(t)}。
长短期记忆神经网络(LSTM)
与简单RNN相比,LSTM能够捕获任意长度时间序列的自回归结构,其在序列建模任务中取得了广泛的成功[17-19]。LSTM单元结构如图1所示,it,ft和ot分别为输入门、输出门和遗忘门3种门控,ct为单元间激活向量,ht为存储了t时刻及之前时刻有用信息的隐状态向量,其计算公式依次为式(1