热带气象学报  2020, Vol. 36 Issue (1): 97-107  DOI: 10.16032/j.issn.1004-4965.2020.010
0

引用本文  

张天虎, 鲍艳松, 钱芝颖, 等. 基于BP神经网络与遗传算法反演大气温湿廓线[J]. 热带气象学报, 2020, 36(1): 97-107.  DOI: 10.16032/j.issn.1004-4965.2020.010.
ZHANG Tian-hu, BAO Yan-song, QIAN Zhi-ying, et al. Atmospheric temperature and humidity profile retrievals based on bp neural network and genetic algorithm[J]. JOURNAL OF TROPICAL METEOROLOGY, 2020, 36(1): 97-107.  DOI: 10.16032/j.issn.1004-4965.2020.010.

基金项目

国家重点研发计划(2017YFC15017043、2016YFA0600703);江苏省研究生科研创新计划项目(KYCX18_1026)共同资助

通讯作者

鲍艳松,男, 安徽省人,教授, 博士研究生导师, 主要从事卫星遥感及资料同化研究。E-mail: ysbao@nuist.edu.cn

文章历史

收稿日期:2019-02-18
修订日期:2019-07-28
基于BP神经网络与遗传算法反演大气温湿廓线
张天虎 1,2, 鲍艳松 1,2, 钱芝颖 1,2, 林利斌 3, 刘旭林 4, 李林 4, 侯岳 5, 雷红玉 5, 李广文 5, 马军 5, 管琴 6, 唐维尧 1,2     
1. 南京信息工程大学气象灾害预报预警与评估协同创新中心/中国气象局气溶胶与云降水重点开放实验室,江苏 南京 210044;
2. 南京信息工程大学大气物理学院,江苏 南京 210044;
3. 深圳航空有限责任公司,广东 深圳 518101;
4. 北京市气象探测中心,北京 100089;
5. 格尔木市气象局,青海 格尔木 816099;
6. 青海省气象台,青海 西宁 811000
摘要:为提高地基微波辐射计大气探测精度,融合BP神经网络与遗传算法,研究0~10 km大气温湿度廓线。首先,结合数据特征,基于数值模拟技术,建立一套TP/WVP-3000型号地基微波辐射计的一级数据质量控制和订正模型。然后,为减小训练样本代表性误差对模型反演精度的影响,利用遗传算法优化训练样本数据,建立一套精度更高的神经网络大气温湿度反演模型。最后,利用构建的反演模型,开展大气温湿度反演试验,结合探空资料和微波辐射计二级产品,评价反演模型精度。研究结果表明:(1)经过质量控制后的实测数据与模拟数据之间的相关性有显著提升;(2)经过质量控制与订正后建立的神经网络模型对比原微波辐射计二级产品的反演精度有一定提升,温度提升6.77%,湿度提升20.11%;(3)经过遗传算法优化后的训练样本所建立的神经网络反演模型对比原微波辐射计二级产品反演精度有进一步的提升,温度提升10.21%,湿度提升23.75%,反演结果与该地区同类型研究结果相比有着较大提升。
关键词微波辐射计    遗传算法    BP神经网络    大气廓线    质量控制    
ATMOSPHERIC TEMPERATURE AND HUMIDITY PROFILE RETRIEVALS BASED ON BP NEURAL NETWORK AND GENETIC ALGORITHM
ZHANG Tian-hu 1,2, BAO Yan-song 1,2, QIAN Zhi-ying 1,2, LIN Li-bin 3, LIU Xu-lin 4, LI Lin 4, HOU Yue 5, LEI Hong-yu 5, LI Guang-wen 5, MA Jun 5, GUAN Qin 6, TANG Wei-yao 1,2     
1. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters, Key Laboratory for Aerosol-Cloud-Precipitation of China Meteorological Administration, Nanjing University of Information Science & Technology, Nanjing 210044, China;
2. School of Atmospheric physics, Nanjing University of Information Science and Technology, Nanjing 210044, China;
3. Shenzhen Airlines, Shenzhen 518101, China;
4. Beijing Municipal Meteorological Observation Center, Beijing 100089, China;
5. Geermu Meteorological Bureau of Qinghai Province, Geermu 816099, China;
6. Qinghai Meteorological office, Xining 810001, China
Abstract: In order to improve the sounding accuracy of ground-based microwave radiometer, the atmospheric temperature and humidity profiles of 0-10km are studied by combining BP neural network and genetic algorithm. Firstly, based on numerical simulation technology, a set of level 1 data's quality control and correction model of TP/WVP-3000 ground-based microwave radiometer is established. Then, in order to reduce the influence of training sample errors on the accuracy of retrieval model, genetic algorithm is used to optimize training sample data, and a set of more accurate neural network to retrieve atmospheric temperature and humidity is established. Finally, the model is used to carry out atmospheric temperature and humidity retrieval experiments, and then experiment results are combined with sounding data and microwave radiometer's level 2 data to evaluate the accuracy of the retrieval model. Results show that: (1) the consistency between the measured data and the simulated data after quality control is significantly improved; (2) Compared with the level2 data of microwave radiometer, the retrieval accuracy of the neural network model after quality control and correction has a certain improvement, including a 6.77% improvement in temperature and a 20.11% improvement in humidity; (3) Compared with the level2 data of microwave radiometer, the retrieval accuracy of the neural network retrieval model based on the genetic algorithm optimized training sample has a further improvement, including a 10.21% improvement in temperature improved and a 23.75% improvement in humidity. Slightly superior results are achieved with our algorithm.
Key words: microwave radiometer    genetic algorithm    BP neural network    atmospheric profile    quality control    
1 引言

良好的大气温湿廓线信息在推动数值天气预报、气象保障,甚至气候变化研究中扮演着举足轻重的作用[1]。探空气球可以提供较精确的大气温湿廓线信息,但其低时空分辨率特征不能完全满足现代气象发展需求。由此,许多其他探测手段得以发展,如卫星遥感技术可弥补探空站点覆盖不足的缺陷,而由于地基微波辐射计的被动遥感探测特性,可实现全天候无人值守的探测能力,并且能够提供极高的时间分辨率与高垂直空间分辨率的大气温湿廓线信息,所以应用范围越来越广。在对地基微波辐射计的质量控制方面,朱雅毓等[2]对地基微波辐射计亮温数据进行了极值检验、时间一致性检验、辐射传输模式检验和多通道亮温交叉检验并分析其应用效果;郭伟等[3]在地基微波辐射计资料处理系统中按照自动气象站的数据质量控制方法进行改进;敖雪等[4]对一台MP-3000A型微波辐射计做了亮温一致性分析与质控工作;李青等[5]对一台微波辐射计进行了亮温分析与线性订正工作,都表明了针对地基微波辐射计一级数据的质量控制工作的必要性与可行性;Sánchez等[6]提出了针对MP-3000A型地基微波辐射计的沿高度层进行质量控制的方案,获得更加精确的大气廓线;李娜等[7]对一台微波辐射计二级数据与探空资料进行对比分析,评价其探测性能与反演精度,并对二级数据进行偏差订正,结果显示订正后的反演数据更加接近探空数据。

地基微波辐射计的大气温湿反演算法主要有前向模型反演算法、回归算法、神经网络方法等[8-9]。其中,神经网络方法由于其较强的非线性拟合能力以及较快的运算速度,已经广泛应用于微波辐射计的反演工作中。Yang等[10]利用人工神经网络法,反演了晴空大气湿度廓线,证明了人工神经网络较强的非线性拟合能力,可用于反演晴空大气温湿廓线。黄兴友等[9]分别使用多元线性回归方法与BP神经网络方法,反演了大气温度与水汽密度,结果表明神经网络方法的反演精度更高。刘亚亚等[11]使用BP神经网络法对北京一台12通道地基微波辐射计进行再反演工作,发现相较于微波辐射计自带的神经网络反演程序,结果更接近探空值。曹雪芬等[12]针对南京一台MP-3000A型地基微波辐射计,建立了本地化大气温湿廓线反演模型,提高了反演精度。Bao等[13]对微波辐射计一级数据进行质量控制与订正之后,通过神经网络法反演大气温湿廓线,得到较好的结果。张容容[14]使用BP神经网络法反演大气参数过程中,引入遗传算法对网络初始权值等参数进行优化,使得神经网络的输出更加逼近最优解,取得良好效果。

由于BP神经网络法较强的非线性拟合能力,神经网络法在地基微波辐射计反演工作中的应用使得反演精度有一定的提升。目前关于地基微波辐射计使用神经网络法反演大气廓线的研究,一般使用探空数据与辐射传输模式模拟亮温,将模拟亮温与探空数据用于建立反演模型。但用于建模的探空数据、辐射传输模式等都存在一定的误差,而且一些数据的误差可能非常大;而基于神经网络建立的反演模型很大程度上受训练样本的影响。本文即针对这个问题,探讨是否能够寻求一种优化算法,从训练样本中挑选更适合建模的样本,参加神经网络训练。遗传算法是根据进化论和遗传学机理提出的一种搜索算法,具有很强的优化能力,并有广泛的应用[15-18]。本文将结合遗传算法,优化训练样本数据以构建人工神经网络反演模型,研究大气温湿度廓线反演方法。

2 数据介绍与样本构建

本文所使用的数据资料包括国家重点研发计划(“超大城市垂直综合气象观测技术研究及试验”)第四课题组提供的2017年1—12月的北京南郊观象台TP/WVP-3000型号微波辐射计level1数据包括测雨传感器数据,地面温度、相对湿度与压强数据,各通道亮温数据,其中用于探测大气中水汽的吸收通道中心频率在22.24~30.00 GHz之间,用于探测大气温度的氧气吸收通道中心频率在51.25~58.80 GHz之间;level2数据包括0~10 km的47个高度层的温度、相对湿度数据,其中0~1 km范围内每100 m设一层,1~10 km范围内每250 m设一层;2013—2017年无线电探空资料(不包含雨天)下载自美国怀俄明州立大学探空数据库。其中,微波辐射计在12个月的观测期间,每3个月进行一次液氮标定,观测状态良好。

正向辐射传输模式使用由美国大气环境研究室(Atmospheric and Environmental Research,AER)提供的MONORTM (Monochromatic Radiative Transfer Model, MONORTM)辐射传输模式。该模式可模拟一个或几个单色波长的辐射传输,在微波波段与毫米波段尤其适用[9]。本文将2013—2017年的探空数据先进行质量控制,剔除一些探测层数过少的样本,将经过质量控制之后的样本数据输入到MONORTM中,得到模拟亮温值。一般情况下,在有云情况下还需输入液态水信息,但常规探空资料中并没有该信息。前人研究结果表明,当相对湿度 < 85%时,则认为无云,液态水浓度为0 g/m3;当相对湿度 > 95%时,液态水浓度取0.5 g/m3;当相对湿度在85%~95%时,假设液态水浓度与相对湿度满足线性关系[19]。其中,2013—2016年模拟的亮温与对应的探空资料一共2 220对,用于建立反演模型。2017年的模拟亮温用于微波辐射计一级数据的质量控制与订正。

2.1 一级数据的质量控制 2.1.1 质量控制方案

结合地基微波辐射计的观测方式与特点,建立一套1级数据质量控制方案,该方案包括雨/非雨检验、极值检验、连续性检验、辐射传输模式检验[2, 20],具体顺序如图 1所示。

图 1 质量控制流程图

地基微波辐射计1级数据质控方法具体如下。

(1) 雨/非雨检验。雨天条件下微波辐射计难以进行有效探测[21-22],并且雨天的亮温难以正确模拟,所以有降水发生时的亮温数据需要剔除。在微波辐射计一级数据中包含“rain”字段,“0”代表无降水,“1”代表有降水。如果该字段显示“1”,则予以剔除。

(2) 极值检验。实际使用过程中,发现有个别亮温数据异常大,有的甚至超过500 K,本文将亮温阈值设置为350 K,任何一个通道有超过此阈值的予以剔除。

(3) 时间平滑性检验。地基微波辐射计观测是连续的,而且时间分辨率极高,达到1 min/次,在如此短的时间范围内假设气象要素是连续且变化不大的,因此,微波辐射计接收到的亮温变化幅度也是连续且变化不大的。针对地基微波辐射计各通道数据,将每日00时与12时(除标注外为世界时,下同)及其前后10个时刻的样本的亮温值分别拟合直线,各个样本数据与直线上对应数据求得均方根误差ε,将任一通道存在差值大于3 ε的样本予以剔除。

(4) 辐射传输模式检验。对于晴空条件下微波辐射计观测,观测亮温与模拟亮温应该具有很好的一致性。试验中,基于探空资料,利用MONORTM模式模拟微波辐射计亮温值,结合实测数据,求算亮温均方根误差ε。对于观测误差大于3 ε的观测值,认为是异常值,予以剔除。

2.1.2 质量控制结果

本研究使用北京南郊观测站微波辐射计2017年整年的00时和12时数据,去掉缺测值共计724个。对全样本的分项质量控制结果如图 2所示,各个质量控制方案都有一定的效果,数据可用率为76%。各质量控制方案除了雨/非雨检查之外,质控效果最明显的是辐射传输模式检查,共剔除27个“不合格”样本。

图 2 各个方案质控结果

表 1给出各个通道的质量控制前后(不含雨天)的实测亮温与模拟亮温的相关系数R2,可看到质量控制后各个通道的实测亮温与模拟亮温相关性整体上都优于质量控制前,尤其第4~7通道最明显。

表 1 质控前后各通道模拟亮温与观测亮温相关系数

图 3为第4~7通道的质控前后实测亮温与模拟亮温散点图,相比较质量控制之前(图 3a~3d)的实测数据,质量控制后(图 3e~3h)各个通道的实测数据与模拟数据之间的一致性都得到了一定的提高。可看到,该质量控制方案对30 GHz与51 GHz附近通道实测数据与模拟数据的相关性提升较大。可能的原因是第4~7通道接收亮温受液态水影响较大,而本文正演模拟过程中输入的液态水含量是根据经验公式添加,所以会带来一定的误差。

图 3 第4~7通道质控前后的实测亮温与模拟亮温对比 a~d.第4~7通道质控前观测亮温与模拟亮温; e~h.第4~7通道质控后观测亮温与模拟亮温。
2.2 亮温的偏差订正

虽然质量控制后,实测亮温与模拟亮温之间相关性得到提升,但是从图 3可看出,实测数据与模拟数据之间还是存在一定的系统偏差。由于神经网络建模使用的是模拟亮温数据,而大气温湿廓线反演时所用的是实测数据,两者存在系统偏差。所以,需要对实测的亮温数据进行偏差订正[13]表 2给出了地基微波辐射计12个通道1级亮温数据的订正模型,这些模型将用于实测数据的偏差订正。

表 2 各通道实测亮温与模拟亮温线性拟合方程
3 反演模型构建 3.1 神经网络模型构建

本文所使用的反演方法为BP人工神经网络方法,该方法已在大气温湿度反演中得到很好的应用[11]。本文所用的模型为单隐层神经网络,输入层共有15个节点,分别为12个通道的亮温与微波辐射计自带的传感器测得的地面温度、相对湿度、气压信息。输出层共47个节点,对应0~10 km的大气温度、相对湿度。其中,0~1 km每100 m分一层,1~10 km每250 m分一层。神经网络的性能的好坏很大程度上受隐含层节点数与传递函数的影响。tansig函数具有将负无穷到正无穷大范围的数映射到(-1,1)之间,具有非线性的映射功能,但是tansig函数会将输出限制在一个很小的范围内,所以通常隐层的激活函数设置为tansig而输出层不适用[14],但由于本试验在训练之前已经将训练样本进行归一化处理了,所以隐层和输出层都可设置为tansig。隐含层节点数的选取,目前还没有一套成熟的理论来确定,一般根据经验公式结合多次试验确定的[11]。本文中的隐含层节点数目,结合以往的研究并且经过多次实验,设置为15[9, 23]。通过训练,输入实测的亮温与地面信息,就可得到对应高度层的大气温度、相对湿度信息。

3.2 训练数据的筛选——遗传算法

2013—2017年北京南郊站点共计2 815个非雨天亮温数据样本;其中,2017年的数据用作质量控制与构建订正模型,不参与训练,所以训练数据共计2 220个。BP神经网络模型的精度很大程度上受训练数据的影响,无论是探空资料,还是添加液态水的经验公式,甚至辐射传输模式都带有一定的误差。所以,需要从样本中挑选一些质量较好的样本参与训练,如果训练样本的质量够好,那么用这些样本训练而得到的神经网络模型也会更加精确。

随着研究的深入,人们在处理很多复杂的问题时逐渐感觉到想要完全精确地求得最优解是不现实的,很多情况下,我们只需要得到可行解即可。而遗传算法(Genetic Algorithm,GA)是模拟生物在自然环境中遗传与进化过程的一种自适应的全局优化概率搜索算法,可在迭代过程中自发地搜索到可行解。遗传算法是一种启发式的随机搜索算法,适合解决传统方法难以解决的一些非线性问题或复杂问题,在组合优化、机器学习、自适应控制等领域得到广泛应用。本文将使用一种遗传算法与神经网络相结合的方法去搜索筛选训练样本,得到600个(经过试验取得)“高质量”的训练样本,从而构建更精确的反演模型。

3.2.1 遗传算法设计

(1) 编码:采用实数编码,将2 220个训练样本编号为1~2 220,每个编号对应一组训练数据(探空与模拟亮温),即一个基因。

(2) 个体、种群:每个个体包含600个基因;种群大小设置为20。

(3) 选择算子:轮盘赌法。

(4) 交叉概率、交叉算子:交叉概率为0.8,因为本研究中,基因的顺序不影响结果,但是要避免重复,所以交叉方式为把两个个体的基因打乱、融合、去重,再选出600个。

(5) 变异概率、变异算子:变异概率为0.05,变异方式为,把自己30%的基因替换掉,从基因库(即2 220个基因)中挑选不与自己重复的补齐。

(6) 适应度函数:本文采用的适应度函数是用个体中所包含的基因(训练样本的编号)对应的训练样本去建立10个神经网络模型,用给定的测试样本去验证模型精度,根据公式(1)求得10个模型的测试均方误差(MSE)的平均值,误差越小则适应度越高。由于建立神经网络模型费时较长,采取的方法是先用全样本训练一个神经网络反演模型,每次计算个体适应度的时候只需要在此网络基础上继续进行,在迭代一定次数之后,被选基因可能会“适应”当前的神经网络,发生“早熟”现象而陷入局部最优解。面对这种情况,本文选择换用当前最优个体中的基因再建立一个较好的神经网络反演模型替代之前的模型。更好的训练样本可训练出更精确的模型,这样既可加快迭代速度,又可避免“早熟”现象发生。在选择神经网络训练函数时,建议选择“traingda”、“traingdx”、“trainscg”等快速训练法。为了进一步加快训练,这里的隐含层节点数可选择少一些,本文经过试验选择为6个。终止条件设置为连续10次训练误差不下降。这样可节省计算资源,减少每次迭代所需的时间。

(1)

式中,A矩阵为神经网络模型反演结果,B矩阵为实测结果,其中m为测试样本个数,n为输出层数,即47。

3.2.2 遗传算法效果分析

针对温度数据与相对湿度数据分别进行两次优化,记录了每次迭代后最优个体的适应度。由于迭代次数较多,展示每20轮迭代中各个最优个体适应度的平均值与迭代次数的关系,如图 4所示。

图 4 最优个体适应度随迭代次数变化

针对温度数据的试验如图 4a,共迭代1 000次。最优个体均方误差(MSE)由初代的5.57左右下降到了末代5.24,起到了明显的优化作用。其中,前50次迭代优化效果较明显,50次迭代后虽有波动,但是总体呈现下降趋势。另外可看到在第880次左右误差又有一次较大的下降,这是因为在此处按照3.3.1节中所述方法更新了适应度函数中的神经网络反演模型,使结果跳离了局部最优解,得到进一步的优化。针对相对湿度数据的试验如图 4b共迭代了1 100次,最优个体的均方误差(MSE)由初代的264.5左右下降至末代的245.5左右,同样起到明显的优化作用。与温度数据类似,前几十次迭代的优化效果明显,但是之后的迭代虽然同样呈现下降趋势,但优化提升较小。考虑到可能是发生“早熟”现象而陷入局部最优解,所以在第800次迭代时更新了适应度函数中的神经网络反演模型,所以后续结果得到较大幅度优化。

4 反演结果分析

基于已有数据建立两套BP神经网络(Back Propagation Neural Network,BPNN)反演模型,一套是使用全部训练样本建立BP神经网络反演模型(ALL-BPNN),另一套则是使用遗传算法(Genetic Algorithm,GA)优化搜索出的600组训练样本建立的BP神经网络反演模型(GA-BPNN)。为了避免其他因素影响对比结果,模型的网络结构、参数设置都一样。除此之外,神经网络的建立存在随机性,所以使用两组数据分别训练建立多个神经网络反演模型,各取其中反演效果最佳的模型进行对比试验。将经过质量控制后的551组亮温数据与对应时刻的地面要素(温度、相对湿度、气压)输入至建立好的两套神经网络反演模型中,分别得到两组551个时刻大气温湿廓线信息。以北京时间每天08时与20时探空气球所探测的大气廓线为真值,再分别计算了两套反演模型的反演结果和微波辐射计自带的二级产品与探空数据的平均偏差(Mean Bias,MB)与均方根误差(Root Mean Square Error,RMSE)。这里的平均偏差(MB)与均方根误差(RMSE)定义为:

(2)
(3)

式中,N为反演样本数即551,X表示反演得到的廓线,Y则代表探空廓线。

4.1 ALL-BPNN与LV2数据对比

图 5,红色实线表示微波辐射计自带二级产品的大气温度廓线平均偏差(MB),蓝色实线为使用全部训练样本建立的BP神经网络模型反演的大气温度廓线的平均偏差。红色“-+”线为微波辐射计自带二级产品的大气温度廓线的均方根误差(RMSE),蓝色“-+”线为使用全部训练样本建立的BP神经网络模型反演的大气温度廓线的均方根误差。

图 5 LV2数据与BPNN温湿廓线误差 a.温度廓线误差; b.相对湿度廓线误差。

从温度误差上,微波辐射计LV2数据的平均偏差在-1.7~1.1 K之间,而BP神经网络模型反演结果平均偏差在-0.6~0.2 K之间;微波辐射计LV2数据与BP神经网络模型反演结果的均方根误差变化趋势较一致,都随着高度增大而增加。误差范围都在1.0~4.3 K,但BP神经网络反演结果在绝大多数高度层上都低于微波辐射计LV2数据,尤其在近地面有较大提升。

从相对湿度误差上,微波辐射计LV2数据的平均偏差在-10%~26%之间。其中在3 km与8.5 km左右有较大的系统偏差,而BP神经网络模型反演结果平均偏差在±4%之间,相比较微波辐射计LV2数据有着较大的提升。均方根误差方面,由于微波辐射计自带的LV2数据的系统偏差,在3 km与8.5 km上的均方根误差都接近35%,而BP神经网络反演结果不存在较大系统偏差,均方根误差范围在4%~20%之间,并且在任意高度层上均方根误差都小于微波辐射计LV2数据。

4.2 GA-BPNN与ALL-BPNN对比

图 6,红色实线为使用全部训练样本建立的BP神经网络模型反演的大气相对湿度廓线的平均偏差,蓝色实线为使用遗传算法优化后的600个训练样本建立的BP神经网络模型反演的大气相对湿度廓线的平均偏差。红色“-+”线为使用全部训练样本建立的BP神经网络模型反演的相对湿度廓线的均方根误差,蓝色“-+”线为使用遗传算法优化后的训练样本建立的BP神经网络模型反演的大气相对湿度廓线的均方根误差。

图 6 GA-BPNN与全样本ALL-BPNN温湿廓线误差 a.温度廓线误差; b.相对湿度廓线误差。

从温度反演结果来看,GA-BPNN的反演结果在0~3 km平均偏差与ALL-BPNN的反演结果相差不大,但是在3~10 km高度上,GA-BPNN反演结果的平均偏差均小于ALL-BPNN。而从均方根误差显示结果来看,GA-BPNN的反演结果在0~10 km任意高度层上都小于全样本训练的BPNN的反演结果。

从相对湿度反演结果来看,GA-BPNN与ALL-BPNN反演结果的平均误差相差不大,都在±4%的范围之内。与温度结果类似,在均方根误差方面,GA-BPNN的反演的大气相对湿度廓线在0~10 km任意高度层上都小于ALL-BPNN的反演结果。

4.3 廓线个例对比

为了进一步验证神经网络模型的反演能力,选取了两个晴空时次(2017010100 UTC、2017020100 UTC),两个云天时次(2017041500 UTC、2017051500 UTC)进行个例对比(图 7图 8)。

图 7 温度廓线个例对比 a.2017010100 UTC晴; b.2017020100 UTC晴; c. 2017041500 UTC云; d.2017051500 UTC云。
图 8 相对湿度廓线个例对比 a. 2017010100 UTC晴; b. 2017020100 UTC晴; c. 2017041500 UTC云; d. 2017051500 UTC云。

图 7中可看出,三种反演结果与探空数据都比较接近,在一定程度上都能反映大气温度变化趋势。但是对逆温层的探测能力不足。GA-BPNN与ALL-BPNN走势较接近,可能是由于训练样本出自同一样本集。其中GA-BPNN的反演结果与探空最接近,其次是ALL-BPNN的反演结果。

图 8可看出,三种反演结果在近地面误差较小,高空反演结果较差。晴空条件下,GA-BPNN反演结果较好,与探空最接近,但是云天情况下,三种反演方法都不能够很好地反演大气相对湿度信息,但是GA-BPNN的反演结果仍能反映其变化趋势。另外,LV2数据在3 km与8.5 km容易偏大很多,这与4.1节中的LV2数据在3 km与8.5 km处存在较大系统偏差的结论相一致。

4.4 相关研究对比

地基微波辐射计反演廓线与探空廓线的对比,受到地理位置、气候条件等因素影响较大,而且不同型号的探测精度也不同。即使都是同型号,同一个地区的仪器,也因观测期间定标不同而探测精度也有所差异,所以没有进行比较。综合以上条件,只有文献[11]中的研究中所使用的仪器在型号地区上与本试验相同。

该文献中是分季节反演的,综合四个季节平均来看,大气温度方面其0~8 km各高度层均方根误差均大于本试验中的结果,8~10 km各高度层均方根误差略小于本试验结果。分季节来看,其结果中夏季的结果最佳,与本试验结果接近,春秋冬季节的结果绝大多数高度层误差均大于本试验结果。相对湿度方面,从其试验平均结果来看,其结果绝大多数高度层上均方根误差均大于本试验中的结果,分季节来看,其结果中冬季结果最佳,与本实验结果接近,春夏秋季的反演精度均低于本试验中的结果。

相比较温度反演结果而言,本实验中相对湿度的反演对比于该文献的提升较大,可能是因为模拟云天亮温时,都采用文献[19]中的假定,即相对大于85%判定有云,这种做法可能带来较大误差,但是本试验中又进行了一系列的质量控制,并且引入遗传算法优化了训练样本,可能减少了这方面的误差影响,所以在相对湿度反演方面,本文比文献[11]中结果提升得多。

5 结论

本文使用北京南郊2013—2017年的探空资料,结合MONORTM辐射传输模式亮温模拟技术对一台TP/WVP-3000型地基微波辐射计数据的亮温进行综合质量控制,继而基于质控后的亮温数据结合BP神经网络与遗传算法开展大气温湿廓线反演工作,得出以下结论。

(1) 地基微波辐射计的观测容易受到非气象因素影响,需要对其观测亮温进行质量控制,采用雨/非雨检查、极值检查、时间平滑性检查、辐射传输模式检查可起到一定的质量控制效果,经过质量控制后的亮温与模拟亮温的系统偏差更小,一致性更高,尤其是30 GHz与51 GHz附近通道质量控制效果明显。

(2) 通过对微波辐射计亮温的质量控制与偏差订正之后重新建立的大气温湿反演模型精度较微波辐射计自带的反演结果有一定提升,尤其是相对湿度反演结果提升显著。在0~10 km上,温度探测精度提升了约6.77%,相对湿度探测精度提升约20.11%。

(3) 由于BP神经网络模型的精度受训练样本影响较大,使用经过遗传算法优化后的训练样本建立的BP神经网络反演模型精度有进一步的提高。相比微波辐射计二级数据,在0~10 km上,温度探测精度提升了约10.21%,相对湿度探测精度提升约23.75%。反演结果与该地区同类型研究结果相比,精度在绝大多数高度层上都有较大的提升,尤其是相对湿度的提升较大。但是这里所使用的遗传算法计算量较大,需要对适应度函数进行优化调整,以加快迭代速度。

(4) 虽然遗传算法挑选出的训练样本的确是能够使模型更加精确,但是具体评价训练样本好坏的标准却仍难以解释。可能被挑选出的训练样本只是更加契合3.2.1中所述的预训练模型,能够使其跳出局部最优解,逼近最优解。今后将针对此问题进行深入研究。

参考文献
[1]
王颖, 黄勇, 黄思源. 大气温湿廓线反演问题的研究[J]. 国土资源遥感, 2008, 20(1): 23-26.
[2]
朱雅毓.地基微波辐射计数据的综合质量控制与效果分析[D].南京: 南京信息工程大学, 2014.
[3]
郭伟, 王振会, 孙安平, 等. 地基微波辐射计网络资料处理系统设计及实现[J]. 气象, 2010, 36(4): 120-125.
[4]
敖雪, 王振会, 徐桂荣, 等. 微波辐射计亮温观测质量控制研究[J]. 气象科学, 2013, 33(2): 130-137.
[5]
李青, 胡方超, 楚艳丽, 等. 北京一地基微波辐射计的观测数据一致性分析和订正实验[J]. 遥感技术与应用, 2014, 29(4): 547-556. DOI:10.11873/j.issn.1004-0323.2014.4.0547
[6]
SÁNCHEZ J L, POSADA R, GARCíA-ORTEGA E, et al. A method to improve the accuracy of continuous measuring of vertical profiles of temperature and water vapor density by means of a ground-based microwave radiometer[J]. Atmos Res, 2013, 122(3): 43-54.
[7]
李娜, 张武, 陈艳, 等. 基于微波辐射计的大气温湿廓线遥感探测[J]. 兰州大学学报:自然科学版, 2015, 51(1): 61-71.
[8]
WANG Z, LI Q, HU F, et al. Remote sensing of lightning by a ground-based microwave radiometer[J]. Atmos Res, 2014, 150(1): 143-150.
[9]
黄兴友, 张曦, 冷亮, 等. 基于MonoRTM模型的微波辐射计反演方法研究[J]. 气象科学, 2013, 33(2): 138-145.
[10]
YANG L, GUAN LI. Study on the inversion of clear sky atmospheric humidity profiles with artificial neural network[J]. Meteorological Monthly, 2011, 37(3): 318-324.
[11]
刘亚亚, 毛节泰, 刘钧, 等. 地基微波辐射计遥感大气廓线的BP神经网络反演方法研究[J]. 高原气象, 2010, 29(6): 1 514-1 523.
[12]
曹雪芬.地基微波辐射计亮温观测数据处理及对闪电高温的响应探讨[D].南京: 南京信息工程大学, 2013.
[13]
BAO Y S, CAI X, QIAN C, et al. 0~10 km temperature and humidity profiles retrieval from ground-based radiometer[J]. J Trop Meteor, 2018, 24(2): 243-252.
[14]
张容容.基于BP神经网络的多通道微波辐射计大气参数反演算法[D].武汉: 华中科技大学, 2017.
[15]
武广号, 文毅, 乐美峰. 遗传算法及其应用[J]. 应用力学学报, 2000, 23(6): 9-10.
[16]
丁霞, 黄兴友, 王海涛. 太赫兹频段雷达探测的冰云微物理参数反演算法模拟研究[J]. 热带气象学报, 2019, 35(1): 63-72.
[17]
张诚忠, 薛纪善, 冯业荣, 等. 基于贝叶斯方案的雷达反射率反演水汽及其同化试验[J]. 热带气象学报, 2019, 35(2): 145-153.
[18]
肖辉, 万齐林, 刘显通, 等. 基于WRF-EnKF系统的雷达反射率直接同化对台风"天鸽"(1713)预报的影响[J]. 热带气象学报, 2019, 35(4): 433-445.
[19]
王振会, 徐培源, 邓军, 等. 三通道微波辐射计遥感大气中水汽、液水和电长度增量的数值实验[J]. 大气科学学报, 1995, 18(3): 396-403.
[20]
杨贤为. 气候应用专用数据库气象资料的质量检验[J]. 气象, 1998, 24(12): 33-36.
[21]
张文刚, 徐桂荣, 廖可文, 等. 降水对地基微波辐射计反演误差的影响[J]. 暴雨灾害, 2013, 32(1): 70-76.
[22]
魏重, 雷恒池, 沈志来. 地基微波辐射计的雨天探测[J]. 应用气象学报, 2001, 12(z1): 65-72.
[23]
鲍艳松, 钱程, 闵锦忠, 等. 利用地基微波辐射计资料反演0~10 km大气温湿廓线试验研究[J]. 热带气象学报, 2016, 32(2): 163-171.