热带气象学报  2020, Vol. 36 Issue (3): 416-432  DOI: 10.16032/j.issn.1004-4965.2020.039
0

引用本文  

姚乐宝, 王东海, 张宇, 等. GSI同化系统的背景误差协方差特征及对预报的影响[J]. 热带气象学报, 2020, 36(3): 416-432.  DOI: 10.16032/j.issn.1004-4965.2020.039.
YAO Le-bao, WANG Dong-hai, ZHANG Yu, et al. Background error covariance characteristics based on gsi assimilation system and its effect on prediction results[J]. JOURNAL OF TROPICAL METEOROLOGY, 2020, 36(3): 416-432.  DOI: 10.16032/j.issn.1004-4965.2020.039.

基金项目

国家自然科学基金项目(41861164027);广东省科技计划(20170244);国家自然科学基金项目(41775097);广东省科技计划(2017B020218003)共同资助

通讯作者

王东海,男,广东省人,教授,主要从事中小尺度天气动力学、热带对流系统、数值天气预报、数值模拟和气象资料同化及分析应用方面的研究。E-mail: wangdh7@mail.sysu.edu.cn

文章历史

收稿日期:2019-12-20
修订日期:2020-02-18
GSI同化系统的背景误差协方差特征及对预报的影响
姚乐宝 1,5, 王东海 2, 张宇 3, 沈丹 4, 李国平 1     
1. 成都信息工程大学大气科学学院,四川 成都 610225;
2. 中山大学大气科学学院/广东省气候变化与自然灾害研究重点实验室/南方海洋科学与工程广东省实验室,广东 珠海 519082;
3. 广东海洋大学大气科学学院,广东 湛江 524094;
4. 内蒙古自治区气象台,内蒙古 呼和浩特 010051;
5. 根河市气象局,内蒙古 呼伦贝尔 022350
摘要:在同化系统中使用更合理的背景误差协方差对于得到更良好的同化效果至关重要。首先采用NMC方法针对中国区域构建更适合WRF-ARW区域预报系统的B矩阵,并对比分析了其与GSI同化系统预设的NCEP预报系统的B矩阵在分析变量间的平衡关系、分析控制变量的标准差、水平和垂直特征尺度等方面的特征差异。参照这些特征差异设计单点观测试验、背景误差协方差调优参数敏感性试验,确定针对中国区域构建B矩阵的最佳调优参数。并讨论其对一次季风低压强降水天气过程的循环同化和预报效果的影响。结果表明,采用最佳调优参数使用针对中国区域构建B矩阵的试验(Sen6)对V风分量场和相对湿度场的预报性能改进显著,同时也引出了GSI同化系统背景误差协方差参数调优(尤其是水平特征尺度参数调整)的两难问题。在此基础上,采用Hybrid同化方法使用针对中国区域构建B矩阵的循环同化试验(Hyb3)可以进一步改善预报效果,并在一定程度上修正个例模拟雨带的位置。
关键词资料同化    GSI同化系统    背景误差协方差    
BACKGROUND ERROR COVARIANCE CHARACTERISTICS BASED ON GSI ASSIMILATION SYSTEM AND ITS EFFECT ON PREDICTION RESULTS
YAO Le-bao 1,5, WANG Dong-hai 2, ZHANG Yu 3, SHEN Dan 4, LI Guo-ping 1     
1. School of Atmospheric Sciences, Chengdu University of Information Technology, Chengdu 610225, China;
2. School of Atmospheric Sciences/ Guangdong Province Key Laboratory for Climate Change and Natural Disaster Studies/Southern Marine Science and Engineering Guangdong Laboratory, Sun Yat-sen University, Zhuhai, 519082, China;
3. School of Atmospheric Sciences, Guangdong Ocean University, Zhanjiang, 524094, China;
4. Inner Mongolia Autonomous Region Meteorological Centre, Hohhot 010051, China;
5. Genhe Meteorological Bureau, HulunBuir 022350, China
Abstract: To improve assimilation results, a more reasonable background error covariance is crucial for the assimilation system. In this paper, first, the NMC method is adopted to construct a B matrix that is more suitable for the WRF-ARW regional prediction system for the Chinese region. Then the characteristics of the B matrix and the NCEP prediction system preset by the GSI assimilation system are compared and analyzed. The single-point observation test and background error covariance tuning parameter sensitivity test are designed with reference to the differences in their characteristics to determine the optimal tuning parameters for the development of B matrix for the Chinese region. The results show that the Sen6 experiment with the optimal tuning parameters and the B matrix constructed for the Chinese region has the best prediction effect. In particular, the prediction performance of V wind component field and relative humidity field has been improved significantly. At the same time, the dilemma of background error covariance parameter adjustment (especially horizontal length scale parameter adjustment) in the GSI assimilation system is also introduced. On this basis, the Hyb3 cyclic assimilation experiment with hybrid assimilation method and B matrix constructed for the Chinese region can further improve prediction results, and to some extent, the location of the simulated rain belt is modified.
Key words: data assimilation    GSI assimilation system    background error covariance    
1 引言

资料同化的目的是通过融合大气背景场与多源的观测资料来得到最优的分析场,从而为数值天气预报(Numerical Weather Prediction, NWP)提供更准确的初值条件。同化系统中的背景误差协方差(B矩阵)在确定NWP模式变分分析的质量方面起着至关重要的作用,它控制观测信息成为分析增量的百分比、每个观测资料如何影响一个广泛的区域以及不同分析变量间的平衡。因此深入剖析B矩阵的结构和特征及开展相关研究,有助于理解影响同化系统分析同化性能的因子,对提高同化系统的分析同化性能和改善NWP模式的预报效果均具有较高的应用价值。

有两种技术可以用来估计背景误差协方差,它们分别是美国国家气象中心(National Meteorological Center, NMC)方法[1]以及集合分析法[2-3]。同时为了改善B矩阵的估计精度,国内外学者进行了积极的探索和研究。Kleist等[4]在全球数据同化系统(Global Data Assimilation System, GDAS)中选用格点统计插值(Gridpoint Statistical Interpolation, GSI)同化系统替换其前身谱统计插值(Spectral Statistical Interpolation, SSI)同化系统时,通过对比两个系统分析场之间的差异来调整B矩阵。Wu[5]采用NMC方法统计了基于WRFNMM/GSI同化系统的区域B矩阵。值得注意的是,龚建东[6]的研究表明,NMC方法也有其局限性,采用NMC方法估计出的背景误差特征长度往往存在偏差,需要校准和调优;且针对不同的模式分辨率,需要有与之匹配的背景误差协方差。刘延安[7]采用NMC方法基于两个月的WRF模式预报针对研究区域构建B矩阵,并采用敏感性分析法对B矩阵中水平特征尺度和方差权重进行了优化调整,改善了WRF模式对台风72h路径预报的精度。陈耀登等[8]基于WRFDA同化系统采用多元变量相关的背景误差协方差模型选项,在B矩阵中建立了额外的平衡关系,明显改善了台风路径、强度和降水的预报效果。

目前,GSI同化系统预设有两个不同的B矩阵,它们分别是采用NMC方法结合美国国家环境预报中心(National Centers for Environmental Prediction, NCEP)的全球预报系统(Global Forecast System, GFS)和北美中尺度预报系统(North American Mesoscale Forecast System, NAM)产生的(以下简称NCEP GFS B矩阵和NCEP NAM B矩阵)。需要指出的是NCEP GFS背景误差统计信息是NCEP在2002年采用NMC方法利用横跨一年时间的357对预报场之间的差异估计的,所以它比较古老,对特定季节分析变量间的平衡关系代表性也不高,加之WRF-ARW区域预报系统的特点与NCEP预报系统不同,这些都是开发构建WRF-ARW区域B矩阵而不是直接使用GSI同化系统预设B矩阵的强大动机。

本文首先采用NMC方法针对中国区域利用连续一个月(2018年8月)的63对预报场之间的差异对背景误差协方差进行估计。对比了该背景误差协方差(以下简称WRF-ARW China B矩阵)与NCEP GFS和NAM B矩阵的特征差异。并利用大量单点观测试验分别调试出适合U风分量、温度和比湿的调优参数。最后分别通过背景误差协方差调优参数敏感性试验以及一次季风低压强降水个例的循环同化试验确定出针对WRF-ARW China B矩阵的最佳调优参数,以及在此基础上对比了采用不同同化方法使用不同B矩阵的同化和预报效果。

2 同化系统与观测资料

本研究采用的GSI同化系统版本为comGSIv3.5_EnKFv1.1。有关三维变分(3DVar)物理空间分析方案和在GSI同化系统中3DVar的极小化步骤等内容可以在文献[9]和GSI高级用户手册中找到。

2.1 在GSI同化系统中背景误差协方差的应用

背景误差协方差的全尺寸是非常大的,例如对于一个中国区域51层12 km分辨率的预报模式系统,其B矩阵的全尺寸大约在107×107的数量级,它的这种形式不能被存储在任何计算机中。由于B矩阵是一个无法被明确计算的庞大矩阵,所以在现实中,它必须被分解成几个子矩阵来逐步实现其功能如式(1)所示,这种方法被称为控制变量转换法(Control Variable Transforms, CVT)。CVT将B矩阵隐含在控制变量转换算子中,不再需要直接表示[10],因此控制变量转换算子也包含了某特定区域的背景误差协方差特征[11]

$ {\bf{B}}{\rm{ = }}{{\bf{B}}_{{\rm{balance}}}}{\bf{V}}{{\bf{B}}_{\rm{Z}}}\left( {{{\bf{B}}_\chi }{{\bf{B}}_{\rm{y}}}{{\bf{B}}_{\rm{y}}}{{\bf{B}}_\chi }} \right){{\bf{B}}_{\rm{Z}}}{\bf{VB}}_{{\rm{balance}}}^{\rm{T}} $ (1)

式中,Bbalance子矩阵表征不同分析变量间的平衡,BbalanceT子矩阵是平衡方程的伴随式,V子矩阵表示不同分析控制变量的标准差,Bz子矩阵表示不同分析控制变量的垂直平滑因子,BxByByBx子矩阵表示不同分析控制变量在东西和南北方向的自伴随平滑因子。

即通过CVT将3DVar分析中最重要和复杂的背景误差协方差分解为三组信息:平衡是由预先计算的“回归系数”表示不同分析变量间的平衡;标准差是由预先计算的分析控制变量方差的平方根表示背景场的质量,背景误差方差与观测误差方差之比决定了分析场对观测场的拟合程度;水平和垂直影响被建模为一个在递归滤波器中带有预先计算的“特征尺度”参数的高斯分布,例如水平影响被建模为三个具有不同影响尺度的递归过滤器的组合,它们决定观测信息传播的面积和深度。

2.2 单变量相关的背景误差协方差平衡关系计算方案

目前,在GSI同化系统区域分析中有如下5个分析变量被采用:流函数ψ、速度势χ、温度T、地面气压Ps、归一化相对湿度RH。在选取分析控制变量时,为了使B矩阵中的非对角项更少、消除分析变量间的交叉依赖关系,ψRH依旧使用全量作为分析控制变量;而针对χTPs,分析控制变量是从它们的全量中移除相应的平衡部分得到的非平衡部分即非平衡速度势χu、非平衡温度Tu和非平衡地面气压Psu。平衡部分采用ψ单变量相关的平衡关系被计算如式(2~4)所示:

$ {\chi _u} = \chi - {{\bf{B}}_{{\rm{balance}}\left( {st \to vp} \right)}}\psi $ (2)
$ {T_u} = T - {{\bf{B}}_{{\rm{balance}}\left( {st \to t} \right)}}\psi $ (3)
$ P{s_u} = Ps - {{\bf{B}}_{{\rm{balance}}\left( {st \to ps} \right)}}\psi $ (4)

式中,相关关系只有3个:ψχ的相关Bbalance(stvp)ψT的相关Bbalance(stt)ψPs的相关Bbalance(stp),均是与ψ单个分析变量的相关,应用这样的平衡关系计算得出的是传统的背景误差协方差。这与WRFDA同化系统中采用默认的cv_option=5控制变量选项计算得出的背景误差协方差类似。

2.3 常规观测资料

目前的观测资料由常规观测资料和非常规观测资料构成[12],本文同化试验所使用的观测资料为常规观测资料。NCEP GFS PrepBUFR常规观测资料主要包括如下报文类型,如图 1~图 3所示为2018年8月29日12时(世界时,下同)同化试验使用的常规观测资料分布(地面/海表比湿、V风分量观测数据图略)。

图 1 常规观测资料不同报文类型高空观测数据空间分布 a.无线电探空;b.测风气球;c.飞机/飞行员报告;d~f.日本卫星云迹风;g~i.欧洲卫星云迹风;j.测风气球解码风廓线;k.雷达垂直方位显示。
图 2 常规观测资料 a. 500 hPa无线电探空温度数据,不同报文类型地面/海表温度观测数据空间分布;b~d.地面天气报告;e.船舶浮标天气报告。
图 3 常规观测资料 a~b. 500 hPa无线电探空、测风气球U风分量数据;不同报文类型地面/海表U风分量观测数据空间分布:c~e.地面天气报告;f.船舶浮标天气报告;g.洋面散射计测风。
3 基于GSI同化系统的背景误差协方差特征结构 3.1 针对中国区域WRF-ARW预报系统构建B矩阵

由于要进行分析同化的背景场大多来自之前起报时刻的模式预报,因此B矩阵可以被定义为模式预报误差[Forecast(x)-Truth(xtruth)]方差。同时由于大气的真实状态Truth(xtruth)是不可知的,因此模式预报误差需要被估计。NMC方法利用一系列有规律间隔起报的预报,并比较不同起报时间在同一时刻有效的预报场之间的差异。例如,NMC 24-12将00时起报的24 h预报场与12时起报的12 h预报场进行比较,以建立一个用于计算统计数据的大容量样本,这最终计算得到的是初猜场误差和模式预报误差的结合。

由于NMC方法不受观测资料分布密度以及范围的限制,相对比较容易实现。只要拥有足够的样本数,统计出的背景误差协方差可信度较高,目前该方法在各大业务中心都有广泛应用。NMC方法的主要计算步骤如下[13]

stage0:读取域的地理信息、地图投影和与地图相关的因素;并从24 h和12 h的WRF-ARW预报中处理与分析变量有关的所有气象信息如风、温度、地面气压、湿度等,ψχ则利用风场的UV分量先计算水平散度和涡度,再求解泊松方程得到;最后,针对所有分析变量计算针对同一时刻有效的24 h和12 h预报的差值,形成所期望的“扰动”序列。

stage1:从每个扰动序列中移除“stage0”阶段产生的相应扰动的时间均值。

stage2:这个阶段主要由两部分组成。

(1) 计算ψ分别对χTPs的回归系数。其中,(ψ, χ)回归系数具有纬度依赖性;而(ψ, T)与(ψ, Ps)回归系数在一个平均意义上覆盖整个水平区域被计算,因此不具有纬度依赖性。此外,(ψ, T)回归系数还计算了每一层与每一层之间的相关关系。

(2) 方差、水平和垂直特征尺度针对每个分析控制变量被计算:在计算分析控制变量的方差时,ψRH是针对它们的全量直接计算的;而χTPs是针对它们的非平衡部分χuTuPsu计算的。所有分析控制变量的方差均具有纬度依赖性。

对于任意分析控制变量X利用其方差与拉普拉斯算子∇2X的方差来计算水平特征尺度L如式(5)所示:

$ L = {\left\{ {\frac{{8 \times {\rm Variance}\left( X \right)}}{{{\rm Variance}\left\{ {{\nabla ^2}\left( X \right)} \right\}}}} \right\}^{\frac{1}{4}}} $ (5)

所有分析控制变量的水平特征尺度均具有纬度依赖性。

针对分析控制变量ψχuTuRH,利用每一层与其毗邻层之间的垂直相关系数在任意层次l上计算垂直特征尺度VL如式(6)所示:

$ VL\left( l \right) = {\left\{ {\frac{1}{{{\rm abs}\left[ {2 - {\rm vcor}\left( l \right) - {\rm vcor}\left( {l + 1} \right)} \right]}}} \right\}^{\frac{1}{2}}} $ (6)

由于分析控制变量Psu是一个二维平面变量,因此其不具有垂直特征尺度。此外,由于每一层与其毗邻层之间的垂直相关系数均是覆盖整个水平区域针对整层被计算,因此不具有纬度依赖性。

本研究采用的WRF模式及WPS前处理系统的版本为WRF-4.1.1与WPS - 4.1。WRF-ARW China B矩阵估计试验设定如下:水平格点数为493×486,垂直层数为51层,模式顶气压为50 hPa,水平分辨率为12 km。微物理过程方案采用Thompson方案,积云参数化方案采用Grell-Freitas方案,长短波辐射方案均采用RRTMG方案,边界层方案采用YSU方案,近地面层方案采用Revised MM5 Monin-Obukhov方案,陆面过程方案采用Noah方案。统计样本为2018年7月31日00时—8月31日12时逐12 h起报的24 h和12 h的WRF-ARW区域模式预报,总共63对预报场。研究模拟区域如图 4所示。

图 4 针对中国区域WRF-ARW区域预报系统的B矩阵估计试验区域设置
3.2 背景误差协方差特征结构 3.2.1 平衡关系

不同分析变量间的平衡关系是CVT的核心环节,平衡关系可以反映与构建B矩阵所选用统计数据的样本类似季节天气情况下的动力学特征。在单变量相关的背景误差协方差平衡关系计算方案中有3组平衡关系分别是Bbalance(stvp)Bbalance(stt)Bbalance(stp),它们被用来将相应分析变量转化为变量间不相关的分析控制变量。

图 5a~5f可以看出,在构建χ的平衡部分时,流函数对速度势的贡献均在近地面和对流层低层出现极大值,并在WRF-ARW China B矩阵中最为显著。负相关系数表明在近地面和对流层低层旋转风可以导致辐合风分析增量,反之亦然。在WRF-ARW China B矩阵中低纬地区的对流层顶存在一个有别于其它两个B矩阵的正相关中心,这可能与夏季活动于该区域稳定的南亚高压有关。

图 5 分析变量间的(ψ, χ)回归系数(a~f)、(ψ, T)回归系数(g~i)、(ψ, Ps)回归系数(j~l)特征对比 左中右列分别对应NCEP GFS、NCEP NAM和WRF-ARW China B矩阵。

图 5g~5i可以看出,风场与质量场之间的(ψ, T)回归系数要小106个数量级。由于(ψ, T)回归系数还计算了每一层与每一层之间的相关关系,在构建T的平衡部分时,除对角线及对角线附近以外的值均基本为0,说明旋转风对温度的影响主要出现在邻近层,且这种现象在NCEP NAM和WRF-ARW China B矩阵中更为明显。

图 5j~5l可以看出,风场与质量场之间的(ψ, Ps)回归系数要小107个数量级。在构建Ps的平衡部分时,流函数对地面气压的贡献均在近地面和对流层低层出现极大值,并在WRF-ARW China B矩阵中最为显著。正相关系数表明在近地面和对流层低层旋转风可以导致正地面气压分析增量,反之亦然。

3.2.2 标准差

分析控制变量的标准差表征了相关变量模式误差的主要分布特征,其极值区表明模式对相关变量的模拟机制有缺陷,模式积分计算将得到较大的背景场误差[14]

图 6a~6c所示,从流函数和非平衡速度势的平均标准差廓线看,三者B矩阵在对流层内均表现出随高度递增的趋势。与NCEP GFS B矩阵相比,NCEP NAM和WRF-ARW China B矩阵在模式顶要小一个量级、在对流层几乎为前者的1/2。

图 6 分析控制变量的标准差(a~c)、水平特征尺度(d~f)、垂直特征尺度(g~i)特征对比 左中右列分别对应NCEP GFS、NCEP NAM和WRF-ARW China B矩阵。

从非平衡温度和相对湿度的平均标准差廓线看,三者B矩阵基本在同一量级,WRF - ARW China B矩阵在对流层几乎为前两者的2/3。

3.2.3 水平特征尺度

分析控制变量的水平特征尺度是递归滤波的重要参数,表征观测信息在水平方向的影响范围[14]。水平特征尺度越小,说明距离相关性减小越快。

图 6d~6f所示,从流函数和非平衡速度势的平均水平特征尺度廓线看,三者B矩阵总体上均表现出随高度递增的趋势。WRF-ARW China B矩阵在模式顶大约要小一个量级、在对流层几乎为前两者的1/3~1/4。

从非平衡温度和相对湿度的平均水平特征尺度廓线看,三者B矩阵均表现出在对流层变化波动不大,而在模式顶有所增大的特征。WRFARW China B矩阵几乎为前两者的1/5~1/6。

3.2.4 垂直特征尺度

分析控制变量的垂直特征尺度表征观测信息在垂直方向的影响范围。

图 6g~6i所示,总体而言垂直特征尺度随高度减小。在量级方面,由于不同预报模式的Sigma层在垂直方向上数量的变化和位置的不匹配,无法进行明确的对比。

综上所述,对于各分析控制变量,无论是标准差还是水平特征尺度,WRF-ARW China B矩阵明显小于NCEP GFS和NAM B矩阵。此外,NMC方法在一些经验系数与参数的确定上存在一定缺陷,如误差协方差与相关特征程度等都不太准确,需要在实际使用时进行调整[7]

4 背景误差协方差单点观测试验及同化参数调优

在GSI同化系统中,可以通过anavinfo和namelist文件中的参数调整背景误差协方差(表 1)。

表 1 GSI同化系统背景误差协方差调整选项

目前,在GSI同化系统中特征尺度调优参数对所有分析控制变量是通用的,无法对不同分析控制变量的水平特征尺度和垂直特征尺度进行不同的调整。

4.1 试验设置

为了解B矩阵的结构和检验B矩阵调整的效果,本文采用GSI同化系统使用WRF-ARW China B矩阵针对中国区域分别进行U风分量、温度和比湿的单点观测试验。同时使用NCEP GFS和NAM B矩阵并行运行。对于每一个运行,单点观测的垂直位置被设置在500 hPa,水平位置被设置在模拟区域中心(104.20 °E,31.77 °N)。在每一个运行中,观测信息输入为1个单位,观测误差使用GSI同化系统针对区域应用预设的无线电探空测风仪(RAWINSONDE)在500 hPa的观测误差(温度场为0.92 ℃、相对湿度场为16.31%、风场为2.50 m/s)。使用NCEP GFS和NAM B矩阵时,相应的推荐B矩阵调优选项被调用。而使用WRF-ARW China B矩阵时,进行两次并行运行,一次不采用任何B矩阵调优,另一次设置相应的本地化调优因子。通过单点观测试验,我们可以看到这些调优选项是如何工作的。

4.2 背景误差协方差单点观测试验

参考对三者B矩阵特征的对比分析结果作为同化参数调优依据,并结合单点观测试验的水平和垂直影响范围等因素进行同化参数调优,在调优的过程中发现一般规律如下:如图 7所示,对于U风分量单点观测试验,放大垂直特征尺度会增加观测信息传播的深度,同时基本不影响观测信息传播的面积和U风分量分析增量中心最大值。而放大水平特征尺度会增加观测信息传播的面积,同时减少观测信息传播的深度并大幅减少U风分量分析增量中心最大值;对于温度和比湿单点观测试验(图略),放大垂直特征尺度的影响与U风分量单点观测试验类似。不同的是,放大水平特征尺度会增加相应观测信息传播的面积,同时基本不影响相应观测信息传播的深度和分析增量中心最大值;对于三个单点观测试验,放大各分析控制变量的方差比例因子会增加相应分析增量中心最大值,同时也会小幅增加相应观测信息传播的深度和面积。具体原因需要在后续的工作中深入研究其内部构建代码后再做讨论。

图 7 针对U风分量单点观测试验的WRF-ARW China B矩阵调优因子对观测信息传播的深度、面积和分析增量中心最大值的影响水平分布(a~c)、垂直廓线(d~f) 左中右列分别对应固定水平特征尺度和方差权重调整垂直特征尺度、固定垂直特征尺度和方差权重调整水平特征尺度、固定垂直特征尺度和水平特征尺度调整方差权重。

通过大量的尝试找出了分别较为适合三个单点观测试验的WRF-ARW China B矩阵调优因子如表 2所示。其中,针对ψχuTuPsu和RH的方差比例因子(as/tsfc_sdv参数)分别为:1.10、1.22、0.97、0.87和1.10。

表 2 单点观测试验最佳拟合调优参数

图 8(见下页)显示了U风分量单点观测试验的相应结果(温度和比湿试验与U风分量试验的结果类似,图略)。对于U风分量单点观测试验,使用NCEP GFS B矩阵时分析增量向东西方向延长得更多,而使用NCEP NAM B矩阵及调优WRF-ARW China B矩阵时分析增量主要呈圆形。一般来说,使用未调优WRF-ARW China B矩阵时分析增量在垂直方向的渗透过多且观测信息的水平影响范围非常有限,这明显与实际情况不符,同时也证明了构建B矩阵参数调优的必要性。

图 8 在500 hPa模式区域中心位置设置一个1.0 m/s的U风分量信息所产生的U风分量分析增量在水平XY(a~d)、东西XZ(e~h)和南北YZ(i~l)方向的截面 第一、二列分别对应使用NCEP GFS和NAM B矩阵的GSI运行,第三、四列分别对应使用WRF-ARW China B矩阵时,不进行调优和设置相应调优因子的情况。

此外,从试验结果中还可以看出正的温度信息会导致正的温度分析增量、负的比湿分析增量以及反气旋的风场分析增量(图略)。

5 背景误差协方差调优参数敏感性试验 5.1 试验设计

为了检验不同B矩阵调优因子对模式预报的影响和敏感性,并筛选出整体同化和预报效果最佳的调优参数。本文利用分析同化后的24 h预报与116个中国区域探空站的L波段探空资料进行对比验证。同化试验的时间为2018年8月27—29日,每天00时和12时启动同化后进行24 h预报。具体试验设计如表 3所示。

表 3 背景误差协方差调优参数敏感性试验设计

试验利用冷启动3DVar同化方法,背景场由NCEP GFS格点预报资料动力降尺度生成。以分析时刻为中心的±1.5 h窗口内的观测资料将被当作分析时刻的观测资料输入GSI同化系统。

本文利用偏差修正均方误差(Bias-Corrected Mean-Squared Error, BCMSE)来评估敏感性试验的预报性能,其也被称为平方误差标准差(Standard Deviation of the Error Squared, ESTDEV2)[15],因为它从均方误差(Mean-Squared Error, MSE)中移除了观测减预报总体偏差的影响,因此它更能代表由初始场和观测场之间的差异导致的非系统性误差[16]。其计算方式如式(7)所示:

$ {\rm ESTDE}{V^2} = \frac{1}{n}\sum {{{\left[ {\left( {{f_i} - {o_i}} \right) - \overline {f - 0} } \right]}^2}} $ (7)

式中,n为用于模式检验的观测数量、f为由模式空间插值到观测空间的预报值、o为观测值。

5.2 背景误差协方差调优参数敏感性试验结果

图 9所示,Sen6试验与观测的拟合效果最好。具体的,只有Sen6试验在UVTRH四个要素场的BCMSE均低于各试验的平均水平,其V风分量场和相对湿度场的BCMSE是各试验中最低的。整体上,使用未调优WRF-ARW China B矩阵的Ctl3试验表现最差,也定量证明了构建B矩阵调优的必要性。除了Sen1和Sen9试验,其余的使用WRF-ARW China B矩阵的敏感性试验表现均优于使用NCEP GFS B矩阵的Ctl1试验和NCEP NAM B矩阵的Ctl2试验,同时也定量证明了使用针对特定WRF-ARW区域构建B矩阵可以获得更良好的同化效果。

图 9 各试验的24 h预报与探空观测之间的BCMSE廓线对比 a~d.不同高度层各试验的平均BCMSE廓线及各层对比验证观测数量;e~h.不同高度层各试验的距平BCMSE柱状图。第一列~第四列分别对应U风分量、V风分量、温度和相对湿度的统计验证结果。

对于U风分量场,Sen3试验的BCMSE最低,这与4.2节中我们的定性调试结果相吻合;对于V风分量场,Sen6试验的BCMSE最低,使用WRFARW China B矩阵的各试验整体均优于使用NCEP GFS和NAM B矩阵的试验。

对于温度场,Ctl1试验的BCMSE最低,Ctl2试验及使用6倍水平特征尺度的Sen7~Sen9试验也都具有明显的正影响;而对风场预报性能表现良好的使用3.5倍水平特征尺度的Sen1~Sen3试验却具有明显的负影响。这也再次说明了GSI同化系统背景误差协方差参数调优(尤其是水平特征尺度参数调整)的两难问题。目前,在GSI同化系统中无法对不同分析控制变量的水平和垂直特征尺度进行不同的调优。但是,Sen6试验采用折中方案在风场和质量场预报性能间做出了一个平衡,同时其V风分量场和相对湿度场的BCMSE也是各试验中最低的。

水汽初值的偏差直接影响云的分布和降水量级的大小[17]。对于相对湿度场,Sen6试验的BCMSE最低,Ctl2试验次之,二者均在相对湿度场BCMSE最大的对流层中上层表现出明显的正影响。

6 一次季风低压强降水天气过程的循环同化试验 6.1 试验设计

2018年8月末—9月初,受低压环流和季风云系影响,华南地区东部出现大范围暴雨或大暴雨,部分地区特大暴雨的降水过程,其中以8月30—31日范围最广、强度最强。监测显示,福建东部、广东中南部、广西中部和防城港、湖南中部等地出现暴雨或大暴雨,广东的揭阳、汕头、汕尾、惠州、河源等地特大暴雨。

本文使用不同B矩阵进行循环同化试验对2018年8月30—31日的全国天气过程进行模拟,并利用最后一次循环同化后的24h预报与116个中国区域探空站的L波段探空资料及2 470个国家级地面气象观测台站的降水资料进行对比验证。同时并行运行采用混合(Hybrid)同化方法使用不同B矩阵的循环同化试验(其背景误差协方差中的25%源于3DVar变分框架中的静态背景误差协方差、75%源于集合预报的动态背景误差协方差),来探讨采用Hybrid同化方法是否能够进一步提升预报效果。具体试验设计如表 4所示。

表 4 循环同化试验设计

循环同化试验采用3DVar及Hybrid/3DEnVar同化方法,Hybrid同化方法中所选用的集合成员分别由2018年8月29日12时起报的NCEP全球集合预报系统(Global Ensemble Forecast System, GEFS)格点集合预报资料动力降尺度后结合多物理参数化方案生成的20组集合成员的00 h背景场、06 h和12 h预报场组成。以分析时刻为中心的±1.5 h窗口内的观测资料将被当作分析时刻的观测资料输入GSI同化系统。如图 10所示,WRF模式以初始时刻分析同化后的分析场作为背景场预报6h至2018年8月29日18时用于下一次循环同化。以此类推,在2018年8月30日00时进行第三次循环同化后进行24h预报。

图 10 循环同化试验示意图

为了评估模式中风场、温度场和相对湿度场的模拟预报效果。利用均方根误差(Root-MeanSquared Error, RMSE)进行验证,其计算方式如式(8)所示:

$ {\rm RMSE} = \sqrt {\frac{1}{n}\sum {{{\left( {{f_i} - {o_i}} \right)}^2}} } $ (8)

式中,n为用于模式检验的观测数量、f为由模式空间插值到观测空间的预报值、o为观测值。

6.2 循环同化试验结果

图 11所示,对于不做任何分析同化的NoDA试验,其风场和温度场的预报效果是较差或最差的,这也说明了循环同化试验可以在一定程度上改善预报效果;但其相对湿度场却表现良好,甚至优于大部分循环同化试验的预报效果,这可能是由于目前在GSI同化系统中B矩阵是采用传统的单变量相关的平衡关系计算模型的缺陷导致的。而采用Hybrid同化方法的循环同化试验能够得到具有“流依赖”属性的背景误差协方差的估计,从而改进同化和预报效果。例如Hyb2和Hyb3试验同样展现出良好的相对湿度场预报性能、Hyb1试验的预报效果较Ctl1试验也有较大改进。

整体上,采用Hybrid同化方法的循环同化试验可以对采用3DVar同化方法的循环同化试验的预报效果做出进一步的改进。在采用3DVar同化方法的Ctl1、Ctl2和Sen6三组循环同化试验中,除U风分量场外Sen6试验在V风分量场、温度场和相对湿度场的预报效果均优于Ctl1和Ctl2试验。而在采用Hybrid同化方法的Hyb1、Hyb2和Hyb3三组循环同化试验中,Hyb3试验的整体预报效果最好,这主要体现在V风分量场和相对湿度场的预报性能上。

图 11 各试验的24 h预报与探空观测之间的RMSE廓线对比 a~d.不同高度层各试验的平均RMSE廓线及各层对比验证观测数量;e~h.不同高度层各试验的距平RMSE柱状图。第一列~第四列分别对应U风分量、V风分量、温度和相对湿度的统计验证结果。

对于U风分量场,Hyb1试验的RMSE最低,这也得益于Ctl1试验的预报效果良好;Ctl2和Sen6试验的预报性能最差。对于V风分量场,Hyb3试验的RMSE最低;Ctl1试验的预报性能最差。使用WRF -ARW China B矩阵的Hyb3和Sen6试验分别优于使用NCEP GFS和NAM B矩阵的试验。

对于温度场,仅Hyb1试验可以对Ctl1试验的预报效果做出微弱的改进,Hyb2、Hyb3试验反而对Ctl2和Sen6试验有负改进效果,即在本个例中温度场的预报效果对具有“流依赖”属性的背景误差协方差不敏感。Hyb1试验的RMSE最低,这也得益于Ctl1试验的预报效果良好,这与背景误差协方差调优参数敏感性试验中的结论相吻合;不同的是对于本次个例的模拟Sen6试验同样展现出极佳的温度场预报效果,这可能是由于个例模拟期间出现的极端降水天气过程具有更多局地小尺度特征,使得各分析控制变量的水平特征尺度低于气候平均值,即本次个例的分析同化过程使用了较实际情况偏大的水平特征尺度,而偏大的水平特征尺度会导致正温度场预报效果和负U风分量场预报效果,这也解释了本次Sen6循环同化试验对U风分量场预报效果表现不佳的原因。

6.3 循环同化试验24 h累积降水结果分析

图 12所示,对比各循环同化试验的24 h累积降水模拟结果发现,所有试验均模拟出了华南地区的特大暴雨事件,但模拟的特大暴雨中心均位于实况东北方向有200~300 km的偏移,其中Hyb3试验模拟的特大暴雨中心与实况最为接近,一定程度上修正了个例模拟雨带的位置。

图 12 各循环同化试验24 h(30日00时—31日00时)累积降水空间分布 a.实况;b. NoDA试验;c. Ctl1试验;d. Ctl2试验;e. Sen6试验;f. Hyb1试验;g. Hyb2试验;h. Hyb3试验。单位:mm。

初值场水汽的增加配合着对流上升有利于短时间内成云致雨,从而提高降水预报[18]。如图 13所示,对于阈值为100 mm、50 mm的各项降水评分,Sen6试验的TS、ETS评分最高。同时其在700~850 hPa相对湿度RMSE最低,这也反映了本次个例大暴雨、暴雨的降水评分对于700~850 hPa相对湿度的模拟效果较为敏感。

图 13 各循环同化试验24 h(30日00时—31日00时)累积降水的POD(a)、FAR(b)、TS(c)、ETS(d)评分

对于阈值为25 mm的各项降水评分,Ctl1试验的预报覆盖率最高、NoDA试验的空报率最低,导致Ctl1试验的TS、ETS评分最高,NoDA试验次之。同时Ctl1试验在500~700 hPa相对湿度RMSE与NoDA和Hyb2试验均明显低于各试验的平均水平,这也反映了本次个例大雨的降水评分对于500~700 hPa相对湿度的模拟效果较为敏感。

对于阈值为10 mm及晴雨(阈值为0.1 mm)的各项降水评分,各试验的TS、ETS评分相差不大。从降水预报对观测的覆盖情况看,使用WRF-ARW China B矩阵的Sen6和Hyb3试验的POD评分最高;从空报率情况看,NoDA试验的FAR评分最低。整体上,在对流层中低层相对湿度RMSE较低的各试验在各项降水评分的对比中也均表现优异。

7 结语与讨论

在同化系统中使用更合理的背景误差协方差对于得到更准确的分析场至关重要,尤其针对特定区域特定季节构建的背景误差协方差中分析变量间的平衡关系能够反映特定区域特定季节发生的确切天气状况的某些气象机理特征。

(1) 不进行任何参数调优直接使用WRFARW China B矩阵进行分析同化将导致负同化效果,因此必须进行参数调优。而三者B矩阵的特征差异为参数调优,尤其是各分析控制变量的方差比例因子和水平特征尺度缩放比例提供了至关重要的指导和参考。

(2) 背景误差协方差调优参数敏感性试验的结果表明采用最佳调优参数使用针对中国区域构建B矩阵的试验(Sen6)与实况的拟合效果最好,其对预报效果最明显的改进主要体现在V风分量场和相对湿度场。也定量证明了针对特定区域特定季节构建本地化B矩阵可以获得更良好的同化效果。同时发现,GSI同化系统背景误差协方差参数调优是一个两难问题:在合理的放大倍数范围内,高倍数的水平特征尺度调整有利于温度场预报效果的提升但将导致U风分量场预报性能的降低;低倍数的水平特征尺度调整有利于U风分量场预报效果的提升但将导致温度场预报性能的降低。

(3) 在此基础上,采用Hybrid同化方法可以进一步提升预报效果,这主要体现在风场和相对湿度场的预报性能上。此外,采用Hybrid同化方法使用针对中国区域构建B矩阵的循环同化试验(Hyb3)模拟的特大暴雨中心是与实况最为接近的,一定程度上修正了个例模拟雨带的位置。从降水评分来看,采用最佳调优参数使用针对中国区域构建B矩阵的试验(Sen6)对阈值为100 mm、50 mm降水的TS、ETS评分最高;Sen6和Hyb3试验对阈值为10 mm及晴雨(阈值为0.1 mm)降水的预报覆盖率最高。

需要指出的是,本文构建B矩阵的统计样本来自于一个月(2018年8月)的区域模式预报,因此其计算的分析变量间的平衡特征仅针对8月有较高的代表性。此外,目前GSI同化系统应用的还是单变量相关的背景误差协方差平衡关系计算模型得出的传统的背景误差协方差;同时其背景误差协方差参数调优是一个两难问题,我们无法兼顾风场和质量场对不同分析控制变量的水平和垂直特征尺度进行不同的调优。因此,相关开发人员和研究学者有必要进一步以多元变量相关的背景误差协方差计算模型为基础,在背景误差协方差中建立新的平衡关系;并开发相应接口以实现对不同分析控制变量的水平和垂直特征尺度进行独立调整。届时,GSI同化系统或将可以进一步改善同化和预报效果。

参考文献
[1]
PARRISH D F, DERBER J C. The National Meteorological Center's spectral statistical interpolation analysis system[J]. Mon Wea Rev, 1992, 120(8): 1747-1763.
[2]
FISHER M. Background error covariance modelling. Proceedings of ECMWF seminar on recent developments in data assimilation for atmosphere and ocean[C]. United Kingdom: ECMWF, 2003.
[3]
BELO-PEREIRA M, BERRE L. The use of an ensemble approach to study the background error covariances in a global NWP model[J]. Mon Wea Rev, 2006, 134(9): 2466-2489.
[4]
KLEIST D, PARRISH D F, DERBER J C, et al. Introduction of the GSI into the NCEP global data assimilation system[J]. Wea Forecasting, 2009, 24(6): 1691-1705.
[5]
WU W S. Background error for NCEP's GSI analysis in regional mode[C]. Proceedings of 4th WMO international symposium on assimilation of observation in meteorology and oceanography, Prague, Czech Republic, 2005.
[6]
龚建东. 资料同化中二维特征长度随模式分辨率变化的分析研究[J]. 大气科学, 2007, 31(3): 459-467.
[7]
刘延安.高光谱红外辐射资料在区域模式中的直接同化及应用研究[D].上海: 华东师范大学, 2014.
[8]
陈耀登, 夏雪, 闵锦忠, 等. 背景误差协方差变量平衡特征及其对台风同化和预报的影响[J]. 热带气象学报, 2017, 33(3): 289-298.
[9]
KALANY E.大气模式、资料同化和可预报性[M].蒲朝霞, 杨福全, 邓北胜, 等, 译.北京: 气象出版社, 2005.
[10]
陈耀登, 曾腊梅, HUANG X Y, 等. 纬度依赖背景场误差协方差及其对台风同化和预报的影响研究[J]. 热带气象学报, 2014, 30(4): 654-662.
[11]
BANNISTER R N. A review of forecast error covariance statistics in atmospheric variational data assimilation[J]. Q J R Meteor Soc, 2008, 134(637): 1951-1970.
[12]
龚俊强, 刘朝顺, 刘延安, 等. 探空和飞机观测资料联合同化对台风"苏迪罗"(2015)数值模拟的影响研究[J]. 热带气象学报, 2019, 35(1): 99-112.
[13]
RIZVI S RH, LIU Z Q, HUANG X Y. Generation of WRF-ARW Background Errors for GSI[Z]. 2009.
[14]
赵幸.青藏高原和华东地区背景误差协方差特征及同化效果对比研究[D].南京: 南京信息工程大学, 2015
[15]
MURPHY A H. Skill scores based on the mean square error and their relationships to the correlation coefficient[J]. Mon Wea Rev, 1988, 116(12): 2417-2424.
[16]
薛童, 管兆勇, 徐建军, 等. ATMS和CrIS卫星资料同化对青藏高原天气预报的影响[J]. 高原气象, 2017, 36(4): 912-929.
[17]
张诚忠, 薛纪善, 冯业荣, 等. 基于贝叶斯方案的雷达反射率反演水汽及其同化试验[J]. 热带气象学报, 2019, 35(2): 145-153.
[18]
张诚忠, 薛纪善, 黄燕燕, 等. 资料同化对2017年登陆广东沿海台风的短期降水与路径预报影响[J]. 热带气象学报, 2019, 35(5): 577-586.