1、Gambel分布的K-S检验
对于某一站的年最高连续干旱日数(年极大值)来说,首先要假设它的分布规律,然后经过检验,才能找出其符合的分布规律。在此用K-S法进行检验,假设年最高连续干旱日数数据为x1<x2<…<xn,在检验这些数据是否服从假定的分布时,数据的顺序统计量的累积分布值(平均排列法)1-i/(n+i)与理论上计算的累积分布函数F(xi)之差的最大值Dn为:Dn=1≤maxi≤n{|F(xi)-[1-i/(n+1)]|}。如果Dn小于某一临界值Dn*,那么认为假定的理论分布是合适的,这就是K-S检验。检验假定的理论分布是否合适的临界值Dn*有如下关系,即p(Dn<Dn*)=1-α,α为显著性水平,表示假定的分布正确与否,要放弃这一假定的危险率。
2、结果与分析
2.1指数分布拟合各站连续干旱日长度
由表1可见,10个站点的R2值均在0.9左右(除拉萨站点的R2稍小点外),非常接近1,说明观测值与计算值之间很接近,误差小,相关性好,所以这几个站的指数拟合效果均非常好。从指数分布拟合图(图1)可以看出,长春、沈阳、济南、合肥4个测站的观测曲线最贴合,拟合的效果最好,计算值与观测值的误差很小;西宁、兰州、呼和浩特、银川、石家庄、拉萨6个站拟合效果虽不如前面4个站,但仍然服从指数分布,随着连续干旱天数的增加,频数呈指数减小,且各站在10~20d以下的计算频数值稍大于观测值,在10~20d以上的计算频数值稍小于观测值。除了拉萨站点计算值与观测值有一定程度的偏差外,其余站点均有较高的精度,计算值曲线和观测值曲线两者比较接近,可见拟合效果还是比较好的,因此,可以认为指数分布能模拟连续干旱日数和日数出现次数的概率特征,即采用指数分布来分析连续干旱日数和日数出现次数的分。
2.2Gumbel分布拟合我国北方地区的极端干旱
2.2.1Gumbel分布拟合。从各站年最高连续干旱日数的Gumbel分布估计结果(图2)可以看出,总体形势是计算频数和观测频数之间很接近,计算频数曲线和观测频数曲线几乎重合,无显著差别,可见拟合效果十分完美[6]。从10个站的Gumbel分布拟合图可以看出有2种分布型,一种是曲线平缓型,即曲线坡度较小,说明频数随着最高连续干旱日数的增布特征是可行的。加缓慢增加,1956~2000年年最高连续干旱日数在1~150d内均匀分布,如西宁、兰州、呼和浩特、银川、石家庄、拉萨站的Gumbel分布拟合图;一种是曲线陡峭型,即曲线的坡度较大,刚开始一段曲线比较陡峭,到一定程度后,曲线弯折成直线,弯折后的直线与Y=45这条直线重合,说明频数刚开始随着最高连续干旱日数的增加而迅速增加,1956~2000年年最高连续干旱日数主要分布在1~150d的前一部分,如长春地区的年最高连续干旱日数主要分布在14~50d,沈阳地区的年最高连续干旱日数主要分布在13~60d,济南地区的年最高连续干旱日数主要分布在18~70d,合肥地区的年最高连续干旱日数主要分布在8~50d。2.2.2最大平均相对误差。再来看各个站点计算频数和观测频数的平均相对误差,各组的计算频数和观测频数的误差就不一一列出,这里仅分析各站最大的平均相对误差。西宁、兰州、呼和浩特、银川、石家庄、长春、沈阳、济南、拉萨、合肥的最大平均相对误差分别为0.74%、0.73%、-0.48%、-1.48%、-1.18%、-0.44%、-0.60%、-0.48%、1.52%、0.47%,可见各站误差均不超过2%,因此,可认为Gumbel分布能拟合年最高连续干旱日数的分布特征,即采用Gumbel分布来分析年最高连续干旱日数的分布特征是可行的,且采用L-矩估计参数有很高的拟合精度[5]。2.2.3Gambel分布的K-S检验。经计算,西宁、兰州、呼和浩特、银川、石家庄、长春、沈阳、济南、拉萨、合肥的Dn分别为0.07681、0.05458、0.05328、0.03454、0.07534、0.06356、0.08626、0.03315、0.05803、0.09362,设α=0.05,查K-S检验临界值表得Dn*=0.19837,可见各测站Dn<Dn*,说明全部测站的年最大连续干旱日数遵循Gumbel分布。
2.3年最高连续干旱日数出现的重现期
在目前天气和气候变化过程中,有关极值的形成原因至今还没有一个明确的定论。因此,极端天气是很难预报的。预报失败的原因主要是因为很难掌握极值的变化规律。统计极值的根本目的在于准确地推断极值序列的重现期,即指某一极值平均约能在多长时间(如多少年)出现1次。采用具有高精度优良特性的L-矩参数估计方法,给出的10个观测站若干年一遇的最高连续干旱日数曲线(图3)显示,L-矩参数估计方法给出的估计量在很多方面均具有较好的且稳定的表现[3,5];各站T年一遇最高连续干旱日数并不是从零开始,且在开始一段的曲线,随着T的增加,最高连续干旱日数也在增加,增加到一定程度后,最高连续干旱日数朝着一个值趋近,这个值即该测站100年内极端干旱会达到的最长连续天数。从各测站T年一遇(T=100,50,20)的最高连续干旱日数(表2)可百年一遇值达100d以上,银川和拉萨站甚至分别达162和179d,且这6个站50年一遇和20年一遇的值均达100d或近100d,连续干旱天数出奇的长;而长春、沈阳、济南、合肥4个测站的T年一遇值(T=100,50,20)也达40~75d。T年一遇的预测值对灾害预防及工农业规划有一定的现实意义和使用价值,警示应做好防旱抗旱工作。
2.4极端干旱风险分析
极端干旱风险就是极端干旱这种现象发生与否的某种不确定性。风险发生的可能性通常可以用概率进行测量。风险发生的概率在0~1之间波动。越接近1,风险发生的可能性越大,越接近0,风险发生的可能性越小。在此以最高连续干旱日数为60d作为判断极端干旱的临界日数。经分析,长春、沈阳、济南、合肥4个站极端干旱可能发生的概率较小,其概率分别为0.27%、1.40%、4.73%、0.73%,其余6个站极端干旱可能发生概率均较高,最高的是拉萨站,可能发生的概率达84.87%。极端干旱可能发生的概率越大,极端干旱的风险性越高。所以除长春、沈阳、济南、合肥4个站以外的其他6站,极端干旱的风险性均较大,在今后的工农业生产中防旱抗旱的工作任务依然很艰巨。
3、结论
(1)用指数分布拟合我国北方地区10个测站连续干旱日长度的分布,结果表明指数分布在拟合连续干旱日数和日数出现次数的分布特征具有较好的效果。(2)用Gumbel分布对我国北方地区10个站的年最长连续干旱日数分布进行拟合,通过以L-矩法估计方法估计其分布参数,结果表明Gumbel分布能较好地拟合年最高连续干旱日数的分布,且L-矩估计具有高精度优良特性。经过K-S检验,证明L-矩法估计方法估算Gumbel分布函数参数的值是可信的。(3)用Gumbel分布拟合了我国北方地区10个站的年最长连续干旱日数极值分布,显示了良好的效果,根据概率分布函数求得各个站点给定重现期的年最长连续干旱日数极值分布,这对各个地区的灾害预防及工农业规划有一定的借鉴意义。(4)10个测站T年一遇的最高连续干旱日数均在一个多月以上,多个测站极端干旱可能发生的概率很大,极端干旱的风险性大,严重影响农业生产。
作者:何瑞琦 单位:山东省滨州市气象局