第四节 水文频率分布线型

水利水电工程的规划设计中,常常需要知道大于或等于某一特征值的频率是多少,也就是要提供一定频率的水文数值,这就需要绘制频率曲线。水文计算中习惯上把由实测资料(样本)所绘制的频率曲线称为经验频率曲线,而把由数学方程式所表示的频率曲线称为理论频率曲线。所谓水文频率分布线型是指所采用的理论频率曲线(频率函数)的型式,它的选择主要取决于与大多数水文资料的经验频率点据的配合情况。分布线型的选择与统计参数的估算,一起构成了频率计算的两大内容。由于经验频率的计算以及经验频率曲线的绘制是水文频率计算的基础,且经验频率曲线在实际应用中有一定的实用性,因此,在讲述理论分布线型之前,有必要先讲述经验频率曲线。

一、经验频率曲线

(一)经验频率计算公式

设某水文要素的系列(样本系列)共有n项,按由大到小的次序排列为:x1,x2,x3,…,xm,…,xn则在系列中大于及等于x1的出现次数为1。其频率为1/n;大于及等于x2的出现次数为2,其频率为2/n;大于及等于xm的出现次数为m,其频率为m/n,等。

上述经验频率按下式计算:

img

式中:P为等于和大于xm的经验频率;m为xm的序号,即等于和大于xm的项数;n为样本容量,即观测资料的总项数。

如果n项实测资料本身就是总体,则上述计算经验频率公式(3-12)并无不合理之处。但水文资料都是样本资料,欲从这些资料来估计总体的规律,就有不合理的地方。例如,当m=n时,最末项xn的频率为P=100%,即是说样本的末项xn就是总体中的最小值,样本之外不会出现比xn更小的值,这显然不符合实际情况。因为随着观测年数的增多,总会有更小的数值出现。因此,有必要选用比较合乎实际的公式。

现行有代表性的经验频率公式主要有:

img

前两个公式在统计学上都有一定的理论依据,但具体推导比较复杂。目前我国水文上广泛采用的是数学期望公式。

(二)经验频率曲线绘制方法及存在问题

现以某站10年的实测最大洪峰流量资料为例,说明经验频率曲线的绘制和使用方法。具体步骤如下:

(1)将逐年实测的年最大洪峰流量(水文变量)填入表3-1中第(1)、第(2)栏。

表3-1 某站年最大洪峰流量经验频率计算表

img

(2)将第(2)栏的年量大洪峰流量按大小递减次序重新排序,填入第(4)栏;第(3)栏为序号,自上而下为1,2,…,n。

(3)按数学期望公式分别计算经验频率P=m/(n+1)×100%,填入第(5)栏。

(4)以第(4)栏的水文变量Qm为纵坐标,以第(5)栏的P为横坐标,在频率格纸上点绘经验频率点,然后徒手目估通过点群中间连成一条光滑曲线,即为该站的年最大洪峰流量经验频率曲线。如图3-5所示。

(5)根据工程设计标准指定的频率值,在曲线上查出所需的水文数据。如设计频率为10%,则从图3-5上可查得设计年最大洪峰流量为2550m3/s。

经验频率曲线,完全是根据实测资料绘出的,当实测资料较长或设计标准要求较低时,经验频率曲线尚能解决一些实际问题。但是,工程设计时往往要推求稀遇的小频率洪水,如P=1%,0.1%,0.01%。而目前实测资料一般至多不过几十年,计算的经验频率点只有几十个。因此,需要查用的经验频率曲线上端部分往往没有实测点据控制,即使采用频率格纸使经验频率曲线变直一些,但要进行曲线外延时仍有相当的主观成分,会使设计水文数据的可靠程度受到影响。另外,水文要素的统计规律有一定的地区性,但是我们很难直接利用经验频率曲线把这种地区性的规律综合出来,没有这种地区性规律,就无法解决无实测水文资料的小流域的水文计算问题。为解决这些问题,人们提出用数学方程式表示的频率曲线来配合经验点据,这就是理论频率曲线。

img

图3-5 某站年最大洪峰流量经验频率曲线

二、理论频率曲线

探求频率曲线的数学方程,即寻求水文频率分布线型,一直是水文分析计算中一个争论性很强的课题。水文随机变量究竟服从何种分布,目前还没有充足的论证,而只能以某种理论线型近似代替。这些理论线型并不是从水文现象的物理性质方面推导出来的,而是根据经验资料从数学的已知频率函数中选出来的。迄今为止,国内外采用的理论线型已有10余种,诸如皮尔逊-Ⅲ(P-Ⅲ)型曲线、对数皮尔逊-Ⅲ(LP-Ⅲ)型曲线、耿贝尔(EV-Ⅰ)型曲线以及克里茨基-闵凯里(K-M)型曲线等。不过,从现有资料来看,P-Ⅲ型曲线和LP-Ⅲ型曲线比较符合水文随机变量的分布。因此,这两种曲线(尤其是P-Ⅲ型曲线)用得最多,现简略介绍如下。

(一)皮尔逊-Ⅲ型曲线

英国生物学家皮尔逊注意到物理学、生物学以及经济学上的有些随机变量不具有正态分布,因此致力于探求各种非正态的分布曲线,最后提出13种分布曲线的类型。其中第Ⅲ型曲线被引入水文计算中。我国目前基本上都是采用皮尔逊-Ⅲ型曲线。

皮尔逊-Ⅲ型曲线是一条一端有限一端无限的不对称单峰、正偏曲线,数学上常称伽玛分布,其概率密度函数为

img

式中:Γ(α)为α的伽玛函数;a,β,a0分别为三个参数。

显然,三个参数确定以后,该密度函数随之确定。可以推证,这三个参数与总体的三个统计参数img、Cv、Cs,具有下列关系:

img

水文计算中,一般需求出指定频率P所相应的随机变量取值xp。即求出的xp满足下述等式:

img

显然,xp取决于P、α、β和a0四个参数,并且当α、β、a0三个参数为已知时,则xp只取决于P了。我们知道α、β、a0与分布曲线的img、Cv、Cs有关,因此只要img、Cv和Cs三个参数一经确定,xp仅与P有关,也就是说,可由P唯一地来计算xp。但是直接由积分式计算是非常繁杂的,实际做法是通过变量转换。根据拟定的Cs值进行积分,并将成果制成专用表格供查用,使计算工作大大简化。

img

这里,Φ的均值为零,均方差为1,便于制表,水文中通常称Φ为离均系数。将式(3-20)、式(3-21)代入式(3-18),简化后可得

img

式中被积函数只含有一个待定参数Cs。因为其他两个参数img和Cv都包含在Φ中,因而只要假定一个Cs值,便可从式(3-22)通过积分求出P与Φp之间的关系。对于若干给定的Cs值,Φp和P的对应数值表,已先后由美国工程师福斯特和苏联工程师雷布京制作出来,见附表1。

在频率计算时,由已知的Cs值,查Φ值表得出不同P的Φp值,然后利用已知的img、Cv值,通过式(3-20)即可求出与各种P相应的xp值,因此就可绘制频率曲线。例如,已知某地年平均径流深R =1000mm,Cv=0.25,Cs=0.50,若年径流的分布符合皮尔逊-Ⅲ型,试求概率P为1%的年径流深。

由Cs=0.5、P=1%查附表1得Φp=2.68,所以

img

当Cs等于Cv的一定倍数时,皮尔逊-Ⅲ型频率曲线的模比系数Kp值,已制成表格,见附表2。频率计算时由已知的Cv和Cs可以从附表2中查出与各种频率P相对应的Kp值,然后即可算出与各种频率对应的xp值。有了P和xp的一些对应值,即可绘制频率分布曲线。

(二)对数皮尔逊-Ⅲ型曲线

美国水资源委员会对频率分析计算曾推荐采用对数皮尔逊-Ⅲ型曲线,这种分布尤其是对暴雨资料拟合较好,对洪水与年径流资料的拟合也有一定精度。因此,对数皮尔逊-Ⅲ型分布在美国和其他一些西方国家有较大影响。澳大利亚工程师协会也建议在澳大利亚采用这种线型。

设有某水文随机变量X,对变量X取对数得一新的随机变量,即

Y=lnX

若Y服从皮尔逊-Ⅲ型分布时,X的分布叫做对数皮尔逊-Ⅲ型分布。因此,Y和X密度函数分别为

img

其中三个参数α、β、a0的表达式与式(2-17)完全相同,不过此时的img、Cv、Cs应为水文随机变量取对数后的相应统计参数。

由以上可知,工程实际中,只要将水文系列取对数后转换成新的系列,便与前面所讲的皮尔逊-Ⅲ型曲线相同,即可绘制频率曲线。

三、频率与重现期的关系

由于频率这个名词比较抽象,为便于理解,实用上常采用重现期与频率并用。所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇。频率P与重现期T的关系,对下列两种不同情况有不同的表示方法。

(1)当为了防洪研究暴雨洪水问题时,一般设计频率P小于50%,则

img

式中:T为重现期,以年计;P为频率,以小数或百分数计。

例如,当设计洪水的频率采用P=1%时,代入上式得T=100年,称为百年一遇洪水。

(2)当考虑水库兴利调节研究枯水问题时,为了保证灌溉、发电及给水等用水需要,设计频率P常采用大于50%,则

img

例如,当灌溉设计保证率P=80%时,代入上式得T=5年,称作“以五年一遇的枯水年作为设计来水的标准”。也就是说平均五年中有一年来水小于此枯水年的水量,而其余四年的来水等于或大于此数值,说明平均具有80%的可靠程度。

必须指出,由于水文现象一般并无固定的周期性。上面所讲的频率是指多年中的平均出现机会,重现期也是指多年中平均若干年可以出现一次。例如百年一遇的洪水,是指大于或等于这样的洪水在长时期内平均100年发生一次,而不能理解为恰好每隔100年遇上一次。对于某具体的100年来说,超过这样大的洪水可能有几次,也可能一次都不出现。