3.3 均值与方差的点估计
在实际问题中,根据子样的数据,计算出的子样特征数与S2,通常用来作为相应总体特征数的估计量。对于服从正态分布的总体,均值为μ,方差为σ2(参见2.6节)。当子样是从一正态分布的总体中随机抽出的一部分时,可用子样平均值
去估计该总体的均值μ,而用子样方差S2去估计总体方差σ2,这在数理统计中称为点估计,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051008.jpg?sign=1739134103-NeHQzyj7eo9A2zMnimcDVDQnbeV6T5ex-0-65000d9c38fb3f2fc4a3075ede8acdae)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051009.jpg?sign=1739134103-FUOcjVTijVVWOwwSAe9gv2j9lw35fL6a-0-00af1de2cb504450ce677d56f124c0af)
其中,“^”为估计量的符号。用子样特征数去估计总体特征数,很重要的一点是前者为后者的无偏估计量。也就是说,当用 作为
或用S2作为
时,子样特征数应满足这样的要求,即它的数学期望(统计平均)应当等于它所估计的参数本身,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051013.jpg?sign=1739134103-oLAdFc7GRkhVG7rSDfZOjhYNZRbzpslr-0-3b80d7b1a94badc1313f0a6b31465631)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051015.jpg?sign=1739134103-s6FyBpIQPFSRVzAr5Qhq74CXjbkfkNBp-0-cd2bd8661236f4ac6289c8686022be0c)
这个要求称为无偏性。
我们通常计算的算术平均值是满足这个要求的。根据概率论中数学期望的性质,有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00051014.jpg?sign=1739134103-p76l9oLvUovNAiLXfyyN9GntxLhWmP89-0-2714e4592f429853108007ff39682505)
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,因此,可把子样值xi看成是一随机变量,且与随机变量x有相同的理论分布和理论均值μ。于是,式(3-7)变为
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052001.jpg?sign=1739134103-Z9E1xhcMbipGPSzq4UOzJ0VKMJiRfL5b-0-d93342f69a9c82f0990534f6729d0ae4)
至此,式(3-5)得证。该式表明,子样均值 是总体均值μ的一个无偏估计量。
所谓无偏估计,当然不是说用无偏估计量来估计不产生偏离,只是说由于子样数据算出的估计值离被估计值很近,由不同子样得到的估计值在被估计值附近波动,大量估计值的平均值能够消除估计值对被估计值的偏离。正是根据子样平均值是总体均值的无偏估计值这一观点,重复测定某一物理量,如测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值或最可信赖值。换句话说,算术平均值很接近真值μ(总体均值)。可以证明,算术平均值与测定值偏差的平方和最小。
设有一不等于算术平均值的任一数A,则必有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052002.jpg?sign=1739134103-5Wm5z79VMLN6mW1uIqg3eS7oAmazSgVn-0-a647d8ef1c225bdf9e3e2256d97411ea)
对式(3-9)的证明如下:
由式(3-9)左边得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052003.jpg?sign=1739134103-UnwRtGbYS5pgmiH6NaSp4ZunbZEQJ4wt-0-dc65ed403e7e4c04ecb710752f7bd225)
移项得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052004.jpg?sign=1739134103-vbsFmN7WJUUaLtJq2oQ3rZb5SomP5FH0-0-6cd5961031e520a7ceb1e1ae80872360)
因A≠ ,又n是正整数,则必有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052006.jpg?sign=1739134103-3LGTKlI3bQpy0p6qX1NndWKep8zXyzbS-0-d1207a7437f757012b4518540fe1a01e)
即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052007.jpg?sign=1739134103-ljVydz990nFtLRjPwQi9RWvxNChLyrrn-0-83f9facb21ca9cdee66965df7426ad18)
所以
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052008.jpg?sign=1739134103-eUj2bWAh5YWGGMBLEbh6jMuo4WBssvEw-0-e55a376fc1395cabe94a812053ba15bc)
于是,式(3-9)得证。
子样平均值可作为总体均值μ的最佳估计值,这只给出了问题的一个方面。一般来说,子样均值并不等于总体均值μ。换句话说,用
去估计μ是有误差的。人们往往对这一方面也是很关心的,所以有必要介绍以下平均值的标准差。
下面根据概率论中方差的性质来进行推导:
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00052011.jpg?sign=1739134103-7jNmaD7DdSF55Cm3MV3nIlCBJJtaD75v-0-f1bbec26290063e06acefdf57f35f91c)
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,与随机变量x具有相同的分布和理论方差σ2。因此,式(3-11)变为
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053001.jpg?sign=1739134103-dk3cRhan008rERQOOXkEjpXnvtQzjSRg-0-656e53f6d16c8b79355374dc88d92ecb)
该式表明,算术平均值的方差是该总体方差σ2的1/n。由式(3-12),得
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053002.jpg?sign=1739134103-gBS30WkU9fal0ZR5rQbQnWSmTaMJfg3C-0-7374ea6663abebef43f399d2c9a7faaa)
即平均值的标准差 是平均值方差的开平方。通常,总体标准差σ是未知的,所以算术平均值的标准差常用下式表示,即
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053004.jpg?sign=1739134103-hBFglHkgOxGRjKjmi4J4rBpbfPo8sUf7-0-7cf8aa03c9df0ba52469f4a637b5bab1)
这个公式表明了平均值的标准差
与子样标准差S的关系。当标准差S不变时,n增大,算术平均值的标准差减小,即用
作为
估计的精度高。这个结论给我们以启示,在分析测定时,测定次数(子样容量)n不能太小,否则算术平均值的误差将增大。但要注意,对于式(3-14),S不变时,n>5以后,子样均值的标准差随n的增大而减小得很慢。这就是说,单靠增加观测次数来提高实验的精密度是不够的。这就意味着,要把更多的精力用来改进测试技术,往往比重复老一套的测试精度不高的测量更有意义。因此,在实际测定某一量时,由于多方面条件的限制,重复测定的次数n很少超过50次,一般在4~20次左右。
下面来证明式(3-6),由式(3-2)
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053009.jpg?sign=1739134103-Reuanxutvy0nemdfSgi4H87KYEHmhuHG-0-13bc5ed4a9ecadccc42751b2da9dadfa)
同式(3-10)的推导类似,有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053010.jpg?sign=1739134103-4FjP1iEwzVRXqiIybxfkKIud79MulkUf-0-153361090f13990469e8add7534f4024)
根据概率论中数学期望的性质、方差的定义及式(3-12),有
![](https://epubservercos.yuewen.com/84A7D5/17180255205318806/epubprivate/OEBPS/Images/img00053011.jpg?sign=1739134103-75rKKS1ci7nHLNrO4gaqHJATW6Ntu0b9-0-04bb54db5a36ace18ecf0fe26f75b9ad)
由于σ2的估计量S2的数学期望,等于被估计参数σ2的本身,这就证明了S2是σ2的无偏估计量。