二、总体均数的估计
为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。
由求t的基本公式
[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue087.jpg[alt][/alt][/img]
我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5%
界即t0.05,,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求
出区间来估计总体均数μ所在范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。下面用实例说明其求法。
95%可信区间 X-t0.05,νSX<μ<X+T0.05,ΝSX(6.6)
99%可信区间 X-t0.05,νSX<μ<X+T0.01,ΝSX(6.7)
例6.2 上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,试求95%与99%可信区间。
1.求标准误
[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue088.jpg[alt][/alt][/img]
95%可信区间 488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内
99%可信区间 488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估计μ是在425.22~551.98区间内
这里两个可信区间都包含μ=500在内,所以这次估计是估计对了。
抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,它们是:
样本号 | X | 95%可信区间 |
6 | 546.7 | 515.78~577.62 |
7 | 524.5 | 500.45~548.55 |
28 | 476.1 | 454.91~497.29 |
72 | 465.3 | 447.02~483.58 |
75 | 526.6 | 503.10~550.10 |
平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很难说了。如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本,以至总体均数并不在我们提出的区间内。不过,我们具体所作的这次估计到底属于前种情况还是后一种,这是无法知道的,因为我们不知道μ是多少(若已知μ便不必估计它了)。然而象后种情况那样作出错估的概率终究很小,只5%或1%,所以用这样的方法估计总体均数还是可行的。