二、总体均数的估计

为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。 由求t的基本公式 [img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue087.jpg[alt][/alt][/img] 我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5% 界即t0.05,,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求 出区间来估计总体均数μ所在范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。下面用实例说明其求法。 95%可信区间 X-t0.05,νSX<μ<X+T0.05,ΝSX(6.6) 99%可信区间 X-t0.05,νSX<μ<X+T0.01,ΝSX(6.7) 例6.2 上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,试求95%与99%可信区间。 1.求标准误 [img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue088.jpg[alt][/alt][/img] 95%可信区间 488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内 99%可信区间 488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握估计μ是在425.22~551.98区间内 这里两个可信区间都包含μ=500在内,所以这次估计是估计对了。 抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,它们是:
样本号X95%可信区间
6546.7515.78~577.62
7524.5500.45~548.55
28476.1454.91~497.29
72465.3447.02~483.58
75526.6503.10~550.10
平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很难说了。如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本,以至总体均数并不在我们提出的区间内。不过,我们具体所作的这次估计到底属于前种情况还是后一种,这是无法知道的,因为我们不知道μ是多少(若已知μ便不必估计它了)。然而象后种情况那样作出错估的概率终究很小,只5%或1%,所以用这样的方法估计总体均数还是可行的。