一、均数的抽样误差
第十六章讲了总体与样本的关系。抽样研究的目的是用样本信息推断总体特征。假设要了解某地20岁健康男大学生身高的总体均数,我们在该地随机抽取了110名健康男大学生,得身高的样本均数为172.73(cm),可用它估计该地20岁健康男大学生身高的总体均数。由于存在变异,用样本算得的样本均数x往往不等于总体均数μ;若再从该地20岁健康男大学生中随机抽取含量皆为110人的很多个样本,因各样本包含的个体不同,所得的各个样本均数也不一定都相等,这种由抽样而造成的样本均数与总体均数之差异或各样本均数之差异称为均数的抽样误差。
在抽样研究中,抽样误差是不可避免的,但可以估计其大小,可通过下面的模拟试验说明。现把例18.2中110名20岁健康男大学生的身高写在110个玻璃球上,把该110个身高数值作为假设的有限总体,其总体均数μ=172.73(cm),标准差σ为4.09(cm)。将这些玻璃球放在布袋中作随机抽样试验,每次从中随机抽取10个玻璃球为一样本,记录下数据并计算其均数、标准差、然后把10个玻璃球再放入布袋,充分混匀后再抽,共重复100次,求得100个样本均数x和标准差s,其样本均数入表19-1。
表19-1 100个10球样本均数
173.22 | 172.06 | 170.89 | 174.07 | 172.60 | 173.14 | 172.61 | 172.26 | 171.93 | 172.85 |
175.23 | 173.76 | 174.77 | 172.57 | 171.76 | 172.74 | 173.36 | 173.69 | 171.10 | 173.40 |
173.87 | 172.70 | 173.23 | 173.08 | 172.46 | 171.54 | 171.72 | 170.95 | 172.89 | 173.43 |
170.61 | 173.82 | 171.02 | 173.11 | 172.51 | 172.07 | 171.60 | 171.79 | 172.98 | 172.05 |
171.11 | 173.66 | 171.21 | 173.15 | 172.12 | 172.53 | 173.21 | 173.25 | 172.03 | 172.42 |
175.02 | 171.45 | 173.76 | 176.02 | 173.52 | 172.28 | 170.59 | 171.93 | 173.54 | 172.44 |
172.05 | 173.44 | 174.01 | 172.77 | 174.04 | 171.37 | 172.07 | 173.85 | 173.06 | 170.41 |
171.88 | 173.38 | 172.83 | 170.89 | 174.55 | 171.45 | 174.11 | 171.88 | 172.78 | 173.73 |
171.73 | 172.58 | 174.50 | 172.58 | 172.89 | 173.40 | 174.21 | 172.34 | 171.18 | 171.19 |
172.70 | 172.77 | 173.47 | 172.13 | 172.56 | 172.13 | 169.63 | 170.71 | 172.63 | 172.14 |
上述模拟试验的结果表明,在抽样研究中抽样误差是不可避免的。反映均数抽样误差大小的指标是样本均数x的标准差,简称标准误(standard error)。