二、总体率的可信区间
由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范围,根据样本含量n和样本率P的大小不同,分别采用下列两种方法:
(一)正态近似法
当样本含量n足够大,且样本率P和(1-p)均不太小,如np或n(1-p)均≥5时,样本率的分布近似正态分布,则总体率的可信区间可由下列公式估计:
总体率(π)的95%可信区间:p±1.96sp
总体率(π)的99%可信区间:p±2.58sp
例如前述两组高碘地方性甲状腺肿患病率的总体患病率可信区间为:
第一组:
95%可信区间为1.78%±1.96×0.23%=1.33%~2.23%
95%可信区间为1.78%±2.58×0.23%=1.19%~2.37%
第二组:
95%可信区间为5.6%±1.96×0.41%=4.80%~6.40%
95%可信区间为5.6%±2.58×0.41%=4.54%~6.66%
(二)查表法
当样本含量n较小,如n≤50,特别是p接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数X参照专用统计学介绍的二项分布中95%可信限表。