一、正态性检验

有些统计方法只适用于正态分布或近似正态分布资料,如用均数和标准差描述资料的集中或离散情况,用正态分布法确定正常值范围及用t检验两均数间相差是否显着等,因此在用这些方法前,需考虑进行正态性检验。

正态分布的特征是对称和正态峰。分布对称时众数和均数密合,若均数-众数>0,称正偏态。因为有少数变量值很大,使曲线右侧尾部拖得很长,故又称右偏态;若均数-众数<0称负偏态。因为有少数变量值很小,使曲线左侧尾部拖得很长,故又称左偏态,见图7.1(a)。

正态曲线的峰度叫正态峰,见图7.1(b)中的虚线,离均数近的或很远的变量值都较正态峰的多的称尖峭峰,离均数近或很远变量值都较正态峰的少的称平阔峰。

频数分布的偏度和峰度

图7.1 频数分布的偏度和峰度

正态性检验的方法有两类。一类对偏度、峰度只用一个指标综合检验,另一类是对两者各用一个指标检验,前者有W法、D法、正态概率纸法等,后者有动差法亦称矩法。现仅将W法与动差法分述于下;

1.W法 此法宜用于小样本资料的正态性检验,尤其是n≤50时,检验步骤如下;

(1)将n个变量值Xi从小至大排队编秩。

X1<X2<……<XN<p

见表7.5第(1)栏,表中第(2)、第(3)栏是变量值,第(2)栏由上而下从小至大排列,第(3)栏由下而上从小至大排列。第(4)栏是第(3)栏与第(2)栏之差。

(2)由附表5按n查出ain系数列入表7.5第(5)栏,由于当n为奇数时,对应于中位数秩次的ain为0,所以中位数只列出,不参加计算。第(6)栏是第(5)栏与第(4)栏的乘积。

(3)按式(7.8)计算W值

[/alt][/img](7.8)</p><p>式中分子的∑,当n是偶数时,为 [img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue119.jpg[alt]的缩写,当n是奇数时为 [/alt][/img]的缩写,表7.5</p><p>第(6)栏的合计平方后即为分子。分母按原始资料计算。</p><p>(4)查附表6得P值,作出推断结论,按n查得W(n,α),α是检验前指定的检验水准,若W>W(n,α)则在α水准上按受H<sub>0</sub>,资料来自正态分布总体,或服从正态分布;若W≤W(n,α),则在α水准上拒绝H<sub>0</sub>,接受H<sub>1</sub>,资料非正态。</p><p>例7.8 测得20例40—49岁健康人右侧腓总神经的传导速度(m/sec)如表7.5第(2)、第(3)栏,试检验此资料是否服从正态分布。</p><p>H<sub>0</sub>:总体服从正态分布</p><p>H<sub>1</sub>:总体为非正态分布</p><p>α=0.05</p><p>计算表7.5各栏。</p><p>表7.5 W法正态性检验计算表</p><p><table><tbody><tr><td>秩号</td><td colspan=

[/alt][/img](7.10)</p><p>[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue123.jpg[alt](7.11)

[/alt][/img](7.12)</p><p>g<sub>1</sub>、g<sub>2</sub>的抽样误差分别为S<sub>g1</sub>与S<sub>g2</sub>,见式(7.13)与式(7.14)</p><p>[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue125.jpg[alt](7.13)

[/alt][/img](7.14)</p><p>假设检验用u检验,其公式为</p><p>u<sub>1</sub>=g<sub>1</sub>/S<sub>g1</sub>        (7.15)</p><p>u<sub>2</sub>=g<sub>2</sub>/S<sub>g2</sub>        (7.16)</p><p>u的显著性界限为</p><p>∣u∣<1.96P>0.05在α=0.05的水准上接受H<sub>0</sub>。</p><p>1.96≤∣u∣<2.580.05≥P>0.01在α=0.05的水准上拒绝H<sub>0</sub>。</p><p>∣u∣≥2.58P≤0.01在α=0.01的水准上拒绝H<sub>0</sub>。</p><p>例7.9 用动差法检验例7.8的资料是否服从正态分布。</p><p>1.H<sub>0</sub>:频数分布对称,H<sub>1</sub>:频数分布不对称。</p><p>2.H<sub>0</sub>:频数分布为正态峰,H<sub>1</sub>:频数分布不是正态峰。</p><p>α=0.05</p><p>∑(X-x )<sup>2</sup>=355.36,∑(X-x )<sup>3</sup>=-1032.45</p><p>∑(X-x )<sup>4</sup>=20150.4316 n=20</p><p>[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue127.jpg[alt]

[img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/yixuetongjixue/yixuetongjixue128.jpg[alt][/alt][/img]

u2=0.6221/0.9924=0.627 P>0.20

在α=0.05的水准上接受H0,频数分布对称(P>0.05),并为正态峰(P>0.20)。因此可认为该资料服从正态分布。