四、运用平均数的注意事项
平均数是描述一群同质变量值集中位置的特征值,用来说明某现象或事物数量的中等水平。通常用平均数作为算术均数、几何均数、众数、中位数等的统称,而以均数作为算术均数的简称。
[b]1.同质的事物或现象才能求平均数[/b] 我们检查200名正常人的红细胞数(万/mm[SB]3[/SB])计算平均数,定出正常值范围,作为诊断贫血的依据之一。如果正常人中混有贫血患者,那么求出的平均数既不能说明正常人也不能说明贫血患者,有人把它称为虚构的平均数,因为它模糊了数量特征,不能提供分析的依据了。因此计算平均数以前必须考虑资料的同质性。有人研究某药物的利尿作用,观察了二条狗、三头兔子用药前后的排尿滴数,曾将狗与兔子的排尿滴数加在一起求平均数。由于狗体大,排尿滴数较兔子的多,得到的平均数对狗来说似嫌少,而对兔子来说又显得太多,这是虚构平均数的又一例。
像狗与兔子,贫血患者与正常人的不同质是显而易见的。但即使是正常人,性别、年龄、地区不同,红细胞数的均数也有差异。那么怎样才算是同质呢?是否同质,要根据研究目的而定。例如研究痢疾患者的平均治愈日数时,要考虑不同病原菌、不同型别(急性、慢性等)的患者是不同质的。但当研究传染病的住院日数时,则不同疾病(痢疾、伤寒、……)是不同质的,而所有痢疾病人,不论由何种病原菌引起,或是何种型别都认为是同质的了。若研究各医院的平均住院天数时,医院类型(传染病院、儿童医院、综合医院、……)以及同类医院中,科室(内、外、传染……)设置及床位分配不同等就是不同质的了。不同质的事物就要分组求平均数,以便分析比较。因此科学的平均数是建立在分组的基础上的。
[b]2.用组平均数补充总平均数[/b] 表4.7是某院1983年的治愈者平均住院天数。总均数为18天。但从表中可见,它所包含的20类(其他类除外)的疾病中,变态反应及中毒、小儿科疾病住院天数最短为9天,而结核病的却长达60天。住院天数高于总均数的有10类,治愈人数共1358人,占治愈总人数(其他类除外)的35%。若医疗质量基本不变,多收结核病人,住院天数的总均数无疑会延长;而多收小儿患者,总均数就会缩短。因此如没有收容病种的分析,仅从总均数的延长或缩短来看医疗质量是不科学的。而对各时期同种疾病的住院天数进行分析,比较适宜。
表4.7某医院1983年各类疾病治愈者的平均住院天数
病类 | 治愈人数 | 平均住院天数 | 病类 | 治愈人数 | 平均住院天数 |
传染病寄生虫病 | 437 | 13 | 外科疾病 | 549 | 18 |
结核病 | 109 | 60 | 外伤 | 383 | 28 |
呼吸系疾病 | 246 | 14 | 肿瘤 | 65 | 34 |
消化系疾病 | 255 | 24 | 眼科疾病 | 112 | 14 |
内分泌疾病 | 41 | 35 | 耳鼻喉科疾病 | 417 | 10 |
循环系疾病 | 34 | 37 | 口腔科疾病 | 30 | 12 |
血液及造血系统疾病 | 7 | 33 | 皮肤科疾病 | 224 | 22 |
神经系疾病 | 111 | 25 | 妇产科疾病 | 78 | 12 |
变态反应及中毒 | 43 | 9 | 小儿疾病 | 601 | 9 |
风湿病 | 21 | 10 | 其他 | 35 | 19 |
泌尿系疾病 | 129 | 21 | 合计 | 3927 | 18 |
3.根据资料的分布选用适当的平均数 计量资料如是单峰对称分布,宜用均数,亦可用中位数。若是偏态分布则中位数的代表性常较均数为好。某些传染病的潜伏期、抗体滴度、细菌计数、率或比的变化速度及某些物质浓度等,其频数分布明显偏态,但经对数代换后近于正态分布的,如图4.3资料,应计算几何均数以描述其中等水平。