一、病例对照研究
[b](一)概说[/b] 病例对照研究(casecontrol study)是主要用于探索病因的一种流行病学方法。它是以某人群内一组患有某种病的人(称为病例)和同一人群内未患这种病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象;调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量);通过对两组暴露史的比较,推断研究因子作为病因的可能性:如果病例组有暴露史者或严重暴露者的比例在统计学上显着高于对照组,则可认为这种暴露与患病存在统计学联系,有可能是因果联系(图4-1)。究竟是否是因果联系,须根据一些标准再加以衡量判断(详见第七章“病因及其推断”)。所谓联系(associatiom)是指两个或更多个变量间的一种依赖关系,可以是因果关系,也可以不是。 [img]https://baike.zhuayao.net/Uploads/zyzy/lilunshuji/liuxingbingxue/liuxingbingxue026.gif[alt]病例对照研究示意图[/alt][/img] 图4-1 病例对照研究示意图 例如,对一组肺癌病人(病例组)和一组未患肺癌但有可比性的人(对照组)调查他们的吸烟(暴露)历史(可包括现在吸烟否,过去吸过烟否,开始吸烟年龄,吸烟年数,最近每天吸烟支数;如已戒烟则为戒烟前每日吸烟支数,已戒烟年数,等等)。其目的为通过比较两组吸烟史的差别,检验吸烟(可疑病因)与疾病(肺癌)有因果联系的假设。这就是病例对照研究。 实例1.吸烟与肺癌的关系。 英国流行病学家A.B.Doll与R.Hill于1948~1952年进行过一项病例对照研究。他们从伦敦20所医院及其他几个地区选取确诊的肺癌1465例。每一病例按性别、年龄组、种族、职业、社会阶层等条件匹配一个对照;对照系胃癌、肠癌及其他非癌症住院病人,也是1465例。由调查员根据调查表询问调查。经分析数据,得到的主要结果有:①肺癌病人中不吸烟者的比例远小于对照组:男性占0.3%,女性占31.7%;而对照组中男性不吸烟者占4.2%,女性占53.3%,差别均很显著;②肺癌病人在病前10年内大量吸烟者(≥25支/日)显著多于对照组;③随着每日吸烟量的增加,肺癌的预期死亡率。(推算出的年死亡率)也升高,例如男性45岁~64岁组日吸烟25~49支者与不吸烟者死亡率之比为2.94/0.14,即前者的率为后者的21倍;④肺癌病人与对照组比较,开始吸烟的年龄较早,持续的年数较多,而病例中已戒烟者的停吸年数也少于对照组中已戒烟者。 以后,Hill,Doll,Peto等又用前瞻性队列研究法深入研究,经长达20年(女性经22年)的观察,更加令人信服地提示出吸烟为肺癌的主要病因以及吸烟对健康的其他多种危害。他们的结论已为其他许多研究所证实,成为许多国家提倡不吸烟、限制吸烟及限制卷烟销售政策的科学基础。 病例对照研究是最常用的分析流行病学方法。因其需要的调查对象数目较少,人力、物力都较节省,获得结果较快,并且可由临床医生在医院内进行。对于少见病的病因研究,常为唯一可行的方法。但这些优点都是与前瞻性队列研究相对而言的,实际上倘与同等规模的临床研究或实验室研究比较,病例对照研究所费的时间与精力可能更多。 本书以临床医学专业学生为主要读者,并不要求他们能掌握或独立应用分析流行病学方法,目标只是了解大概、扩大眼界、培养科学思辨能力,领会科学上获得一个发现或作出一个结论的复杂过程及需要的客观态度。 病例对照研究是从现在是否患有某种疾病出发,回溯过去可能的原因(暴露),在时间顺序上是逆向的,即是从“果”推求“因”,所以又称回顾性调查、研究。 病例对照研究(及其他类型的流行病学研究)中所谓的暴露(exposure)是指研究对象(病例或对照)具有某种疑为与患病与否可能有关的特征或曾受到某种疑为与患病与否可能有关的因子的影响。所谓特征(characteristic)可以是体质上的、生理上的、也可是心理精神上的;即可以是遗传性的也可以是获得性的;所谓因子(因素)既可以是外界的也可以是机体内在的;特征或因子可以是致病性的,也可以是保护性的(使人免于患病的)。因此,“暴露”是一个涵义广泛的概念。 [b](二)方法[/b] 1.样本含量的估计 为了研究一种暴露与疾病的关系需要多大一个样本,也就是需要多少个病例和多少个对照,首先取决于4个条件:①人群中暴露者的比例;②假定暴露造成的相对危险度(其涵义详见后文);③要求的显著性水平;④要求的把握度。从这4个条件估算样本的含量的方法,详见附录五。实际上,样本含量还受许多因素的制约,例如病例和对照的来源、财力、人力、完成期限等。假定只有一定数目的病例与对照可以利用,则一个研究能查出的最小相对危险度是多少?又假定经费数目已限定,则应选多少个病例与对照才能取得最大的把握度,这些都是应考虑的问题。此外,评价交互反应,控制混淆因素,亚组分析,每例多个对照等均影响所需样本的大小。 2.病例和对照的来源与选择 (1)病例:主要有两种来源:①从医院病人选择,即是从某一所或若干所医院选择某时期内就诊或住院的某种病的全部病例。病例应符合统一的、明确的诊断标准。最好是新发生的(新诊断的)病例。因为一种病的全部病例不大可能都有进入某一所或几所医院的同等机会,能进入的只是其中符合条件(即选择因素)的那一部分,所以不要求能代表某时某地的全部病例,但应要求能代表产生病例的人群,即该人群只要发生该种病例均可能进入该院。这样,结果的普遍性虽受限,但真实性不受影响,而真实性是普遍性的前提。这种研究称为以医院为基础的(hospital-based)病例对照研究;②从某特定人群选择病例,即是以符合某一明确规定的人群在某时期内(一年或几年,视病例发生多少而定)的全部病例或当病例数过多时以其中的一个随机样本作为研究对象。其优点是选择偏倚比前一种来源的小,结论推及该人群的可信程度较高。这种研究称为以人群为基础的(population-based)病例对照研究。 (2)对照:设立对照的目的在于估计如果疾病与暴露无联系,则病例组的暴露率可能为多少,也就是为比较提供一个基准。因此,对照与病例在一些主要方面必须具可比性。首先,对照必须从病例所来自的人群选择,对照是有可能成为病例的人,换言之,每一病例在未发病前应该是合格的对照,而每一对照若发病都有可能成为病例组的成员。对照选择是否恰当是病例对照研究成败关键之一。 通常的做法是:如果病例组来自某一特定人群,则可以该人群的非病例(即未患该种疾病的人)的一个随机样本作对照;如果病例来自某所医院,则可从同医院同时就诊或住院的其他病例中选择对照。要求对照具有和病例一致的某些特征,即对照与病例有可比性,例如性别、年龄、居住地等;同时要求对照没有患和研究因子与研究疾病有关的其他疾病的可能。例如,研究吸烟与肺癌的关系时,不能以慢性支气管炎病人为对照,因为吸烟同时是这两种病的可能病因;研究胃癌的病因不能以“慢性胃炎”病人为对照,因为这两种病在病因上有密切关系,前者可能是后者在病因链上的一环。上述要求的目的都是减少混淆偏倚。其他来源的对照如病例的邻居、同事、亲属等。各种不同来源的对照要解决的问题不同,都各有其局限性。例如,邻居对照可控制社会经济地位的混淆作用,兄弟姊妹对照是考虑控制早期环境的影响和遗传因素的混淆作用(极端要求为用同卵孪生),配偶对照是主要考虑成年期环境的影响。最常采用的方式是对照和病例都选自同一医院,因为理论上他们都来自该医院所服务的同一人群,而且对两者都可在相同的环境中进行调查,也易于合作。但是由于不同病种的患者入院的机会不同,有可能使本来与某病无关的特征在医院病例中表现出虚假的联系(详见第七章“病因及其推断”)。为了减少这种偏倚发生的可能性,应该选取多种疾病而不是一种疾病的病人作对照。 3.病例与对照的配合 设置对照的作用在于平衡除了研究因子(暴露)以外的其他可能影响患病的因素,也就是说如果暴露与所研究的疾病不存在联系的话,病例的暴露比例(率)应该与对照的无显著差别;如果发现显著差别,既然对照与病例在其他有关方面都可比较,因此可以推断患病与否可能是与暴露率的差别有联系。为使两者具可比性,首先可以通过限制选择病例与对照的范围(例如年龄范围、性别、种族等),使有关因子尽可能齐同。病例组与对照组的某些特征不应存在显著差别,即应该均衡。 另一个选择对照的重要方法叫匹配(matching,曾译“配比”),又称匹配抽样(matchedsampling),就是在安排病例与对照时,使两者的某些特征或变量相一致。具体做法有两种:一种叫成组匹配或频数匹配,即在选择好一组病例之后,在选择对照组时要求其某些特征或变量的构成比例与病例组的一致(即在两组的总体分布一致),例如性别、年龄构成一致,具体做法上类似分层抽样。另一种做法叫个别匹配,就是以每一病例为单位,选择少数几个特征或变量方面与病例一致的一个或几个对照者组成一个计数单位或计数和分析单位。一个病例匹配一个对照的(即1:1匹配)一般称为配对,也就是说由一个病例和一个对照组成对子(pair)为一个计数单位。 个别匹配,特别是1:1匹配,最常被采用。理论上,一个病例可以匹配多个对照,但研究证明病例与对照之比超过1:4时,统计效率不会明显增加,但工作量却增大。如果病例与对照来源都充足,调查费用又差不多,则以1:1匹配最合适;如果病例数有限而对照易得,则可采用一个病例匹配几个对照的办法以提高统计效率(例如实例2)。 在病例对照研究中采用匹配的目的,首先在于提高研究效率(study efficiency),表现为每一研究对象提供的信息量的增加。匹配后再按匹配的因素进行分层分析,可使每一个匹配层中都有一定数目的病例与对照,不至于因有的层只有病例有的层只有对照而无法对比,不能提供信息。其次,在于控制混淆因素的作用。所以匹配的特征或变量必须是已知的混淆因子,至少也应有充分的理由这样怀疑,否则不应匹配。 无论是否采用匹配设计,为控制混淆作用都须在分析阶段用分层、标准化或多元分析,但匹配后再按匹配因素作分层分析可以提高分析的效率,也就是提高了控制混淆因素的效率。 但是匹配也要付出代价:匹配增加了寻找对照的速度,以同样的低价也许可以得到更多不匹配的对照,从而扩大样本含量。从这个意义上说,匹配又降低了研究效率。增加匹配项目又会导致可能作为对照者的减少,无法找到可匹配对照的病例只得被剔除;一个项目一经匹配不但使它与疾病的关系不能分析而且使它与其他研究因子的交互作用也不能充分分析。把不必要的项目列入匹配,企图使病例与对照尽量一致,如果匹配的因素与暴露有联系,就可能人为地造成更多的病例与对照暴露史一致的对子,徒然丢失信息,增加工作难度的结果反而是降低了研究效率。这种情况称为匹配过度(over-matching),应注意避免。 匹配的变量应一致到什么程度,取决于变量的性质、实际可能与必要:离散变量(即属性,无中间值的变量)可以完全匹配,连续变量(在一定范围内可取任何值的变量)往往划分为若干类或组,再按此匹配。例如按年龄分组、按血压分组、按吸烟量分组匹配。分得太细,会增加工作难度,也不一定必要,例如年龄要求同岁;但分得太粗,例如年龄按10岁分组,又达不到控制混淆作用的目的。 当估计有许多可能的混淆因素需要控制时,倘仅靠分层则因层数太多不能保证每层均有病例与对照,所以采用匹配以保证有效的分层分析。其次,有的列名变量包含许多类别或内容复杂(例如职业、种族、居住地、籍贯、兄弟姊妹等),如是可能的混淆因子,应加匹配。否则单靠分层不能控制混淆作用。 匹配可保证对照与病例在某些重要方面的可比性。对于小样本研究以及因为病例的某种构成(例如年龄、性别构成)特殊,随机抽取的对照组很难与之平衡时,个别匹配最为有用。 一般除性别、年龄之外,对于其他因素是否列入匹配须持慎重态度,以防止匹配过头及徒增费用和延长完成时间。 4.计划和执行 病例对照研究在制订计划和执行时应注意以下问题: (1)主要假设的说明是否清楚、简明而且可以检验? (2)疾病与暴露变量的定义清楚、明确否? (3)是否拟探索剂量反应关系和多个危险因素的联合作用? (4)为解答问题所需之病例数和对照数能否得到?这样大小的样本能查出的最小相对危险度是多少?与估计的相差多少?[参考附录五(四)节]。 (5)病例来源及抽样技术明确否?病例数与对照数之比是多少?匹配否及匹配哪些变量? (6)调查表(问卷)是否已包括打算测量的所有变量并能够收集到需要的数据?其详尽程度是否已足供分析之用? (7)医院记录(病历)及其他来源的信息、从体检、实验室检查、病理切片等获得的数据需表格记录否? (8)调查表经过试用否?其真实度与可靠度(重复性)经评估否?访问时拟使用帮助回忆的实物、模型或图片否? (9)调查员、质控员、病历摘录员、编码员的工作手册已编好否?须专门培训否? (10)组织机构、人员、设备、经费落实否? (11)协作单位有书面协议否?有关领导机关已批准否?将诊断根据(切片、标本、影像图片等)送到主持单位复核安排妥当否? (12)实验室检验项目或用仪器检测的项目所用仪器、方法、试剂是否符合标准?结果的真实度与可靠度经过考核否? (13)经治医院、医生是否同意提供病例和对照?是否必须取得研究对象在了解情况后的书面同意?资料、数据怎样保密?怎样保存? 5.数据分析 须分析什么项目,计算哪些统计量,用什么统计学方法,用手工(计算器)还是计算机,如用后者怎样建数据库和用什么软件包,等等,都应包括在设计之中,手工计算时还应拟好相应表格。现在计算机及统计软件包的应用渐趋普及,过去很难进行的一些复杂的统计检验现在很快就可完成并打印出结果还可绘出统计图。但是,一些流行病学专家主张先用手工计算基本内容以熟悉数据,然后再由计算机作复杂运算(多元分析)。 本节要介绍的是基本原理和基本方法,无论用手工或机器运算,这些都是应熟悉的。 病例对照研究数据分析的中心内容是比较病例和对照中暴露的比例并由此估计暴露与疾病的联系程度,并估计差别与联系由随机误差造成的可能性有多大,特别要排除由于混淆变量未被控制而造成虚假联系或差异的可能。进一步,还可计算暴露与疾病的剂量反应关系,各因子的交互作用(对一种因子的暴露会不会影响对另一种因子的效应),等等。非匹配和匹配设计的研究,数据的分析方法有一些不同。 (1)非匹配数据的分析:首先要检验病例组与对照组在某些主要特征(即可能成为混淆因子的特征)的构成上是否没有显著差别(均衡性检验)。 1)联系的显著性与联系强度:某个因素与某种结局(患病或死亡)之间的联系是否有统计学显著性,常用χ[SB]2[/SB]检验。最简单的情况是因素与结局都只分为“有”或“无”两类,数据可纳入一张2×2表(即四格表,又称四格列联表),例如表4-1。χ[SB]2[/SB]检验可用四格表专用公式(式4-1)。但χ[SB]2[/SB]值的大小并不表示联系的强度。χ[SB]2[/SB]≥3.84时,设两者无联系的假设(无效价设,H[XB]0[/XB])被否定,而转向存在联系的假设(备择假设,H[XB]A[/XB]),这个判断错误的可能性为≤0.05(即ρ≤0.05)。χ[SB]2[/SB]值越大,判断错误的可能性越小。 表4-1 危险因子与疾病的联系患病 | 有暴露史 | 无暴露史 | 合计 |
有 | a | b | a+b |
无 | c | d | c+d |
合计 | a+c | b+d | a+b+c+d=n |
组别 | 病倒 | 对照 | 合计 |
暴露 | α[XB]i[/XB] | b[XB]i[/XB] | m[XB]1i[/XB] |
未暴露 | c[XB]i[/XB] | d[XB]i[/XB] | m[XB]0i[/XB] |
合计 | n[XB]1i[/XB] | n[XB]0i[/XB] | n[XB]i[/XB] |
饮酒史 | 病倒数 | 对照数 | 合计 |
饮 酒 | 171 | 381 | 552 |
不饮酒 | 29 | 395 | 424 |
合计 | 200 | 776 | 976 |
不吸烟者 | 吸烟者 | ||||||
饮酒史 | 病倒 | 对照 | 合计 | 饮酒史 | 病倒 | 对照 | 合计 |
饮 酒 | 69 | 191 | 260 | 饮酒 | 102 | 190 | 292 |
不饮酒 | 9 | 257 | 266 | 不饮酒 | 20 | 138 | 158 |
合计 | 78 | 448 | 526 | 合计 | 122 | 328 | 450 |
病倒 | 对照 | 合计 | |
暴露 | 未暴露 | ||
暴 露 | f[XB]11[/XB] | f[XB]10[/XB] | f[XB]11[/XB]+f[XB]10[/XB] |
未暴露 | f[XB]01[/XB] | f[XB]00[/XB] | f[XB]01[/XB]+f[XB]00[/XB] |
合计 | f[XB]11[/XB]+f[XB]01[/XB] | f[XB]10[/XB]+f[XB]00[/XB] | N |
心肌梗死病倒 | 对 照 | 合计 | |
SBP≥18.6 | SBP<18.6 | ||
SBP≥18.6 | 15 | 60 | 75 |
SBP<18.6 | 35 | 40 | 75 |
合计 | 50 | 100 | 150 |