- 大气污染与健康流行病学研究
- 潘小川主编
- 2918字
- 2025-03-14 23:15:08
第四节 大气污染与人群健康之间统计学关联的解释
当一项大气污染对人群健康影响的流行病学研究通过对环境暴露数据和相应人群健康数据的测量和评价,初步建立了环境暴露因素与相应人群健康效应之间的暴露-反应关系具有统计学意义(显著性水平为P<0.05)之后,还需要对该统计学关联的真实性和可靠性进行深入地分析和解读。
一、偏倚
医学研究中的偏倚(bias)是指从研究设计、实施到数据处理和分析的各个环节中产生的有方向性的系统误差和错误,以及结果解释、推论中的片面性,导致研究结果与真实情况之间出现倾向性的差异,从而错误地描述和解释了环境暴露与人群健康效应之间的联系。
流行病学研究中误差的来源可以分为两类:一类是随机误差(random error),一类是系统误差(systematic error)。随机误差是总体的抽样误差引起,是抽样过程自然产生的,其大小可以用统计学方法进行估计,但没有方向性,这种误差的存在对研究结果的影响大小和方向也是随机的,或大于或小于真值。一般环境流行病学研究暴露与健康效应之间的关联具有统计学意义就意味着该结果排除了随机误差的影响(P<0.05,置信区间95%)。
系统误差即偏倚(bias),是指研究结果系统地偏离了真实情况。与随机误差不同,偏倚的存在总是造成研究结果或高于真值或低于真值,具有方向性。当偏倚使研究结果高于真值时,称为正偏倚;偏倚使研究结果低于真值时,称为负偏倚。在研究工作中定量估计偏倚的大小很困难,要在研究工作中完全避免偏倚几乎是不可能的,但可以在流行病学研究工作的各个环节尽量加以控制和减小偏倚对结果的影响,使研究结论尽可能符合实际情况。虽然偏倚的大小很难估计,但掌握偏倚的方向相对容易,环境流行病学研究和工作的实践经验对估计偏倚的方向和大小都是非常重要的。
一般把偏倚分为两类:即选择偏倚和信息偏倚。
1.选择偏倚
出现在研究设计阶段,指由于研究对象选择不当而使研究结果偏离真实情况而产生偏倚。主要来自两方面,一是研究人群的选择不能很好地代表目标人群,主要表现为抽样随机化不够,选择的样本量不足或观察的健康效应指标发生频率太低,使研究结果出现偏倚。二是研究对象的失访,失访会使原来设计的研究对象的完整性缺失,代表性下降,所得结果自然难以代表目标人群的真实情况。
2.信息偏倚
又称观察偏倚、测量偏倚,是指研究过程中进行信息收集时产生的系统误差。如测量儿童体重的秤不准,每次测量后只能回到大于零点的位置,则用该体重秤测量的儿童体重都会比实际体重高,出现正偏倚。另外测量方法的缺陷、诊断标准不明确或资料的缺失遗漏等都是信息偏倚的来源。
由于自然环境因素十分复杂,研究对象的选择又非常广泛,偏倚是环境流行病学研究中普遍存在的问题,要完全杜绝是不现实的,只能尽量减小和控制。
控制偏倚的措施包括:①严格遵照随机抽样的原则和要求,确保随机化原则的完全实施;②样本量的确定要适当增加,留有余地,保证统计学分析的显著性;③选择合适可行的健康效应终点,保证其暴露-反应的频率到达统计学的基本要求;④正确选择测量工具和检测方法,包括调查表的设计要合理可行,保证获得准确的信息等;⑤调查员要经过培训,统一标准和认识,减少测量误差。
二、混杂
环境流行病学研究中,由于一个或多个外来因素的存在,掩盖或夸大了暴露因素与健康效应的联系,从而部分或全部歪曲两者间的真实联系,称之为混杂(confounding)。引起混杂的因素称为混杂因子(confounder)。
混杂因子必须与所研究的暴露因素和疾病(健康效应)都有联系,因此又称为第三因子。然而,要成为一个混杂因子,仅有这些联系是不够的,拥有这种联系的因子并不一定都是混杂因子,还必须满足两个条件:第一,必须是外来的独立危险因素;第二,一定不是研究因素与所研究疾病因果链上的中间变量。最常见的如大气污染物中的致癌性多环芳烃类,其致癌的过程已知需要在体内经混合功能氧化酶的氧化后先生成二氢、二羟环氧化物等中间代谢产物,再形成终致癌物,诱发人类癌症。其在体内形成的代谢产物是其致癌机制和过程的一个环节,就不是混杂因子。再如:吸烟→高血压→心脏病,吸烟→慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)→肺癌,高血压与COPD都不是外来危险因子,它们是导致心脏病及肺癌过程即病因链中的因子。混杂在环境流行病学研究中也极为常见,因为环境因素在自然界广泛存在,大多数情况下都是同时作用于人群健康,在解释统计学关联时必须认真分析是否存在其他混杂因子的干扰,而产生错误的、不准确的统计学显著性。
混杂的测量一般可用如下公式表示:
(1)若cRR=aRR(f):
则f无混杂作用,cRR不存在f的混杂偏倚。
(2)若cRR≠aRR(f):
则f有混杂作用,cRR存在f的混杂偏倚。
(3)若cRR>aRR(f):
为正混杂(positive confounding),亦称阳性混杂,即由于f的混杂作用,使cRR高估了研究因素与研究疾病之间的联系。
(4)若cRR<aRR(f):
为负混杂(negative confounding),亦称阴性混杂,即由于f的混杂作用,使cRR低估了研究因素与研究疾病之间的联系。
在某些流行病学书籍或研究实践中,也有学者把混杂作为第三种偏倚,即混杂偏倚。因为其对研究结果的作用与偏倚相同,都可使研究结果偏离正确的方向。但这里把混杂单独分出来介绍是因为混杂的干扰作用一般可以在收集数据后通过统计学方法处理,对混杂的效应进行调整和分析,缩小其影响。而前两种偏倚都要求在研究设计阶段必须注意防止,一旦研究开始,数据收集回来后偏倚已经产生,就不能调整了。
控制混杂的措施包括:①限制:针对某个或某些可能的混杂因素,在设计时对研究对象的入选条件予以限制;②配比:指的是对照选择时,使其针对一个或多个潜在的混杂因素与研究对象尽量相同或接近;③随机化(randomization):尽量随机的选择研究对象;④采用分层或多元分析技术,在数据处理时调整混杂因素。
三、交互
流行病学的交互作用(interaction)是指两个或多个因素相互依赖发生作用而产生的一种效应。若交互作用存在,当两个或两个以上的因子共同作用于某一事件时,其效应大于或小于两因子或多因子单独作用的效应。
在统计学中,统计学交互作用与效应修正(effect modification,EM)的概念是一致的。效应修正指某种效应的大小依据某些第三因子的值而变化,此第三因子称为效应修饰因子(effect modifier,EF)。EM不是需要控制的偏倚,但必须加以描述与报告。例如大气细颗粒物对人群健康的影响研究,应该同时考虑大气气象因素,如大气温度、相对湿度、风向、降雨等与大气细颗粒物对健康效应的交互作用影响。因为气温等因素对健康的影响已有证实,不同气温条件下,大气细颗粒物对人群健康效应的影响也会有所不同,模型上就表现为一种统计学的效应修正作用。这两种因素的交互作用与大气细颗粒物或气温对健康效应分别的单独作用是不同的,应该在统计学模型中体现出来。
因此,在对环境流行病学建立的统计学关联进行解释和分析时,剔除了偏倚的干扰,再剔除了混杂的影响,还需要对关联中可能包含的因素间交互作用及效应修饰因子进行描述和分析。所以,在初步建立的环境暴露与健康效应的统计学关联中,需要分别剔除偏倚、混杂和交互这三种因素对统计学结果的干扰和破坏,观察有显著意义的统计学关联是否还能存在。如果不存在,则不能证伪,说明之前建立的统计学关联是“伪关联”。如果关联仍然存在,则有较大把握提示,该环境暴露与健康效应的关联真实存在,可以进行下一步的病因推断。