第二章 暴露测量的原则
测量,是对事物或现象进行量化描述的过程,包含“大小、单位和误差”三要素,是人类认识外界的途径,也是大多数自然学科、技术学科、经济学科和社会学科的基石。
如何获得真实准确的测量信息,是流行病学的研究核心之一。在前瞻性超大规模队列(Mega Cohort)的研究范畴内,临床结局测量(发病、复发、转归、治愈、死亡等)多依赖于临床诊断和其他信息来源,因此,本章节将以“暴露测量”为核心,主要阐述以下4个问题:
●测量什么?——研究人群及研究因素的确定。
●怎么测量?——测量方法及工具的选择。
●测量真实准确么?——测量误差来源和大小的判断。
●如何更好地测量?——减少测量误差的方法。
一、测量对象
(一)研究人群
研究人群的选择取决于研究假设及实际条件。大型队列着眼于病因学研究,为一般人群的疾病预防控制提供效力更强的本土化证据,但这并不意味着研究人群一定要对一般人群具备良好的代表性(representativeness)。因此,可将队列研究分为以下两类:
1.以人群为基础(population-based)
由于其具备良好的外部真实性(external validity),所以其研究结论一般具有良好的普适性(generalizability),具体体现在:①可以估计研究变量在源人群中的分布;②通过比较源人群基线横断面调查与队列研究重复测量的结果,可以准确评估危险因素的变化趋势;③在“暴露与疾病关联”的队列研究中,良好的人群代表性无疑是获得“无偏估计”(unbiased evaluations)的理想条件。然而,为保证人群代表性而带来的高昂成本和实际操作复杂性,将大大限制其可行性1。
2.不以人群为基础(nonpopulation-based)
如果队列研究的主要目的在于比较不同特征“子人群”(subgroups)的健康状况,即暴露与疾病的关联(relationship),随机抽样或人群代表性则并不重要2。即使队列研究人群不具备良好的人群代表性,只要比较组之间的偏倚程度相当,那么一样可以获得无偏的效应估计,如相对危险度(relative risk)和比值比(odds ratio)3,4。
(二)研究因素
大型人群队列研究中,可以同时检验多种暴露与多种结局之间的关联。因此,在选择研究因素时,应根据研究目的在疾病病因链(网)中从远端病因到近端病因中的各个环节,同时在社会水平、社区水平和个体水平确定研究因素(表2.1)。同时,亦应确定所需收集的其他相关因素,如研究对象人口学特征及可疑的混杂因素,且混杂因素收集的准确性和质量应和所关注的主要研究因素相同。
表2.1 病因链(网)模型
暴露因素的测量一般应定量,某些因素(如饮酒量、吸烟量等)若难以精确测量也应尽量采取半定量方法。对于研究因素的调查,除了暴露水平外,还应考虑其暴露时间及暴露方式,如间歇暴露或连续暴露、直接暴露或间接暴露、一次暴露或长期暴露等。
确定研究因素后,应根据研究目的和研究因素的特点,通过多种途径、方法收集所关注的暴露信息。需要特别指出的是,在大型人群队列基线调查时收集生物样本,并尽可能长期保存,是十分重要的,原因主要有两点:①可在研究进行过程中添加新的暴露生化指标,而非在设计阶段就面面俱到;②对于当下不可及的检测技术或昂贵的检测费用,采用长期储存的方式,可期待未来的技术更新及费用降低,从而控制成本。
二、测量方法及工具
(一)方法
暴露信息可以通过直接或间接测量的方式获取,直接测量的暴露信息往往反映的是机体“内暴露”的现状,存在半衰期、组织特异性、个体内差异或个体间差异的特点,而间接测量则需要依据一定假设对获得的暴露信息进行推导、计算和转化才能获得个体“暴露”的估计值,两者在一定情况下并不存在绝对的界限。在前瞻性大型队列研究中,暴露测量的方式种类繁多,一般而言可概括为下列6种。但在现场调查中通常会综合多种方法。
(1)问卷量表法(questionnaires):包括自填式(self-administered)或访谈式(intervieweradministered);
(2)生物样本检测:如血液、尿液、唾液、毛发、指甲、粪便检测等;
(3)体格检查(physical examinations):如身高、体重、腰围、臀围等;
(4)影像学检查(imaging examination):如超声、X线片、CT扫描等;
(5)暴露记录(exposure records):如医疗记录、就业记录、地理信息记录等;
(6)环境检测(measures of environment):如水、土壤、空气等。
以上测量方法及工具的具体细节,将在后面的章节逐一介绍。另外,随着便携式设备(如计步器、智能手机、平板电脑等)和互联网(如电子邮件、社交网络、云技术等)的发展,在条件允许的情况下,可实时获取研究对象的相关信息(如能量消耗、血压、心率等)。
选择测量方法或工具时,首要需考虑其是否能够准确测量暴露水平,即真实性(或效度)和可靠性(或信度);其次还要考虑一次性测量当前的暴露水平是否能够满足研究需求,是否需要对既往暴露进行测量和评估,或对于该种暴露因素进行前瞻性的重复测量。如果研究的暴露因素是固有的(如种族、出生日期等)或被证实是长期稳定的(如基因序列),那么当前的一次性检测即可代表过去的暴露情况5。
(二)影响因素
在流行病学研究中,暴露的强度(intensity)、频率(frequency)和时间(duration)是核心,同时还需要考虑因素如下表2.2所示(参考网址https://onlinecourses.science.psu.edu/ stat507/node/31)。
表2.2 暴露的主要影响因素列举
(三)注意事项
由于队列研究的病因假设一般为某种暴露会导致疾病的发生,这里的“暴露”往往指的是累计暴露量或者平均暴露量,因此研究者需要研究对象在给定的时间窗口内,提供暴露的时长、频率和强度。以“体力活动”为例,研究者首先需要将众多体力活动综合成具有可比特征的“active agent”,如代谢当量(Metabolic Equivalent of Task,MET),因此转换表(conversion tables)或转换公式需事先准备好,如表2.3所示6。最后,再通过问卷或其他方式,对个体的体力活动种类和时间进行调查。
表2.3 不同体力活动的代谢当量转换表6
续表
理论上,暴露与疾病的关联需要发生在特定的病因相关时间窗口期(etiologically relevant time window)内,该时期可以是终身的、阶段性的(如胚胎期、婴幼儿期、青春期、孕期、更年期等),或是在疾病诊断前的一段时期内(如疾病确诊前的第10年至第5年)。因此,该窗口期之前或之后的累计暴露或平均暴露,一般不会对疾病的发生产生影响5。所以,研究者需事先了解疾病的自然史,确定该疾病对于该暴露的病因相关时间窗口期,以更好地获取暴露信息。另外,由于大型队列往往关注多种结局,不同疾病对于同一种暴露的病因相关时间窗口期往往不一致,应区别化处理。
三、测量误差
在流行病学中,测量误差是测量值(X)与真实值(T)间的差异,可分为“系统误差”和“随机误差”两种。在相同观测条件下,对同一测量指标进行多次测量,如果误差出现的大小和符号均相同或按一定的规律变化,这种误差称为系统误差;如果误差出现的大小和符号均不一定,则这种误差称为随机误差。由于本章核心为“暴露测量”,所以关于“结局”测量误差的流行病学理论,请参考“筛查与诊断”的相关内容。
测量误差会导致研究对象的错分。相比于真实的效应值(如相对危险度),无差异性错分偏倚(nondifferential measure error)的存在会使观察到的效应值趋于无效假设,而差异性错分偏倚(differential measure error)可使效应值远离、趋近于或横跨无效值(null value)。
(一)测量误差的来源
相较于病例对照研究,由于队列研究的暴露测量大都发生在结局之前,那么暴露测量更可能发生在病因相关时间窗口期内,且暴露测量不会受到结局(发病、治愈、死亡等)的影响。因此,不论是在无差异性错分偏倚或差异性错分偏倚的控制上,队列研究均显著优于病例对照研究,但这并不意味着队列研究中不存在测量误差,其误差来源总结如表2.4所示。
表2.4 队列研究中的测量误差来源7
如上表所示,由于测量误差几乎可以发生在队列研究的各个阶段,因此,在设计时需预先识别可能出现的测量误差,将其质控纳入操作流程,而在研究进行中出现的突发情况,则需要快速识别,并合理制定解决方案。此外,应避免在研究分析阶段可能出现的错误,如数据录入、转换、分析时出现的错误等,同样需要快速识别并及时纠正,避免错误的再次发生。
(二)减少测量误差的方法
在队列研究中,减少测量误差的核心原则,即是选择真实可靠的测量方法或工具。关于这一点,针对不同种类的暴露,如何选择或开发合理的测量方法或工具,将在后面章节逐一介绍。
然而,还有其他方法可以有效控制队列研究中的测量误差,总结如表2.5所示:
表2.5 减少队列研究测量误差的方法列举
因此,选择合适的研究人群,明确研究因素(暴露、混杂和结局),选择合理的测量方法和工具,准确把握测量误差来源并进行有效控制,是队列研究成功的关键。