第二节 案例解析
一、如何选择研究种类
横断面研究按调查对象的范围分类,可分为普查、抽样调查和典型调查。
(一)普查
普查(census)又称全面调查(overall survey),是指在一定时间内对一定范围人群中的每一位成员进行调查或检查,如我国每10年一次的人口普查。一定时间期限较短为好,如果时间太长,人群中相关信息会有所变动,影响调查结果。
(二)抽样调查
抽样调查(sample surey)指仅调查研究人群中一部分有代表性的观察单位组成样本,根据样本结果估计总体人群的患病率或某些特征的分布情况。样本的代表性是指抽取的样本人群在人口统计学特征上要与目标人群一致。要抽取一个有代表性的样本,需要遵循随机化的原则。
(三)典型调查
典型调查(typical survey)指有目的地选择典型的人、部门或单位进行调查。进行典型调查,有利于对事物特征进行深入的了解,但是由于典型调查的样本没有遵循随机抽样的原则抽取,结果不能用于推断总体情况。
本章案例采用的是抽样调查。
二、如何设计
调查设计是对调查研究事先所做的周密安排,包括资料收集、整理和分析全过程的统计设想和科学安排。完整的调查设计包括调查计划、组织计划、整理计划和分析计划。
(一)调查计划
1.明确调查目的
调查研究的目的是用尽可能少的人力、物力、财力和时间,获得符合专业和统计学要求的调查资料,得到预期的结论。明确调查目的是调查研究各个环节中最核心的问题。各调查研究的目的不同,但概括来说,一般有两类,一是了解参数用以说明总体的特征,了解疾病的三间分布,即疾病在人群间、时间、地区间的分布;二是研究事物或现象之间的关系以探求影响人群健康的有关因素或探索病因。
本章案例的目的是调查当前我国GERD的患病情况及相关因素。
2.确定调查人群
根据调查目的,确定调查的人群。确定调查人群应注意同质性,例如调查对象为常住人口,则不应包括临时的外地人口。
本章案例中调查人群为五个地区18~80岁常住人口。
3.确定调查方法
根据研究目的,进一步确定采用普查、抽样调查或是典型调查。
4.确定资料收集的方法
资料收集方式一般有两种方法,一是观察法,由调查员对调查对象进行直接观察、检查或测量来取得资料,如身高、体重的测量;二是问卷调查法,通过调查表(调查问卷)询问调查对象,让其回答或回忆暴露或疾病情况,二者可结合使用。问卷调查也有多种方式,例如面对面调查、信访、电话访问、自填式问卷调查、网络问卷调查等。需要注意的是,收集资料的方法一经确定,不应改变,在整个调查过程中必须一致。调查员必须经过统一培训,以统一调查和检查的标准。
本章案例中采用自填式问卷调查,属于第二种调查方式。
5.确定研究变量与调查表
研究变量可分为人口学资料、疾病或健康指标以及相关因素变量。人口学资料包括性别、年龄、文化程度、婚姻、职业等;疾病或健康指标是与研究疾病或健康状况有关的变量,如患病、死亡、发病、生命质量等;相关因素变量指可能与研究的疾病或健康状况有关的一些因素,例如吸烟、饮酒、运动、饮食习惯、既往病史等。确定了研究变量后,需将这些研究变量进行归纳整理,设计为不同的问题,形成调查表。
6.调查组织计划
调查的组织计划是调查得以顺利实施并提高调查质量的重要保证。在设计中应根据已有知识,分析在每个环节可能产生的误差或偏倚的可能性,充分估计可能出现的各种问题,制定详细的质量控制对策与措施。组织计划包括组织领导、宣传动员、调查员的挑选和培训、时间进度、地域划分、分工协调、经费预算、调查表准备、器材的准备、资料汇总要求等,设计中需对这些做周密的计划安排。调查质量控制应贯穿于调查设计、调查实施、数据分析与总结的各个环节。
(二)资料整理与分析计划
调查收集到的原始资料比较杂乱,需要对其进行加工,包括资料的整理与分析。通过资料整理,使其系统化、条理化,便于进一步分析。通过数据分析,发现研究疾病或健康状况等的分布特征,获得研究结果与结论。计划的内容一般包括以下几个方面:
1.问卷的接收
整理资料的第一步是问卷接收,要求对收回的问卷认真管理,做专门的记录,例如问卷完成日期、每天收回的问卷数量等。对回收的问卷首先应核对是否有缺项或者漏项等问题,最好在调查现场进行,以便及时补充数据。
2.数据编码录入与核查
数据编码是对问卷中每一个问题的所有可能的答案分配一个代码。编码要方便调查员和被调查者对调查问题的理解和回答。单项选择的问题、多项选择的问题、开放型问题采用的编码方式不同。可采用软件录入数据并建立数据库,例如EpiData、excel等。为避免录入错误,通常由两位录入员进行双份录入。数据录入后对数据进行清理与核查,以便进行统计分析,如根据调查项目间的逻辑关系进行逻辑查错。
3.数据初步分析计划
根据研究目的和预期分析指标拟定数据的初步统计分析计划,分析内容主要包括研究对象人口统计学特征的描述、疾病或健康状况分布特征的分析、相关因素的分析几个方面。分析计划中应定义指标变量并说明计算方法,预期做哪些统计描述和统计推断,采用什么统计方法控制混杂因素等。
三、如何估算样本量
横断面研究中的普查方法要调查研究人群中的每一个个体,不需要估算样本量。抽样调查中样本量的估计则是必须考虑的关键问题。样本量过少,抽样误差大,用于推断总体的精确度和准确度差;样本量过多,会增加调查成本,也会增加各种非抽样误差。
横断面研究中估算总体参数所需样本量需具备的基本条件为:
1.置信度1-α
置信度1-α的值越大,置信区间估计的可靠性越好,所需的样本量也越大。通常取α=0.05。
2.总体标准差σ或总体率π
总体标准差σ或总体率π的值越大,所需样本量越大。可以通过预调查或以往资料等进行估计。
3.允许误差δ
允许误差是对研究结果要求的精确度,即研究者希望样本统计量(均数或样本率)与相应总体参数(总体均数或总体率)最大之差控制在多大范围内。允许误差越大,所需样本量越小。
用上面的三个条件可进行样本量估算,它表示用调查所得的样本统计量估计总体参数时,二者之差不超过δ的概率为1-α。
下面介绍单纯随机抽样中估计总体率和总体均数时样本量的估算。
1)估计总体率所需样本量:
无限总体抽样按公式(3-1)求样本量(n),有限总体抽样还需用公式(3-2)对其进行校正。如果n/N很小,比如小于0.05则可不做校正。
公式(3-1)中π为总体率。若对总体率一无所知,可设π=0.5,因为此时π(1-π)=0.52=0.25为最大,以免n过小。
2)估计总体均数所需样本量:
估计总体均数所需样本量的公式为
实际工作中总体σ通常是不知道的,可通过预调查或者根据文献进行估计。如果σ同时有几个估计值可供参考,应取其中较大者。
本章案例中根据某省以往资料,GERD的患病率(π)约为10%,按α=0.05,则置信度为0.95,若允许误差(δ)为0.005,采用PASS 15.0软件估算样本量,得14 029例,为避免失访并便于调查,样本量定为18 000人。
用PASS 15.0估算样本量的步骤:
首先选择Proportions→One Proportion→Confidence Interval→Confidence Interval for One Proportion。再在弹出的图3-1对话框中Confidence Interval formula选择Exact(Clopper-Pearson),Interval Type中选择Two-sided。同时输入样本量估计所需3个要素,点击“Calculate”按钮,PASS软件会自动输出每组所需的样本量(图3-2)。
四、如何进行抽样
从总体中抽样有两种方式,分别为概率抽样(probability sampling)和非概率抽样(nonprobability sampling)。医学研究中多采用概率抽样,因此本章仅介绍概率抽样。概率抽样也称随机抽样,指总体中每个研究对象都有被抽中的可能,任何一个对象被抽中的概率是已知的或可计算的。在概率抽样中,必须有确切的抽样框架,也就是一份完整的列有全部抽样单位的清单。下面介绍几种概率抽样的方法:
(一)单纯随机抽样
单纯随机抽样(simple random sampling)也称简单随机抽样,是一种最简单、最基本的抽样方法,是指从总体中以完全随机的方法抽取部分观察单位。常用的做法是先将调查总体每个单位统一编号或者利用原有的没有重复的编号(例如身份证号),再用随机的方法(如随机数字表或计算机软件产生随机数字等方法)从中抽取一部分观察单位(n),组成样本。总体中每个观察单位都有同等的机会被抽到样本中。单纯随机抽样是其他随机抽样方法的基础,计算抽样误差方便,但是要求事先对所有研究对象编号,当研究对象较多时,编号繁琐。
(二)系统抽样
系统抽样(systematic sampling)又称机械抽样或等距抽样,是按照一定顺序,机械地每隔若干观察单位抽取一个观察单位的抽样方法。其优点是简单易行,抽样误差小于单纯随机抽样方法。缺点是当抽样对象的某种特征在总体中的分布呈现有序或周期性趋势时,如果抽样的间隔恰好是其周期或周期的倍数,则可能使样本产生明显的偏性。
(三)分层抽样
分层抽样(stratified sampling),是实际工作中最常用的抽样方法之一,是指在抽样之前,先将总体按对研究指标影响较大的一些特征(如性别、年龄等)分成若干次级总体或层,然后在每层内分别进行抽样。其优点是分层后增加了层内的同质性,观察值的变异度减小,各层的抽样误差减小,在样本量相同的情况下,它比其他抽样方法的抽样误差都小,对总体指标估计值的精确度高。而且便于对不同层采用不同的抽样方法,并可对不同层独立进行分析,可做层间比较分析。
(四)整群抽样
整群抽样(cluster sampling)是将总体按某种与研究目的无关的特征(如班级、医院等)分成若干群(组),以群为单位,从中随机抽取部分群,作为观察单位组成样本。其优点是抽样方法简单,易于组织、实施,然而该抽样方法造成的抽样误差较大,特别是抽样的群数太小、群间差异较大时。
(五)多阶段抽样
前面介绍的四种抽样方法,均是从总体中通过一次抽样产生样本,各自具有不同的特点和适用范围,就抽样误差的大小而言,整群抽样>单纯随机抽样>系统抽样>分层抽样。实际工作中往往总体较大,分布范围广,观察单位很多,很难通过一次抽样产生完整的样本,因此可根据实际情况灵活地组合运用这些抽样方法,将整个抽样过程分为若干阶段,分阶段逐一抽样,这种抽样方法称为多阶段抽样(multistage sampling),也称多级抽样。多阶段抽样可以充分利用各种抽样方法的优势,克服各自的不足,节省人力、物力,但在抽样之前要掌握各级调查单位的人口学资料和特征。
本章案例中分别在五个地区按城区和郊区分层,城区按区-街道-居委会、郊区按乡-镇-村几个阶段,并按当地不同年龄、性别人群分布比例随机抽取样本,属于多阶段分层随机抽样。
五、如何收集数据
前面介绍了原始资料收集方式有两种。通过调查表收集数据是医学研究中收集数据的重要手段。下面主要介绍调查表的设计。
调查表必须按研究目的而设计,问卷中的问题应该与研究目的相关,而且要充分考虑不同问题的统计分析方法,避免无法分析或处理过程过于复杂的问题和答案。此外,调查表中的问题要易于理解,避免专业术语,设计应有严密的逻辑性。
(一)调查表设计的主要步骤
1.确定研究目的
明确研究目的是设计调查表的首要工作。把握好调查研究的目的,可以使调查表的内容与拟调查的目的一致。
2.设立专题工作组
根据研究目的和对象设立由各方面有关人员组成的研究工作组,负责制定调查问卷。
3.制定调查表的框架和内容
制定调查表的框架和内容是调查表设计的核心部分。由专题工作组讨论提出调查表的框架结构、需要收集的资料类型,然后拟出要收集资料的具体指标,围绕这些指标编制合适的问题,将问题按一定的原则组合成问卷初稿,并要充分考虑提出的问题语言是否准确,备选答案是否全面,问题的排列顺序是否合适等。
4.预调查
问卷初稿完成后,请流行病学、卫生统计学、临床医学等相关领域的专家,对问卷内容进行审核,结合他们的专业和工作经验提出修改意见,进一步完善问卷。在正式调查前,根据确定的研究对象,选择小样本人群进行预调查,以便及时发现问卷中的问题,进一步修改完善问卷,同时对问卷的信度和效度进行初步评价。
5.确定调查表
根据预调查中发现的问题,对调查表进行修改完善,然后定稿。在正式调查过程中不再对问卷进行随意更改。
(二)调查表的基本结构和内容
1.标题
调查表的标题概括说明调查表的主要内容,应简明扼要,易于引起回答者的兴趣。
2.封面信及知情同意
在多数情况下,在调查表前附有封面信,主要向调查对象说明调查的目的、意义,以引起调查对象的重视和兴趣,获得他们的信任、合作和支持。一般包括研究者的身份、研究目的、重要性和研究内容、应答者回答问题的必要性和为应答者的回答保密等内容。随着人们自我保护意识的增强,知情同意日益受到重视,尤其在涉及人体受试者的生物医学研究中,所以在调查表前通常还会附知情同意书,在做调查前,请调查对象签署,做到知情同意。
本章案例在调查前也需要调查对象签署知情同意书,并且表明调查对象可以在调查的任何时间退出。且该研究经过了上海第二军医大学伦理委员会的批准。
3.问题和答案
问题部分是调查表的核心内容,直接反映研究的目的和内容。
根据课题研究的内容,设计调查表时,问题主要集中在调查对象的基本特征和研究相关项目。基本特征包括:调查对象的人口统计学信息,如年龄、性别、文化程度、婚姻状况、职业等。研究相关项目主要是设置与研究目的密切相关的问题,不同研究目的其调查表的调查项目不同。一般包括临床症状、体格检查项目、流行病学项目(疾病家族史、生活方式等)、实验室检测项目等。
调查表中通常会设计开放型问题和封闭型问题来提问。开放型问题指不预先给定固定答案,让调查对象自由回答。其优点是作答方式自由,调查对象有较大自由发挥的空间,能充分地表述自己的想法;调查能比较全面和深入地了解被调查者,有时可发现或者得到一些特殊的问题和宝贵的启示。缺点是答案不集中,结果难以量化,不易做统计分析,调查时间长,可能造成被调查者无应答。
封闭型问题是每个问题后都有备选答案,供调查对象选择填写,不能自由发挥。其优点是答案标准化,被调查者容易回答,应答率高,而且节约时间,也便于统计分析。缺点是设计过程复杂、填答方式受限。被调查者可能盲目或随便填写。
在实际调查中,两种类型的问题常常结合使用。通常将研究者比较清楚、有把握的问题作为封闭型问题,而将那些尚不十分明确的问题作为开放型问题。一份问卷往往以封闭型问题为主,根据需要适当增加若干开放型问题。
包括封闭型问题和开放型问题。封闭型问题常见的有:
1)单项选择题:每个问题后设有若干个备选答案,被调查者从中选择自己认为最合适的一个答案。
2)多项选择题:每个问题后设有多个备选答案,被调查者从中选择两个或两个以上最佳答案。
3)填空题:只提出问题,不提供答案,请调查对象将答案直接填入空格中。例如:您平时每天吸____支烟?
4)自由式问题:提出问题后,调查对象可以自由回答。例如:您认为青少年控烟的主要措施有哪些?
5)排列式选择题:按照某一标准或问题的重要性,要求被调查者对问题的备选答案排列出等级或序列。例如:你对下列活动的兴趣如何?请按兴趣由大到小将下列活动进行排序:A.文体活动B.社会调查C.科普知识讲座D.参加兴趣小组。
6)量表式问题:当涉及被调查者的态度、意见等有关心理活动方面的问题时,通常采用表示程度大小的量表式问题,调查者根据自己的理解对问题做出选择。例如:总的来说,您认为您目前的健康状况:A.棒极了B.很好C.好D.过得去E.糟糕。
7)尺度式问题:医学中有些问题不好量化,如疼痛的程度,可采用尺度式问题调查,以线段的长度来表示问题的尺度,一般其尺度表示0~10分(或100分),要求被调查者在其认为合适的分数或程度处打“×”,从而实现被调查者对该问题的量化。例如:您觉得疾病引起您身体疼痛的程度?
一份调查表中的问题数目要根据研究内容、研究对象特征、分析方法等多种因素而定。总体而言,问题不要过多,问卷不宜过长,答题时间不要太长,以避免研究对象答题时产生厌烦等情绪,影响答题质量。
问题的排列一般要由浅入深、由易到难。敏感性问题、私密问题及开放型问题一般放在问卷的后面,以免引起被调查者的警惕或抵制情绪。
(三)调查表的考评
调查表的考评包括信度考评和效度考评两个方面。信度(reliability)即可靠性,是指采用统一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即问卷或量表能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,常用的信度分析方法有重测信度、复本信度、折半信度和α信度系数法四种。效度(validity)指问卷正确测量研究中所要测量的变量的程度。效度越高,测量结果越能显示其所要测量的特征。检验效度的主要指标和方法有:表面效度、内容效度、效标效度、区分效度、结构效度等。
本章案例中所用调查问卷RDQ,研究者对其做了问卷的信度和效度分析,α信度系数为0.89,条目与维度间的相关系数在0.63~0.98之间,说明RDQ的信度、效度较好。具体结果发表在BMJ Gastroenterology杂志(BMC Gastroenterology.2009,9:86.doi:10.1186/1471-230X-9-86).
六、如何进行统计分析
针对不同的资料类型和分析目的采用不同的统计分析方法。
(一)描述性统计分析
一般多用于人口统计学资料、基线资料以及研究因素的统计描述。正态分布计量资料采用均数、标准差、95% CI等进行描述,非正态分布计量资料采用中位数、四分位数间距等进行统计描述,定性资料和等级资料采用率、构成比等进行统计描述。
(二)组间比较
正态分布的计量资料组间比较采用t检验、方差分析等方法进行统计推断;非正态分布的计量资料组间比较采用非参数检验等方法进行统计推断;定性资料和等级资料组间比较用卡方检验、非参数检验等进行统计分析。通常检验水准为0.05,双侧P值小于0.05认为有统计学意义。
(三)协变量分析
横断面研究除描述调查人群的人口统计学特征及事物(如疾病)的发生情况,以了解事物的特征、现状外,常需要寻找变量间的关系并做出解释,例如分析可能与研究疾病有关系的因素,这些因素在统计学中可作为协变量,将研究事物作为应变量,采用多元统计模型进行分析。例如对于计量资料协变量的分析,可采用多元线性模型,对于定性资料协变量的分析,可采用Logistic回归模型。需要注意的是,对于多元统计模型中统计分析结果的统计学意义的解释,只能说明该因素与研究事物有关,不能说明其是研究事物(如疾病)的危险因素。
本章案例用均数和标准差以及构成比描述人口统计学特征,用患病率描述人群的患病情况。通过Logistic回归模型分析了与GERD有关的因素,计算各因素的OR值及其95%CI。
七、统计学评价
横断面研究不可避免地存在一些误差,包括抽样误差和系统误差(即偏倚)。抽样误差虽然不可避免,但是可以通过统计设计尽量减小。本章案例是基于社区人群的大型流行病学调查,采用多阶段分层随机抽样,且样本量大,研究样本具有较好的代表性,尽量减小了抽样误差的大小。但样本量的估计是研究设计时需考虑的重要因素,即使样本量足够大,也应该在文中提及样本量的由来。
本章案例应用了国际公认的、经校验的RDQ问卷,应答率高,研究质量好。但由于研究目的和研究设计特性的限制,横断面研究只能分析因素与疾病之间的关联性,不能分析因果关系,其提供的证据级别不及病例-对照研究、队列研究。本章案例应用多元统计方法分析了多种因素与GERD的关系,为GERD病因研究提供了线索。
横断面研究在获取信息过程中可能会产生信息偏倚,例如研究者对既往病史、疾病症状等,记忆不清或者不准确,可能引起偏倚。本章案例中疾病史为自报,研究对象对既往病史记不清时可能会产生一定的偏倚。此外,研究范围跨度大,各地区文化差异、语言差异等,对问卷的理解可能会产生差异,也可能引起偏倚。
八、如何报告研究结果
很多生物医学研究都是观察性的。准确、详实地报道观察性研究的设计、方法、实施及结果对于编辑、审稿人和读者公正、客观地评价论文的学术水平和应用价值,科研成果的推广和再利用有重要的意义。2004年,一个由流行病学家、方法学家、统计学家、研究者和编辑组成的国际性合作小组,发布了加强观察性流行病学中观察性研究报告质量(Strengthening the Reporting of OBservational studies in Epidemiology,STROBE)声明。STROBE声明是指流行病学中采用三种主要设计(横断面设计、病例-对照设计、队列设计)的观察性研究应纳入的条目清单,其主要目的是为观察性流行病学研究论文提供报告规范,从而改进这类研究报告的质量。它有助于作者写高质量的观察性研究、辅助编辑和评审判定一篇文章是否值得发表、帮助读者系统地评价一篇已发表的文章。国际医学期刊编辑委员会已把STROBE列为“生物医学期刊投稿的统一要求”。目前STROBE声明最新版本为第4版,于2007年发布。共列出了22个条目的清单和要求,并且对各部分规定了排序。STROBE自查清单对文章各部分做了规范,包括题目和摘要、引言、方法部分、结果部分、讨论部分和其他信息六大部分。其中18个条目适用于三种观察性研究设计,4个条目(条目6、12、14和15)根据研究设计类型而定,用于横断面研究、病例-对照研究或队列研究特定的设计类型。其中,条目14中针对三种设计的差异主要体现在队列研究,此章不再详述。
横断面研究中,研究方法部分针对参加者,条目6规定“描述入选与排除标准,说明参加者的来源与选择方法”;方法部分针对统计方法,条目12规定“描述所用的所有统计方法,包括减少混杂因素的方法;描述所有分析亚组和交互作用的方法;解释如何解决数据缺失;描述考虑到抽样策略的分析方法;描述所用的灵敏性分析方法”;针对结局数据,条目15规定“报告结局事件的数量或综合指标”。