上QQ阅读APP看书,第一时间看更新
第二节 标准化率的计算
为了探讨肿瘤病因与评价预防效果,需要对不同人群或同一人群不同时期的总发病水平进行比较。但肿瘤发病受年龄因素的影响很大。在对比不同病因学因素下的两类人群的总体发病率水平时,必须消除年龄的效应。这种对人群总发病率作年龄校正的方法称为标准化方法(standardization)。有两种标准化方法:直接标准化和间接标准化。
1.直接标准化方法 (1)直接标准化率的计算:
直接标准化方法是选用一个称为“标准”的人口结构,并假定这个标准人口按实际发病率发病时,估计其发病人数,称之为期望发病人数。处于不同暴露状态下的人口发病率,都可用这个标准人口,估计其期望发病人数。通过不同人群的期望发病人数的比较,探讨病因学因素的效应。表11-5列出了WHO推荐的世界标准人口构成和中国人口年龄构成(%),可作为标准人口构成加以采用。
表11-5 WHO推荐的世界标准人口构成和中国人口年龄构成(%)
续表
符号:设g为年龄组数。通常设18个年龄组,前17个年龄组为5岁跨度,即0~,5~,…,80~,第18个年龄组为85~。用下标x表示第x年龄组。
L为标准人口总数, L X为第x组标准人口数,
S为标准人口总构成比例, S x为第x年龄组标准人口构成比例,即 S x= L X/ L。WHO推荐的世界标准人口构成给出了 S x
D为观察人口的总发病人数,D X为x年龄组的发病人数,
W为观察总人年数, W X为第x年龄组的观察人年数,
m = D/ W为观察人群中的总平均人年发病率, m X= D X/ W X为第x年龄组的人年发病率。
L X×m X即为第x年龄组的期望发病人数。因此可将标准化率m'写为
式中的 为标准人口构成比例。
例11-2用WHO推荐的世界人口构成为标准对法国CoTE-d' Or地区1976—1980年男性胃癌死亡资料计算的直接标准化死亡率列于表11-6中。
计算的粗死亡率为20.67/100 000人年,标准化死亡率为17.87/100 000人年。
(2)直接标准化率的置信区间估计:
直接标准化率的方差计算公式为:
表11-6 用世界人口构成为标准对法国地区1976—1980年男性胃癌死亡资料计算的直接标准化死亡率及其标准误的计算
资料引自Esteve J,Benhamou E Raymond L. Statistical methods in Cancer Research VolumeⅣ:Descriptive Epidemiology
用正态近似法估计直接标准化率的100(1 -α)%置信区间为:
发病率、死亡率等通常用100 000人年(10 5)作分母表示,故标准化率分子也乘以10 5。
标准化死亡率的95%置信区间为
(3)两个标准化率相等性的假设检验:
当有两个不同地区或不同时期的两个率进行比较时,可按年龄组分别比较。如果须对两个总体率进行比较时,首先两个总体率标准化,然后用两个标准化率进行比较。设有地区A和B的两组死亡资料,并分别对它们进行了标准化,得到了两组标准化死亡率 和 ,对这两个标准化率相等的检验步骤为:
1)计算各年龄组合并死亡率mc x
2)计算各年龄组死亡率之差的方差 v x
3)计算两个标准化率之差的方差v
4)计算Z值
例11-3 西班牙Zaragaza和瑞士Geneva两地的男性胃癌1973—1977年间的发病人数和观察人年数列于表11-7中第一部分,标准化结果列于该表第二部分。
表11-7 西班牙Zaragaza和瑞士Geneva两地的男性胃癌发病人数和观察人年数(1973—1977年)及标准化结果
资料引自 Statistical methods in Cancer Research Volume IV: Descriptive Epidemiology by J. Esteve, E Benhamou, andL. Raymond.标准人口结构系采用世界标准人口构成(2001)中的相应年龄组的构成比例,并作归一化处理
将表11-7右侧的标准化计算结果的合计值代入式(11-9),得到 Z值为
由于Z>1.96,故拒绝无效假设,认为两地胃癌发病率的差别有统计学意义。Zaragaza的发病率高于Geneva。
最后,用一个标准人口构成分别计算两个研究人群的标准发病率 和 ,这两个标准发病率之比称为发病率对比指数(comparative incidence figure,CIF),即为相对危险度
当两个人群的发病率资料只作相互对比而不涉及外部对比时,可以使用这两个人群中的一个人口构成作为标准,或者使用两个人群合并的人口构成作为标准来计算标准化率。
2.间接标准化方法
间接标准化方法是用按年龄组的标准人年发病率来估计研究人口的期望发病数,并与研究人口的实际发病数作比较。
(1)间接标准化率的计算:
设x年龄组的标准人年发病率为λ x,第x年龄组的观察人年数为W x,则研究人口的期望发病数的估计为
例11-4 某市在一段观察期内共登记到直肠癌新发病人数为123例。同时得到分年龄组的观察人年数及分年龄组的直肠癌新发病人数。资料列于表11-8中第(2)、(3)两列。采用全国同时期的年龄组直肠癌发病率为标准(见表11-8中第(4)列),用间接标准化方法[公式(11-20)]计算的该市直肠癌期望发病人数列于表中第(5)列。得到期望发病人数为 E =98.6779人。
表11-8 间接标准化方法计算的某市直肠癌期望发病人数(采用全国的年龄组发病率为标准)
资料引自 Statistical methods in Cancer Research Volume IV: Descriptive Epidemiology by J. Esteve, E Benhamou, andL. Raymond.
(2)间接标准化率的置信区间估计:
研究人群的观察发病数( D)与期望发病数( E)之比称为标准化发病率比(standardized incidence ratio, SIR),故有:
如果采用的指标是人年死亡率,则研究人群的观察死亡数( D)与期望死亡数( E)之比称为标准化死亡率比(standardized mortality ratio, SMR)。如果比值为1.20,表示研究人口的发病水平超过标准发病水平20%。
SIR的变异性只与分子 D有关。将 D视为Poisson分布变量,可查表11-4得到其期望发病例数的95%置信区间的上下限。也可用 D近似服从以均值为 和方差为1/4的正态分布这一特点求出 D的95%的置信区间,计算公式为:
假定 D服从Poisson分布时,SIR的方差为
得到 SIR的标准误的估计值为
在正态分布假定下,SIR的95%置信区间为
本例已知某市的直肠癌实际发病人数 D = 123例,间接法计算的期望发病人数 E = 98.6779例,利用公式(11-22)计算的标准化发病率比SIR为
在正态分布假定下,利用公式(11-23)得到 D的95%置信区间为
在正态分布假定下,利用公式(11-24)得到标准化发病率比 SIR的95%置信区间为:
(3)观察死亡数与期望死亡数相等性的假设检验:
比较观察死亡数与期望死亡数相等性的假设检验所用的假设为:
H0:观察死亡数与期望死亡数相等
Ha:观察死亡数与期望死亡数不相等
假设检验用卡方检验法,检验公式为
服从自由度为1的卡方分布。
本例计算的卡方统计量为
大于在自由度为1、检验水准为α=0.05下的卡方值3.84,故拒绝无效假设,认为该市的实际死亡水平高于总体死亡水平。
例11-5 包含白血病和相关肿瘤(ICDA:200-209)死亡的间接法标准化率的计算。对接触苯工人进行追踪观察,共得到632.5观察人年数及相关疾病死亡人数2人。各年龄组的观察人年数W x列于表11-9中第3列。按全国相关疾病死亡资料计算的标准死亡率R x列于表11-9中第6列。用标准年龄别死亡率R x乘以观察人年数W x即得到期望死亡数e x,计算结果列表11-9中最后一列。
表11-9 白血病和相关肿瘤(ICDA:200-209)期望死亡人数的计算
得到合计的期望死亡人数E =0.16047。经卡方检验得
结果显示有统计学意义的差别。即接触苯工人的白血病和相关肿瘤的死亡率高于一般人群的白血病和相关肿瘤死亡率。