三、监测对象与抽样方法
(一)监测对象
2010—2012年监测对象是全国31个省(自治区、直辖市)(不含香港、澳门特别行政区及台湾省)共计150个监测点的6岁及以上居民(户籍常住人口,或在本地居住满6个月的非户籍人口),要求每个监测点至少调查6岁及以上居民1 000人。为保证6~17岁青少年和孕妇的基本调查人数,每个点要求至少调查6~17岁儿童青少年240人,孕妇30人,如果调查点的孕妇和儿童青少年数目不足则需要适当补充。
2013年监测对象是全国30个省(自治区、直辖市)(不含西藏自治区、香港、澳门特别行政区及台湾省)55个监测点的0~5岁儿童和乳母(户籍常住人口,或在本地居住满6个月的非户籍人口),要求每个监测点至少调查0~5岁儿童630人,2岁以下儿童的母亲200人。
(二)抽样方法
1.抽样设计概况
本书的分析样本来自2010—2012年中国居民营养与健康状况监测数据,2010—2012年采用多阶段分层与人口成比例的整群随机抽样的方法(probability proportional to size,PPS),通过样本估计总体。
国家统计局和中国疾病预防控制中心信息中心协助完成样本县(市、区)、村(居)委会的抽样工作,由县(区)级项目工作组按照统一抽样原则完成样本户的抽样。抽样时按经济发展水平及类型将中国县级行政单位(包括县、县级市、区)分为四层,分别是大城市、中小城市、普通农村和贫困农村。其中,大城市指直辖市、计划单列市、城区人口100万以上的省会城市,共计32个大城市的中心城区;中小城市指上述大城市中心城区之外的所有的区、地级市城区和县级市;贫困农村指国家确定的扶贫开发重点县(依照《2001—2010年国家农村扶贫开发纲要》所列名单,去掉县级市或区);普通农村指贫困农村以外的县。抽样样本具有全国代表性,并具有大城市、中小城市、普通农村和贫困农村四层代表性。
将31个省(自治区、直辖市)与大城市、中小城市、普通农村和贫困农村4个县级行政单位分层交叉后,共计124小层,除去空缺(如东部9省没有贫困县,或省会城市不足100万人口数量,因而不设中心城区层),并考虑个别省份工作条件等问题,全国共划分106个小层。每个省在每小层至少保持1个监测点,再按各省各层中的人口规模分布其余监测点。
2.抽样步骤
2010—2012年中国居民营养与健康状况监测的抽样分为四个阶段:
第一阶段采用多阶段分层随机抽样,将全国所有县级行政单位(包括县、县级市、区)分为大城市、中小城市、普通农村(非贫困县)、贫困农村(贫困县)四层。分层后,按国家标准地址码排队建立县级行政单位抽样框。2010—2012年抽取150个监测点(市/区/县)。
第二阶段采用人口规模排序的系统抽样,设置随机起点,等距抽取居(村)委会。每个监测点共抽取6个居(村)委会,大城市抽样点只抽取居委会,中小城市、普通农村抽样点6个居(村)委会,在城镇与乡村中的分配要与相应居住人口比例基本相同,贫困农村抽样点只抽取村委会。
第三阶段采用简单随机抽样法,在每个抽中居(村)委会中抽取75户。根据本居(村)委会住户分布的实际情况,按地理位置(楼群/村民小组)分成每25户为一群,将剩余户与邻近楼群或村民小组中的住户组织一群,使所有住户都在抽样群中。
第四阶段按简单随机抽样原则,每个居(村)委会随机抽取3个群组成调查样本。在选定的3个群75户中,第1群的25户和第3群的前5户(共30户)实施3天24小时膳食回顾调查;第2群的25户进行食物频率法调查。
3.样本量的确定
(1)最小样本量:
以2002年中国居民营养与健康状况调查中18岁及以上成人糖尿病患病率为确定样本大小的计算标识,2002年糖尿病患病率为2.6%,计算时用近似值3.0%作为总体人群糖尿病患病率。
最小样本量计算公式为:
其中:π为患病率,
允许误差δ=p·π,
Deff为设计效率。
根据《2009年中国人口和就业统计年鉴》,推算18岁以上人口占78%,按照95%的准确度(μα=1.96)、85%的精确度(δ=0.45%)和10%的失访率进行计算,deff值取2.5,计算得到最小样本量约为16万人。
(2)样本量的分配:
2010—2012年全国共抽取150个监测点(区/县),其中大城市34个、中小城市41个、普通农村45个、贫困农村30个。根据城市平均每户2.5人,农村平均每户2.6人,可以确定每个样本点的调查户数为450户,据此完成样本量的分配。