二 指标、数据与方法
(一)人口再生产衡量指标
常用的人口再生产衡量指标有粗再生产率、净再生产率、平均世代间隔以及内在自然增长率。其中前两项指标均可着眼于总和生育率指标进行理解。总和生育率(TFR)是描述时期生育水平最常用的指标,通过妇女年龄别生育率加总获得,其构建过程融合了时期数据与假定队列分析技术,通常可以理解为按照某时期生育水平度过育龄期的妇女终身可生育的全部孩子数量。
粗再生产率(GRR)是考虑了活产婴儿性别的总和生育率,反映母亲一代生育的女儿一代的人数;净再生产率(NRR)在粗再生产率指标的基础上,进一步考虑了活产女婴的死亡,更接近现实情况,反映了母亲一代生育且能够存活到母亲生育年龄的女儿一代的人数。净再生产率的计算公式为:
其中,δ是活产婴儿中女婴的比例,fi为某时期i年龄组妇女的生育率,Li/l0是女婴存活到母亲生育年龄时的存活率,i=1, 2, …, 7,分别对应15 ~19岁、20~24岁、…、45~49岁组。
平均世代间隔(T)是指母亲一代与女儿一代的平均年龄间隔,反映人口再生产周期的长短。计算公式为:
人口内在自然增长率(k)是相对于自然增长率r(r=b-d,其中b为粗出生率、d为粗死亡率)而言的稳定人口的自然增长率,即如果一个封闭人口的年龄别生育率与年龄别死亡率在相当长时期保持不变,该人口最终会发展为稳定人口,这时其自然增长率就是内在自然增长率。任何现实人口的内在自然增长率反映的都是其人口再生产的内在趋势。其计算公式为:
(二)数据与方法
本章所用数据均来自国家统计局公布的第五次与第六次全国人口普查汇总资料,未经过调整和修正。数据质量对结果的可能影响将在文末予以讨论。
首先根据两次普查数据中全国及各省级地区的活产女婴数及全部活产婴儿数计算女婴所占比例;然后根据普查时点全国及各地区分年龄的女性人数与普查前一年分年龄的女性死亡人口数,编制2000年与2010年全国及各省级地区女性简略生命表共64张。结合两次普查数据中所提供的5岁组育龄妇女生育率,分别计算2000年和2010年全国及各地区的人口再生产指标NRR、T和k。
20世纪90年代初期,査瑞传(1991: 286)曾利用NRR和T指标归纳出四种人口再生产模式:晚育少生(T长NRR低)、晚育多生(T长NRR高)、早育少生(T短NRR低)、早育多生(T短NRR高),这种分类简明易懂,但并未给出“早、晚”和“多、少”的边界。随着以“晚婚晚育、少生优生”为核心内容的计划生育政策的广泛推行和严格实施,中国早育多生的情况得到了有效控制,上述经验定性四分类法是否还适合当代的人口再生产状况?我们同样选用NRR和T两个指标,利用聚类分析,尝试对各地区的人口再生产模式进行分类。
聚类分析是定量研究分类问题的多元统计方法,有样本聚类和变量聚类两种类型。本章对31个省区市的分类属于样本聚类,采用系统聚类法(也被称作层次聚类法),以地区作为标签变量,净再生产率和平均世代间隔作为聚类变量,通过欧氏平方距离度量,分别对2000年与2010年中国各地区的人口再生产状况进行分类。
系统聚类法的原理是先将所有n个变量(本章中n=31)看作不同的n类,将性质最接近(距离最近)的两类合并为一类,再从这n-1类中找到最接近的两类加以合并,依次类推,直到所有的变量被合为一类(张文彤,2002: 171)。欧氏平方距离可被表达为:
其中d(xi, xj)为样本xi和样本xj间的距离,p为样本数量。