首都人口、就业与可持续发展
上QQ阅读APP看书,第一时间看更新

二、数据和研究方法

本章的研究主要分为以下几步:第一,根据文献综述和相关性别工资差距理论,尽可能全面地确定可能影响大学生起步工资的性别差异的影响因素;第二,将对大学生起步工资影响显著的变量加入回归方程,探究性别及其他变量的影响作用;第三,利用交叉项分析对除性别外的变量进行研究;第四,利用Oaxaca的方法对性别工资差异进行分解,分析大学生性别工资差异中个人特征变量同歧视的解释程度。

(一)研究数据

数据主要使用了“首都大学生成长跟踪调查”的问卷数据,这一问卷从2009年开始,每年跟踪调查同一批在京大学生的状态。本研究选取2009年调查时是大三在读,并且在2011年调查时已经有过工作经历的大学生,保留其在2009、2010和2011年三期的跟踪数据,共计2278个样本,得到有效样本788个。样本的具体情况见表3—1。

表3—1 统计性描述

(二)变量处理

因变量

大学生起步工资对数:这里工资的界定是指大学生毕业后接受的第一份工作时,其包括可预计的福利在内的全部薪酬。而由于每个人工作时间不同,因此,对原数据中的月总体薪酬除以其月工作时间,得到每个人的小时工资,进而对其求对数使得更符合正态分布。

自变量

性别:男女性别的这一变量是本次研究中的关键变量,因为我们要研究的就是大学生的起步工资的性别差异。其中,1代表男性,0代表女性。

户口:指大学生在毕业前(2009年)是否具有北京市户口。没有当地户口为1,有当地户口为0。

专业:根据国家规定,将专业分为12个类别,而回收的问卷只占了9个类别。所发的问卷中没有涉及哲学、教育学和军事学的学生。同时,历史学和医学的学生不足10个,因此将历史学与文学合并,医学与工学合并。

大学时的学习成绩排名:由于不同学校、不同专业对于学习成绩的定义不同,给分情况不同,因此问卷中采用班级人数和班级总排名,然后用班级排名除以总人数,从而得到其成绩在班级中的位置。

所学专业与工作的匹配程度:根据问卷中的设计将所学专业与工作进行匹配令大学生对其进行等级打分从而得到确定。

家庭经济地位:由于每个学生并非来自同一个地方,因此家庭经济收入的绝对值并不能体现出其在当地的经济收入水平,因此采用家庭在当地的经济所处的位置,作为判断其家庭经济地位的标准。将中高层地位表示为1,否则为0。

学校类型:判断学生在大四(2010年)时,其所在院校是否在国家规定的“985”或“211”院校,若是则其为1,否则为0。

单位行业:根据国家统计规律,对单位所处行业分为19类,但是由于种类过于繁多不便于计算,如果单纯使用三大产业划分又会使得问卷样本行业分布不均,因此鉴于大学生起步工资的研究时间点是2011年,依据北京市《2012年北京统计年鉴》将19个行业按人均平均工资进行排序,从而将行业分为高工资行业、一般行业、低工资行业。其中高工资行业包括:金融业,信息传输、计算机服务和软件业,科学研究、技术服务和地质勘查;一般行业包括:文化、体育和娱乐,卫生和社会保障,电力、燃气及水的生产和供应,租赁和商务服务,教育,采矿业,公共管理、社会组织和国际组织;低工资行业包括:批发和零售业,交通运输、仓储和邮政,房地产业,制造业,建筑业,水利、环境和公共设施,住宿和餐饮业,居民服务和其他服务业,农林牧副渔业。其中将低工资行业作为标准组。由于样本来自同一年份的大学生,因此其学历均为本科毕业,而年龄也较为集中,因此不再将其加入变量中。

(三)研究模型

本章中对大学生性别工资差异的分析,包括以下研究方法:

简单工资方程回归

首先,依据人力资本理论中的Mincer方程,对小时工资进行半对数回归:

ln W=+μ

式中,W代表小时工资,X代表个人特征和工作特征向量,μ为随机误差项。其中个人特征向量中包含性别虚拟变量,定义男性为1,女性为0。在控制了其他变量后,若该虚拟变量的系数为正且影响显著,则表明在同等条件下男性的工资显著高于女性。

这种方法的分析原理在于,假定男女的其他特征的回报率相同,进而分析男女间的工资差异是否存在。因此这种方法的缺陷在于无法对男女在其他变量水平上的投资回报率进行区分,只能判断是否存在性别差异。

交叉项分析方法

交叉项分析是回归分析的重要内容,它可以在一定程度上对简单回归进行补充。它的基本原理如下:假定自变量X1X2和因变量Y,若要对其进行交互项分析,可以用带X1X2的回归方程:

Y=β0+β1X1+β2X2+β3X1X2+e

式中,X1X2是主效应,X1X2是交互效应,考虑在X1X2特征项互相影响后的程度。

因而在本章中,可以在简单工资方程回归模型的基础上,加入性别同其他变量的交叉项。可以用于反映在控制其他变量后的这一特征的性别差异。比如加入性别和学校类型的交叉项进行回归,依旧使用上述模型,其中X1X2分别是性别和学分绩,X1X2是二者的交叉项。所以,当X1=1,即对于男生大学生而言,截距项为β0+β1,而学分绩的斜率为β2+β3;而当X1=0,即对于女生大学生而言,截距项为β0,而学分绩的斜率为β2。所以β1代表了男女性别差异的大小,而β3则代表了男女学分绩斜率的差异。在本章后续研究中,将会就其他变量作进一步分析。

Oaxaca性别工资差距分解法

瓦哈卡(Oaxaca,1973)的方法是衡量性别工资差异中歧视所占比例的经典方法之一。其基本思路是将观察到的性别工资差异和无法由个人特征解释的部分,并通常将无法解释的部分认为是歧视,从而衡量出歧视的大小。其分解方程过程如下:

从上式可以看出,经过整理将男女性别工资差异分解为个人特征部分和不可解释的部分即歧视。因而在实际操作过程中将实际观察到的男女性别工资差异对数的平均值,减去与个人工作特征相关的部分,剩下的就是歧视的影响,可以用歧视系数来反映。