三 数据描述与实证方法
(一)样本与数据来源
本文根据社会资本理论和腐败行为的文献分析提出理论假设,通过社会网络描述统计、相关性分析、指数随机图模型对上述假设进行实证检验。由于腐败网络的形成演化具有较强的隐蔽性,难以在现实世界中进行有效的追踪观察,因此,利用腐败案件查处后的相关数据进行研究不失为一条较好的路径。本文进行社会网络分析的数据来自我们长时间对1000余条新闻报道关键信息的关注、收集、提取和整理,探寻腐败分子的相互关系,建立0-1矩阵,绘制出自党的十八大以来主要腐败分子的网络关系图,并以此为基础进行实证研究。
我们绘制的腐败网络由233个人物节点组成,既有周永康、薄熙来、徐才厚、郭伯雄、令计划等“大老虎”,也有南航案、一汽案中的落马企业高管,还有与这些腐败落马官员有关的利益输送者,如丁书苗、刘汉、徐明等人,以及部分与案子有关的腐败分子的家属。数据包括:233个人物节点的关系数据、腐败官员级别、腐败官员是否担任过“一把手”、腐败官员贪腐金额、腐败官员判决刑期等。
在数据处理方面,腐败网络图是根据主流媒体新闻报道所描述的腐败分子间的血缘、友缘、业缘和地缘等社会关系绘制的。腐败官员级别包括正处级、副厅级、正厅级、副部级、正部级、副国级、正国级,分别用数字1到7进行编码,涉腐民营企业家、腐败官员家属,用数字0进行编码。腐败官员是否担任过“一把手”分别用1、0进行编码,1表示曾经担任过地方、部门或企业的“一把手”,0则表示没有。腐败官员贪腐金额及其判决刑期采用权威主流媒体报道的数据,其中判决死刑缓期两年执行的官员刑期设置为99年、无期徒刑的刑期设置为30年,仅是违纪未涉及犯罪的官员刑期设置为0年。
(二)研究方法
根据已有文献建立的理论基础,对于所探讨的问题,本文采用三种方法进行研究。
第一种,采用社会网络分析方法对绘制的腐败网络图做描述性分析。我们利用社会网络描述统计中的“中心性”(centrality)指标对腐败网络进行分析,包括以下三个具体指标。度中心性(degree centrality),该项指标表示腐败行为者与所有同他有联系的个体数量,它代表该行为者在腐败网络中社会资源的占用情况,度中心性越大的腐败行为者拥有越多的社会资源。亲近中心性(closeness centrality),该项指标是衡量个人所居腐败链条长短的重要因素。每个个体获取信息和向其他人传递信息的能力,很大程度上由其和网络中的其余节点之间的距离(即一个节点需要途经多少个节点才能到达网络中的另一个节点)决定。就本研究所关注的腐败网络而言,与他人的距离(或反向描述,亲密度)可以定义一个人在该网络中的角色。介中心性(betweenness centrality),该项指标反映了腐败行为者占据结构洞位置。一个腐败行为者如果可以把持相对多的结构洞位置的话,就可能具有较大的权力,同时可能获得较多的社会资源。
第二种,相关性分析。我们通过对社会网络描述统计获取的衡量腐败官员的三大指标(度中心性、亲近中心性、介中心性)与其贪腐金额、判处刑期进行相关性分析。本文之所以采用相关性分析,是充分考虑腐败网络的动态变化过程后所做出的选择。研究中呈现的腐败网络是已经被纪检监察机关或司法部门查处的结果,但官员的级别、贪腐的金额及其社会网络描述的各项指标本身是随时间演化的,直至该官员落马,进而固定其相应的指标。由于贪腐官员占据的社会资源、手中的权力、网络结构中的位置及其获取的利益随时间不断变化,我们难以判断它们之间的因果关系,因而采用相关性分析验证研究假设是最合适的方法。
第三种,指数随机图模型(ERGM),用来分析腐败网络的结构特征及腐败行为者的身份级别对腐败网络的影响。“网络节点连接的边是一个随机变量,这些随机变量之间的依赖假设决定了网络构成的大体形式。当观测网络结构时,指数随机图模型(ERGM)可以综合网络的多种外生属性和内生的结构依赖,分析一个特定的网络现象。”(刘亮,2013)相比其他的社会网络分析的描述统计,该模型的特点在于从腐败行为者的各项指标研究腐败网络的整体结构特征,并给出统计检验结果,更全面揭示了腐败网络形成的社会化过程。