第三节假释制度基础理论中的博弈思想_我国假释制度的博弈分析-QQ阅读男生都市网

上QQ阅读APP看书，第一时间看更新

第三节假释制度基础理论中的博弈思想

一、假释词源中的博弈思想

关于假释制度的起源，目前还存有争议。正如马克昌教授所言：“假释制度的创制和发展，是刑法理论发达变迁带来的积极果实。” 马克昌：《刑罚通论（第二版）》，636页，武汉，武汉大学出版社，1999。 “在英语中，假释表达为‘Parole'，它源于法语的‘parole dhonneur'，最初不是用于刑事制度，而是军事术语，意为禁止被俘者再拿起武器反抗。17世纪时引进英语，但意思未变。直到1846年，才由美国波士顿的杰·豪博士正式按今天的意思使用之。” 转引自John Ortiz Smykla:Probation and Parol, London,1984, p.70。 “法国人最初发明的这种实践用于对战俘上。如果保证不再参战，战俘就可以在战争结束前获得释放。这项措施的运用是为减轻战争的负担，违誓的士兵再次被俘将被处死，这种做法和现代假释有相同之处：提前释放，承诺遵守某些条件，出于经济上节俭的考虑。” [美]大卫·E．杜菲：《美国矫正政策与实践》，吴宗宪等译，558页，北京，中国人民公安大学出版社，1992。。笔者认为，假释的词源本身就蕴含着丰富的博弈思想。法国军队对待战俘而设计的战俘承诺制度，是一种很典型的声誉博弈。“被俘者保证不再拿起武器进行战斗将得到提前释放”的声明是一种行为，会对接受这一声明的相对方即俘虏们的行为选择和利益产生影响。因此，声明本身和对声明的反应就可以构成一种动态博弈关系，战胜方与俘虏双方就是博弈主体。由于获胜方声明的内容的真实性常常令俘虏们无法确定，因此俘虏们就很难完全清楚获胜方的实际利益。所以，这一博弈在博弈类型上属于不完全信息的博弈，也就是平常所说的动态贝叶斯博弈。法国战俘制度是怎样出于经济上节俭的考虑？我们可以用一个简单的动态博弈来分析。

在这个博弈中，存在两个博弈方，一个是法国军队，另一个是被俘虏的战俘。法国军队有三种选择（释放俘虏、关押俘虏、处死俘虏），被法军俘虏的战俘首先有两种选择（承诺不参战、不承诺），被释放后有两种选择（参战、不参战）。博弈双方的动态博弈过程可以用图1-1表示出来。在博弈开始之前，我们假设战争双方已经具备不马上杀死战俘的战争文化。法国军队用字母A表示，战俘用字母B表示。

图1-1 战俘的声益博弈

在本次博弈中，法军A首先行动，发出信号M={“若俘虏B承诺被释放后放弃再次参战，则可提前获释；如果违背承诺，再次被俘则被处死”}。战俘得到信号后会根据自己的利益作出相应的声明{不参战、参战}。我们知道战俘声明的可信度取决于法军在当时的战争地位。足够强大的法军如果继续关押战俘将会承担相应于战俘数量的经济压力和相应的削弱自身的战斗力。而战俘B却丧失了自己的行动自由并处于惶恐的生存环境之中。因此，战俘首先会选择承诺不参战来换取自由。然而，战俘被释放后是否再次戴在战俘的烙印参战将取决于一个自然发生的概率。

在本次博弈中，当赋予博弈双方相应的行动收益时，各方的决策就有了差异，当作出决策后博弈双方的行动会因此影响博弈双方的决策环境。而这种行动收益除了战略收益外，也体现一种很明显的经济价值。

通过博弈树可以直观地看出，战俘B首先进行选择，如果B选择“不承诺”，他面临的待遇是继续被关押。在第二阶段，法国军队A根据他自己收益，选择不释放（-5）的收益肯定要比无条件释放战俘（-10）的收益好，因此，很明显的是如果战俘不作出不参战的承诺将不会得到释放。

在战俘B选择“承诺不参战”的子博弈中，如果战俘违背承诺，选择了参战，在第四个阶段中，只要战俘有大于0的概率被再次俘虏或者战死，他最终的收益都将小于0。因此，在第三阶段，战俘B会选择不违背承诺，不参战。回到第二阶段，法国军队A做选择，战俘会在第三阶段选择不参战，A选择释放战俘的收益10要大于不释放战俘的收益-5，因此会在战俘选择承诺不参战的情况下释放战俘B。因此，策略{承诺不参战，释放战俘，不参战}就是一个精练纳什均衡。

通过上述分析，假释（Parole）或者承诺在经济性的背景下就会有一个必然的结果。所以，笔者赞成美国学者大卫·E．杜菲认为假释词源蕴含着经济性的观点。

二、假释制度起源和发展中的博弈

有学者认为，假释制度的雏形可以追溯到16世纪英国的流放制度，英国的第一批罪犯被流放到美国。参见张丽卿：《假释制度的回顾与展望》，62页，台北，台湾元照出版公司，2001。所以，英国的流放制度被认为是孕育假释制度的温床。柳忠卫教授认为，“也许当时的统治者并未认真地考虑罪犯到了流放地以后如何执行刑罚的问题，但将本该处以死刑的罪犯予以流放，其中所蕴含的宽恕缓和的刑罚思想却是值得称道的，这是新的刑罚理念在刑罚制度上的反映，也是假释制度产生所必需的思想基础。” 柳忠卫：《假释制度比较研究》，46页，济南，山东大学出版社，2005。但也有学者对此提出了质疑。假释的起源“并非是出于人道主义的考虑，而是迫于经济上的压力”。贾文宇：《假释制度研究》，中国政法大学2008年博士学位论文，第11页。由于自16世纪末开始，英国本土的经济增长率和就业率迅速下降，经济萧条，失业人口急剧增加，然而与此形成鲜明对比的是，一些英属殖民地却经济繁荣，劳动力短缺。英国于1597年开始实施《罪犯流放法》，此时的英国政府主要选择的流放对象是战犯和政治犯等重罪罪犯，对被流放罪犯的最重要的一条限制就是不得回到英国本岛。1617年英国政府开始推行将罪犯流放北美的计划。政府将其中身体健康并适合海外劳作的罪犯进行流放到美洲，罪犯经过贩卖而成为自由的劳工。英国政府于17世纪初，通过法律的形式将暂缓执行刑罚的罪犯进行流放，一来可以解除犯罪分子对英国本土的危害，二来可以解决英属殖民地的劳动力短缺问题，并且可以从殖民地获取巨额利益。参见贾文宇：《假释制度研究》，中国政法大学2008年博士学位论文，第12—14页。到1776年，英国将其殖民地澳大利亚作为新的重要的罪犯流放之地，新南威尔士州行政长官亚瑟·菲利浦对流放到本地的英国本土罪犯，采取了一些与现代假释制度旨意相符的管理措施，比如选择一些表现较好，能保持善良行为的罪犯，附条件地提前释放。“1820年，英国于殖民地奥地利，把流亡岛上的囚徒，附条件地提前释放，乃系假释制度的滥觞。” 甘雨沛，何鹏：《外国刑法学（上）》，562页，北京，北京大学出版社，1984。学界广泛认为假释制度的真正起源于由亚瑟·菲利浦创制的释放票制度。

从1830年起至19世纪末，法国、澳大利亚、德国、日本、美国、意大利等国家先后建立了假释制度或者是与假释相类似的制度。参见柳忠卫：《假释制度比较研究》，54—61页，济南，山东大学出版社，2005。

前述学者分别从思想基础和经济基础的角度对假释制度的起源进行了梳理。假释制度诞生的思想基础是启蒙主义刑罚观与中世纪封建专制主义刑罚观博弈的结果。欧洲中世纪处于封建专制主义的极权统治之下，教会与王权在政治上联合，其在刑法上表现封建道德与刑法制度密不可分和罪刑擅断，在刑罚上表现为非常严苛和极端残酷。“这里所谓的启蒙主义，是指16世纪末到18世纪西欧一些进步学者所鼓吹的使个人从中世纪封建专制和教会权威束缚下解放出来，唤起人们对自由、民主觉醒的思想理论。” 马克昌主编：《近代西方刑法学说史》，1页，北京，中国人民公安大学出版社，2008。启蒙主义刑罚观的主要内容除了主张刑法与宗教分离、罪刑法定、客观主义、罪行相称、法律面前人人平等之外，还有目的论的刑罚观。启蒙主义以目的论的刑罚观反对封建专制主义残酷的报应刑主张。如孟德斯鸠认为，一切多余的刑罚都是暴虐的刑罚。在霍布斯主张的刑罚种类中有放逐刑，“放逐就是一个人为了一种罪行而被判处离开—个国家的领土或其中的一部分，并永远或在规定时期内不得返回的办法。这种办法根据其本质看来，如果没有其他条件的话，似乎不是一种惩罚，而是一种逃避，或是以出走的方式避免惩罚的公开命令。” [英]霍布斯：《利维坦》，黎思复、黎廷弼等译，246页，北京，商务印书馆，1985。这些启蒙主义的观点和学说都为英国的流放制度或者说是后来的假释制度提供了思想基础。

在经济基础方面，认为假释制度的诞生是经济基础与上层建筑矛盾的产物之一。在历史上任何一种制度的产生，必然取决于当时社会的物质生活条件或者说是生产力发展水平，假释制度也不例外。当时资本主义制度作为新生制度正处于上升阶段，由于生产方式的改变而对劳动力尤其是廉价的自由劳工需求日益增加。17世纪的英国已确立了资本主义制度，作为资产阶级利益代表的英国政府当然会契合资产阶级的要求，尽可能保持劳动力这一生产要素的充足供应。于是，英国政府将一批批战犯和政治犯流放到海外殖民地，转变为自由劳工，一是解除了犯罪对资产阶级政权和资本主义制度的危害，二是充分发挥了罪犯的劳动力这一生产要素的作用，三是客观地促进了流放地或者说是殖民地经济的发展。这对英国政府而言是利远大于弊，生命和自由对罪犯而言也是重大的利益，殖民地的生产力水平也得到提高。所以，假释制度的应运而生，是英国政府与犯罪做斗争的结果，在当时生产力水平下博弈的最优选择。

笔者认为，假释制度的产生是联盟型地域合作博弈的结果。我们可以把英国本土、殖民地和罪犯看成本次博弈的三方参与者，设英国本土为B（Britain），殖民地为C（Colony），罪犯为O（Offender），其中有k 个殖民地，所以殖民地的集合表示为C={1,2, …, k}；流放的罪犯为j 人，流放罪犯的集合表示为O={1,2, …, j}。根据前述我们可以得知，英国政府流放的是战争罪犯和政治犯等重罪罪犯，如果将这些重罪罪犯监禁在英国本土，英国政府将为这些罪犯支付监禁成本，本土的收益为b1≤0，这些罪犯的劳动力要素因为载体被监禁而未参与社会再生产，罪犯收益为o1=0，殖民地对劳动力的需求没有得到满足，收益为c1=0，社会总收益s1＜0；如果在英国本土释放，罪犯有可能继续危害社会，所以本土收益为b2（b2≤b1≤0），罪犯因为再次实施危害行为而获得收益o2≥0，殖民地对劳动力的需求仍然没有得到满足，收益为c2=0，社会总收益s2＜s1且s2≪0；如果将罪犯流放到殖民地，英国本土不仅不需支付监禁成本，还可以从殖民地获取巨大经济利益，所以本土的收益为b3＞0，罪犯因为在殖民地被释放而获得收益o3≥0，殖民地因为解决了劳动力短缺而使社会生产力水平提升，收益为c3≥0，社会总收益为s3≫0。通过以上分析，我们可以知道s3＞s1＞s2，所以，{英国本土流放，罪犯获释，殖民地生产}就是本合作博弈的解。

当然，以上仅仅是对假释起源的博弈分析，而在假释的发展过程中，则有着更为深入的合作博弈刻画。根据纳什对合作博弈的界定，各博弈主体都能基于自己的理性，从个体利益出发与其他博弈主体组成联盟，而这样的联盟可以获得更大的总收益。由部分博弈主体组成的小联盟用S 表示，由所有博弈主体组成的大联盟用N 表示。

“定义1：设博弈的局中人集合为N={1,2, …, n}，则对于任意S⊆N，我们称S为N 的一个联盟。这里，允许取S=∅和S=N 两种特殊情况，我们把S=N 称为一个大联盟。” 范如国：《博弈论》，242页，武汉，武汉大学出版社，2011。

根据定义1，在母国本土M、k个殖民地C和j 个假释罪犯O的合作博弈中，局中人集合为N={M, C, O},（C={1,2, …, k}; O={1,2, …, j}），即本博弈的局中人集合N={M, C={1,2, …, k}, O={1,2, …, j}}，若|N|=1+j+k，则|N|中的联盟个数为。v 是博弈＜N, v＞中的每个联盟S（包括大联盟N 本身）相对应的特征函数。

“定义1.2：给定一个有限的参与人集合N，合作博弈的特征型是有序数对＜N, v＞，其中特征函数v是从2N={S|S⊆N}到实数集RN的映射，即＜N, v＞:2 N→RN，且v（∅）=0。” 董保民，王运通，郭桂霞：《合作博弈论——解与成本分摊》，15页，北京，中国市场出版社，2008。

根据定义1.2，因为“v是N 中的每个联盟S（包括大联盟N 本身）相对应的特征函数，v（S）表示如果联盟S 中参与人相互合作所能够获得的总支付。在合作博弈中，如果支付是可以被瓜分的，我们称为可转移的，反之则称为不可转移的。” 范如国：《博弈论》，242页，武汉，武汉大学出版社，2011。随着从母国本土向殖民地进行转移的罪犯的劳动力要素，母国本土对罪犯的惩罚成本也必须向殖民地转移，殖民地也因为接受转移而增加了社会总收益，而这增加的社会总收益由母国本土、罪犯和殖民地进行了分配。所以，只有这些增加的社会总收益是可以在博弈方进行转移和流动，才会使得博弈方有积极进行合作的偏好。也就是说，如果母国本土向殖民地流放罪犯的成本高于监禁罪犯的成本，罪犯在殖民地进行劳动生产所得收益低于在本土被监禁的收益，以及殖民地并不缺少劳动力这一生产要素，在理论上就不会出现这种联盟型博弈的状况，也就意味着假释的起源就失去了经济基础。所以，只有博弈的各个参与者都能从这一联盟中获得收益，才能保证他们有积极组成大联盟的愿望，这种愿望在符合假释的发展条件下，就可以转化成假释制度发展的强大推力。

“定义4：一个支付可以转移的联盟型博弈＜N, v＞是有结合力的（Cohesive），当且仅当，对于集合 N 的每个分割物（Paritition），即{S1, S2, …, Sn}，且Sj=∅，以下的关系式都成立” 范如国：《博弈论》，242页，武汉，武汉大学出版社，2011。：

根据定义4，如果说一个可转移得益联盟型博弈具有结合力，我们就可以知道任何一个博弈方都能从这个联盟中得益，从而具有组建大联盟的积极性。当假释成为一个联盟的表现形式时，假释便具有了大联盟和小联盟的基本特性。由于这些博弈中的支付都是可转移的，因此，总联盟型的情况必定是帕累托最优的。根据上述特征，在母国本土M、k 个殖民地C 和j 个罪犯O 的合作博弈中，由于N={M, C={1,2, …, k}, O={1,2, …, j}}，所以可以有个联盟组合，当时，这就意味着母国本土、殖民地和罪犯的得益处于帕累托最优；当时，这说明母国本土、殖民地和罪犯的得益状态仍存在帕累托改进。

“定义5：在一个支付可转移的联盟型博弈＜N, v＞中，如果对于任意的S, T∈2N，且S∩T=∅，有v（S）+v（T）≤v（S∪T），那么，我们称该合作博弈＜N, v＞是超可加的（Supper-Additive）；如果对于任意S, T∈2N，且S∩T=∅，有v（S）+v（T）≥v（S∪T），我们称该合作博弈＜N, v＞是次可加的（Sub-Additive）；如果对于任意S, T∈2N，且S∩T=∅，有v（S）+v（T）≡v（S∪T），我们称该合作博弈＜N, v＞是可加的（Additive）。”

通过定义5我们可以知道超可加的得益可转移的联盟型博弈的特性：“在一个超可加的支付可转移的联盟型博弈中，如果我们把大联盟N 分成两个不相交的小联盟，那么这个小联盟的得益的总数是绝不会大于总联盟的得益的，而如果把从总联盟中分出来的任何一个小联盟再分成两个不相交的更小的联盟，那么，这两个更小的联盟的得益的总数绝不会大于该小联盟的得益。也就是说，如果一个支付可转移的联盟型博弈是超可加的，那么它便是有结合力的。” 范如国：《博弈论》，242页，武汉，武汉大学出版社，2011。根据联盟型博弈的超可加性以及得益可转移性，由此我们可以对假释制度在19世纪快速的发展作出更有说服力的分析。

19世纪资本主义经济快速发展，老牌资本主义国家疯狂对外实施殖民政策，殖民地对劳动力需求旺盛，老牌的资本主义国家将在殖民地获取的利润输入本土以维持本国资本主义制度的有效运转。在这一时代背景下，设有在n个母国本土M、k个殖民地C和j 个假释罪犯O的合作博弈＜N, v＞中，有博弈参与人N={M, C, O}，即N={M={1,2, …, n}, C={1,2, …, k}, O={1,2, …, j}}，若|N|=n+k+j，则有2n+k+j个小联盟。

“定义3：一个支付可转移的联盟型博弈是由一个有限的博弈者集合N 和一个定义在集合N 的函数v所组成的，而这函数v对集合N 当中的每一个可能的非空子集S都会进行赋值，其值为一个实数，我们用＜N, v＞来表示一个博弈，而函数 v 为每一个集合 S ⊆N 所赋的值则称为 S 的联盟值（Coalition Worth）。” 同上。

根据定义3可设该博弈的联盟值为P，即

如果增加x个母国采用假释制度，则该可转移得益的合作博弈的联盟值

由定义3可知，

将（1）式、（2）式代入（3式）可得，

根据（2）式、（4）式，设如果增加y 个被假释的罪犯，则该可转移得益的合作博弈的联盟值

同理，设如果增加z个殖民地来接受从本土流放的罪犯，则该可转移得益的合作博弈的联盟值

由（4）（6）（8）式组成不等式方程组

综合定义5得益可转移的联盟型博弈的超可加原理和定义4的结合力特性，我们可以得出以下不等式都成立：

，且∀（n, k, j, x, y, z）≥ 1

这个不等式表明，由于假释的得益在博弈主体间可以转移，当且仅当任何博弈方在小联盟中的得益不大于大联盟的得益时，博弈主体就有组成大联盟的动力。从整个社会来说，更多的国家采用假释制度，可以减少监禁从而降低社会管理成本，这是应当减少的得益而未减少，是间接增加社会收益的一种形式。而假释更多的罪犯，可以为社会再生产提供更多的劳动力要素，这是直接增加罪犯的收益和社会收益。根据理性人的假设，假释制度就是一个得益可转移的联盟型博弈，并且具有超可加特性，这也就意味着参与假释的博弈方的整体收益要大于部分收益之和而产生某种剩余，这种额外的剩余可以在博弈方进行分配和转移。所以，笔者认为，国家和被监禁的罪犯对这一额外的剩余得益的追求，便是假释制度迅速发展并成为世界通用准则的动力源泉。