哈佛博弈课
上QQ阅读APP看书,第一时间看更新

第7章 囚徒的困境(2)

如何达成彼此信任的关系呢?一个比较有效的方案就是签订一份对双方都有约束力、对背叛者施以严厉惩罚的契约。比如在商业领域,即使双方未曾合作过,也能通过订立合同达成彼此信任的关系,从而实现合作。因为合同中带有违约条款,谁不遵守合同,谁就将承担对自身极为不利的法律后果。

当然,签订合同与诚实守信地履行合同是两回事,但比起没有合同来,签订具有约束力的合同显然更有利于防止“背叛”的出现。

第二,建立长期关系,进行重复博弈。

吸烟者都明白,吸烟可以满足一时的快感,却会导致日后的健康问题。可是对于只顾满足眼前欲望的吸烟者而言,吸烟将是他的最佳选择。同样的道理,在囚徒困境中,如果参与者不考虑将来,背叛是最好的选择,尤其在博弈只有一次的情况下,对参与者而言,背叛简直就是理所当然的选择。

在单次博弈中,背叛者只看到预期收益,而不顾预期风险。如果参与者将预期风险也考虑进去,就会对其策略作出调整,因为现实中的博弈有很多都是“不定次数的重复博弈”。预期风险的存在,改变了博弈参与者的收益,改变了收益也就改变了参与者的动机。

事实上,重复博弈也更逼真地反映了日常人际关系。在重复博弈中,合作的长期性能够纠正人们短期行为的冲动。

第三,施以报复,让背叛行为不敢发生。

同样是在富翁被杀的囚徒困境中,假如每一个拒绝坦白的囚徒,都可以在刑满释放后对坦白的囚徒进行报复,那么每个囚徒就可能因担心未来的报复而宁愿选择抵赖,这样,双方都抵赖的均衡就出现了,合作达成。

在很多案件中,的确可以看到犯罪集团的成员被拘后拒不坦白。这在很大程度上与惩罚机制有关。因为在犯罪集团中,如果出卖其他成员,将永远无法在“江湖”立足,并且其家人也将受到其他犯罪集团成员的追杀。正由于这种报复与惩罚机制的存在,使得囚徒间彼此合作,从而打破了“囚徒困境”。

第四,通过教育改变收益,进而改变参与博弈的动机。

通过教育的方法改变博弈的收益,从而改变参与者参与博弈的动机,这样也有助于打破囚徒困境,但这种方法并非总是有效的。

“自私”是社会的驱动力

吉姆和德拉是一对非常恩爱的夫妻,他们非常贫穷。吉姆身上最值钱的就是一块怀表,但是穷得连一条表链都买不起。德拉有一头非常漂亮的金色秀发,却没钱买一把好梳子。圣诞节来临,这对夫妻尽管身无分文,却都想给对方悄悄准备一份礼物。

吉姆想来想去,狠下心把心爱的怀表卖掉,为心爱的人买了一把漂亮的梳子,好让妻子梳理那一头美丽的金色长发。然而,德拉为了给吉姆买一条表链,卖掉了自己的满头秀发。最终他们发现,吉姆再也不需要表链,德拉也不需要梳子,而他们最值钱的两样东西,现在都没了。

在欧·亨利著名的短篇小说《麦琪的礼物》的故事中,夫妻双方完全不为自己着想,结果反而不如自私的好。这从另一个角度告诉我们,自私自利并不该一律否定。

只有在人们绝对自私的时候,合作才会给参与各方带来更多的利益;当人们不是出于自私的目的而合作时,不但不会得到更多利益,反而可能造成“双输”的局面。

哈佛大学曾经举办过一次“合作与社会两难困境研讨会”,会后两位学者亨廷顿和海耶斯提议,在座的专家一起玩一个游戏。他们拿出一个大信封,让专家每人拿出一定的现金放进去,如果最后信封里的钱超过了250元,那么亨廷顿和海耶斯会返给每个专家10元;可是如果信封里的钱不足250元,信封里的钱就全归亨廷顿和海耶斯所有。

当时在场的除了亨廷顿和海耶斯之外共有43个人,简单计算一下就可以知道,只要每个人放入信封250/43元,也就是不到6元,那么每个人都可以得到10元。可是,等到所有人都把钱放进大信封之后,亨廷顿和海耶斯数了一下,一共只有245.59元,距离250元只差不足5元。

看过这个故事,很多人都会说这些专家太自私了,只要有一个人多拿出5元,所有人都会得到不错的回报。然而,事实恰恰相反,并不是这些专家太自私,而是这些专家还不够自私。

在日常生活中,人们往往将自私与贪婪、嫉妒等词语联系起来。在博弈中,理性人追求自身利益最大化,实际上就是自私。在亨廷顿和海耶斯的游戏当中,各位专家理性的选择应该是这样:如果最后信封里的钱超过了250元,自己的最优选择就是不投进一分钱,因为这样自己会得到最大利益即10元;如果最后信封里的钱没超过250元,自己的最优选择同样是不投进一分钱,因为这样可以避免任何损失;在场其他人可能也会做出同样的理性分析,所以大家都不会投钱,也就是说信封里面的金额肯定不会超过250元。如果各位专家足够理性、足够自私,那么信封里应该一分钱都没有。信封里面会有那么多钱,说明专家们还是愿意为增进大家的共同利益作出一些牺牲的。

或许一些伦理学家会为专家的这次合作感到高兴,但是对于损失利益的专家们来说就没有任何喜悦可言了。当个体没有从理性的角度来考虑该不该合作时,合作注定是会失败的。合作的基础并不是人们愿意在合作中牺牲什么,而是人们希望从合作中得到什么。人们因为追求自己的利益参与到一场合作当中,这样的合作才是稳定的、可靠的。专家之间的合作其实根本就不应该存在,因为这样的合作给每个人带来的是损失而不是利益。下面我们来看一个人性的不自私无法促成合作的例子:

从前,两位旅行者遇见了一位圣者。圣者受到两人的热心照顾,十分感动,在将要离别时对两个人说:“很遗憾,我就要和你们道别了。分手前,我要送给你们一个礼物,礼物就是你们当中一个人先许愿,他的愿望一定会马上实现;而第二个人可以得到那个愿望的两倍!”此时,一个旅行者心里想:太棒了,我知道我想要许什么愿,但我先不讲,先许愿自己就吃亏了,因为对方可以实现双倍的愿望。而另外一个旅行者也自忖:我不想让他实现双倍的愿望。于是,两位旅行者“客气”起来:“你先讲嘛!”“你年长先许愿吧。”“不,应该你先!”终于,一个人生气了,大声说:“你真是不知好歹,再不许愿,我就把你的狗腿打断!”另外一个人听了也很生气,没想到对方居然恐吓自己!于是想,我得不到的东西,你也休想得到!这人心一横,狠心说:“好,我先许愿!我希望我的一只眼睛瞎掉!”很快,这位旅行者的一只眼睛瞎了,而他的同伴两只眼睛都瞎掉了!

对这两位旅行者来说,最好的选择就是采取合作的策略,虽然这样对方会获得两倍的利益,但自己同样也会获得不错的利益。然而双方最终没有合作,主要是因为这两个人还不够自私,他们总是会想到对方将获得更多的利益,可是他们没有明白的是,如果对方的利益与自己的利益没有冲突,自私的人就应该安然接受。

永远不会消失的困境

在现实生活中,处于囚徒困境的时候,没有什么十全十美的办法能让自己既从困境中逃脱,又能获得利益,只能尽量做到使自己不受侵害,并不惜牺牲其他参与者的利益。出卖合作者在道德层面上而言是不对的,但就博弈论来说,则是迫不得已的选择。

两个朋友一起去深山里游玩,结果遇到了一只熊,他们都十分害怕。其中一个人弯腰下去把鞋带系好,做好逃跑的准备。另一个人对他说:“你这样是没有用的,你不可能跑得比熊快。”那个准备跑的人回答说:“我不需要跑得比熊快,我只要跑得比你快就行了。”

囚徒困境下,博弈参与者有时别无选择,他们必须力争让同伴成为最大的牺牲者,这样才能让自己获得囚徒困境下最好的处境,这就是出卖合作者原则。在这个“朋友和熊”的故事里面,那个准备逃跑的人面临的选择有以下几个:

选择A——不逃被熊吃掉;

选择B——逃跑,被熊吃掉;

选择C——逃跑,得以生还。

在这些选择里面,如果选择逃跑,会有生还的机会,而他的朋友也有同样的这三种选择。对于选择逃跑的人来说,只要他选择了逃跑,就会有生还的机会。如果他的朋友选择不逃跑,生还的机会自然属于他;朋友选择逃跑,就需要一个附加条件——他跑得比朋友快,这样才会生还。所以,在这一博弈过程中,无论他的朋友做出什么选择,只要他自己拼命去跑,就会有机会生还,这是一个标准的囚徒困境模式。

囚徒困境之所以会出现,是因为在这种博弈模型中,每个局中人都以自身利益为第一参考因素。追逐利益是人的本能,每一个人在博弈过程中都是自私的,有时甚至为了自己的私利而不择手段。正是因为人的自私性,囚徒困境的难题会出现在诸多事情上。

在美国,人们将领导人任期将满时出现的一种不合作现象称为“跛鸭效应”。比如总统任期的最后阶段,“跛鸭效应”的出现损害了他们为别人提供合作动机的能力,从而会造成很多问题。与总统类似,很多公司的CEO们在任期的最后阶段也会出现这种情况。重复博弈的精髓就是,未来为现在提供了动机。之所以会有这种“跛鸭效应”,是因为将失去来自未来的激励,所以也同时失去了对未来的回报或惩罚的承诺,导致合作破裂,领导人得以从博弈中解脱,“背叛”的诱惑将难以遏制。

现在假设甲、乙两人进行囚徒困境博弈,会出现怎样的情形呢?假如这个博弈只玩一次,双方都可能使坏。假如甲使坏,乙善意,甲、乙收益为(3,3);假如甲善意,乙使坏,甲、乙收益为(0,3);甲善意,乙善意,则收益为(2,2);甲使坏,乙使坏,则双方收益为(1,1)。因此,不管对手怎么做,假如这个博弈只玩一次,坏心一定比较有利。然而,假如博弈1000次,情况会是什么样子?

假如在整个博弈中,甲、乙都使坏,双方的效用都是1分。但要是甲、乙两个一直都不使坏,双方的效用就是2分。假如甲、乙其中一个开始使坏,对手就会跟着使坏,于是双方就会形成只得1分报酬的僵局。所以甲宁可先表达善意,希望乙也跟进。如果每次都是甲采取先动策略,那在最后一回合甲肯定要使坏,而乙很可能预知甲使坏而在前一回合就开始使坏。

既然如此,甲在第999回合应该怎么做?甲在第999回合选择使坏一定可以得到比较高的报酬。假如甲不想在第999回合选择使坏,唯一的理由就是为了让对手在第1000回合对自己不使坏。但前面已经论证,不管怎么样,乙在第1000回合都应该会使坏。因此,双方在第999回合都会选择使坏。当然,这表示他们在第998回合也应该选择使坏,因为双方在第999和第1000回合一定会选择使坏。如果我们把这个逻辑一直往回推,可以证明甲在第一回合就会选择使坏!

因此,就算这个囚徒困境博弈进行1000亿次,只要这个博弈存在确定的最后一次,理性的参与者在每个回合都会选择使坏。

博弈论认为,当两个博弈者陷入有限次数重复性博弈中的囚徒困境时,他们一般会选择使坏。

如果一种合作关系有个已知的终点,而且合作关系中的每个人都知道在某个时间这种关系会终止,那我们基本上就不能通过重复博弈来维持合作,囚徒困境还是不会消失。