第1章
人人皆输的“囚徒困境”
人们常常从自身利益出发,选择放弃最佳合作策略,从而陷入长远利益受损的局面。如何破除困境?这里有两项挑战:第一,达成合作协议;第二,让各方不变卦、不作弊。
生活中处处充满着纳什所说的隐藏逻辑陷阱,将我们引入各种社会困境。“社会困境”这个听来乏味的词,是由博弈论理论学者所创,讲的就是类似“公地悲剧”这种情形。虽然大家都知道团结力量大,但又都挡不住自私的欲望,总想在合作的时候动点手脚,占点便宜。而等到每个人都动了点手脚,最后共同的下场就可能凄惨无比,就像普契尼歌剧《托斯卡》里的主角一样,陷进了今日博弈论学者所谓的“囚徒困境”。
剧中的女主角托斯卡遇到一个令她无比苦恼的问题:男朋友卡瓦拉多西被邪恶的警督斯卡皮亚定成死罪。她和斯卡皮亚独处一室时,斯卡皮亚表示,他可以大发慈悲,叫手下在行刑的时候改用空包弹,救卡瓦拉多西一命,但条件是她得提供些“特别的服务”。托斯卡该怎么办?
她瞄到桌上放着一把刀,想到了两全其美的办法:先答应斯卡皮亚的要求,等他吩咐完手下后,一靠近就把他刺死!但不幸的是,斯卡皮亚也想好了一个“两全其美”的办法:托斯卡答应之后,他并没有真的叫行刑队改用空包弹!结局就是斯卡皮亚被托斯卡一刀捅死,卡瓦拉多西被一枪毙命。等托斯卡发现这样的结局,也从城堡上一跃而下,结束了自己的生命。如同其他歌剧中常见的情节,最后人人都是输家。
在现实生活中出现的囚徒困境,常常也都是人人皆输的局面。
20世纪50年代早期,普林斯顿大学的数学教授阿尔伯特·塔克就用了这么一个故事,向一群心理学者解释这个问题。
这个故事的版本众说纷纭,其中一个版本是讲警察逮捕了两个小偷(姑且借用“水门事件”的两名共犯名字,称他们为伯纳德和弗兰克),但检察官手上的证据只能证明他们非法持有及藏匿枪械,判处两年徒刑,而无法证明他们结伙抢劫,判处十年的重刑。这种情况下,如果两人都辩称无罪,就只能各判两年徒刑,但检察官想出一个妙法,让他们俯首认罪。
检察官先到伯纳德的羁押房,表示如果弗兰克认罪,而他不认罪,弗兰克能得到减刑,只判4年刑期,但他会被判最高刑期10年。这样一来,如果他相信弗兰克会认罪,自己最好也认罪,判4年总比10年来得好。检察官又说:“但我可以开个条件,如果你认罪,而弗兰克不认罪,你就可以因为这个不利于共犯的证词无罪释放!”
这样看来,不论弗兰克做何决定,似乎认罪都是伯纳德最好的选择,这逻辑看来可真是完美无比。但问题就在于,检察官后来也去拜访了弗兰克,提出同样的建议,而弗兰克也得到同样的结论。最后两人都认罪,也都被判4年徒刑;而相较之下,如果两人死不认罪,其实都只会被判两年。
如果你觉得这个故事特别像美国的认罪协商制度,还真是一点都没错!也正因为如此,许多国家认为认罪协商根本不合理。故事点出的这种逻辑悖论,在我们生活中影响深远,从结婚到战争,无所不在,甚至还成为社会学的基本问题。因为,虽然我们总试着要团结合作,过和谐的生活,但又会被这种逻辑悖论影响而起争执。
我和弟弟就深受其害。我们偷吃妈妈做的蛋糕,大快朵颐了一番。原本神不知鬼不觉,只要我们保密,把错都推给我家小狗就成了。但我想,出卖弟弟让他顶罪应该比较安全,偏偏他也这么想。这下两个人都被禁足,肚子胀得难受,屁股还疼得要命。
在我即将20岁时,我们又被“囚徒困境”这可恶的逻辑悖论摆了一道。我们喜欢上同一个女生,她全家刚搬到我家附近,和我们去同一个教堂做礼拜。这个美女让附近的少男眼睛一亮,追求者远远不止我们两个。弟弟和我都急着出卖对方丢人的小秘密,好在她心中抢得一席之地,最终却落得两败俱伤,只能看着她没多久就和别的男生出门约会去了。
囚徒困境其实无所不在。另一个明显的例子就是英国在2002—2003年暴发口蹄疫之后,许多乳牛遭捕杀,而超市营业者则趁机联合哄抬乳品价格。
当时四大连锁超市调涨了鲜乳、奶油和起司的价格,表示它们要付给酪农更高的价钱,以免酪农活不下去。但其实根本不是这么回事,至少其中两家都只是把价差拿来中饱私囊。公平交易委员会调查后,指控这两家超市勾结牟利。这两家起初也认了罪,但在认罪后,又把另外两家原本否认联合操纵价格的超市给供了出来。如果另外两家最后被定罪,罚款金额将颇为可观,相较之下,认罪的两家靠着出卖他人,付的罚款就低多了。
还有一个例子是关于死海古卷,这些古本出土于死海西北岸的库姆兰(Qumran)。首批古卷是一群当地的贝都因(Bedouin)牧羊人在洞穴遗迹中发现的,而且考古学者愿意出高价向他们购买,从此之后牧羊人开始积极寻找古卷,又找到一些残片。但他们也发现,哪怕只是一小片,考古学者还是愿意付钱买,于是牧羊人开始把找到的古卷撕碎,再一片一片拿去卖。
考古学者如果只对大片完整的古卷付出高价,就能避免这种情形,否则,牧羊人当然会把古卷撕成小片。双方都陷入了囚徒困境,而遭殃的是珍贵的文物。
囚徒困境点出了一个逻辑上的难题,这个难题也正是世界上许多重大问题的核心。例如20世纪50年代开始的军备竞赛,对所有人都有利的方式,就是合作禁核,把钱省下来用于其他建设;然而,如果其他国家都还在不断发展核武,而你的国家单方面销毁核武器,恐怕并非明智之举。
近年来在对抗全球变暖的努力上,也受限于同样的逻辑悖论。许多国家都想,如果其他国家的污染没改善,我又为什么要自己先限制碳排放量呢?
长期而言,这种问题无法得到真正的解决。走入囚徒困境,顶多也只能带来短期的效益,真正的改进之道,在于了解我们自己。因此,我从科学研究中腾出一些时间来研究哲学,希望能找到答案。但到头来又回到了科学:在伦理学的领域中,讲的是遵守原则,好创造一个稳定而公正的社会,但总是出现诸如囚徒困境等种种社会困境,而困境的根源正在于逻辑和数学。我自己很喜欢一头栽进数学和形式逻辑里,但是,如果一般人只是想知道这些问题究竟从何而来,又有何影响,倒是犯不着涉足这两个领域。
对于社会困境的了解,在1949年有了相当大的突破:纳什发现,其实各种困境都来自同样的基本逻辑陷阱。现在大家讲到纳什,想到的多半是电影《美丽心灵》中那位不太正常的主角,但其实电影几乎只沉浸于他的精神疾病,对于他荣获诺贝尔奖的发现却是轻描淡写,也没说明这项重大的发现如何让我们更了解关于合作的问题,以及如何解决这些问题。
纳什年仅21岁时就提出了这项重大发现,当时他尚未罹患纠缠他大半辈子的精神分裂症。某次访谈中,他甚至还能拿自己的精神疾病开玩笑,他说:“整体而言,数学家的精神还算正常,学逻辑的人脑袋才有问题。”他在1948年到普林斯顿大学攻读数学硕士学位,申请时的教授推荐函言简意赅,只有一句:“这个人是天才。”
短短18个月内,他便证明了自己确实是个天才。他先是用当时刚发明的博弈论发现了这个逻辑陷阱,也就是现在所称的“纳什均衡”,接着又证明了他惊人的论点(命题):在任何竞争或冲突中,如果各方不愿或无法沟通,就至少会有一个纳什陷阱等着请君入瓮。
纳什均衡背后的观点看来似乎相当简单(参见方框1.1)。在纳什均衡的情形下,双方均已选定一种策略,任意一方独自改变策略,就会使情形恶化。就像在狭窄的通道上,两个人必须各靠一边,才能勉强错身而过,而这就是纳什均衡。任何一个人改变心意闪向另一边,两个人就会迎面相遇,然后就像非常有默契地跳起了双人舞,一起向左、向右踏,却怎样都过不去,这种经历相信大多数人都有过。
纳什将这种状态称为“均衡”,因为这是社会情境中的一个平衡点,其中任何一方独自偏离了这个平衡点,只会造成损失。在这里,“独自”是个关键词,只要我们独自行事,各自追求自身利益,就永远逃不出纳什均衡所设下的种种社会困境。
举例而言,如果两人在狭窄的人行道上碰面,各自又都不想走靠水沟的那一边,以免驶过的车把水溅到身上,这种情形下,必须有一人退让,否则他们就只能僵在那里动弹不得。
方框1.1
纳什均衡与囚徒困境
博弈论研究者会这样描述纳什均衡:“在各方都选择了同一种策略的情形下,没有一方能通过独自改变策略而获益。此时的策略搭配和后续结果,就构成纳什均衡。”博弈论研究者使用简明的图表来表达不同的选项和结果,就像是建筑师的蓝图,以确保一切尽在掌握之中。他们把各种可能性画成一张矩阵图,代表局中人受困的处境,就像1999年的科幻电影《黑客帝国》里所演的一样。这种方式的设计者是美籍匈牙利数学天才冯·诺依曼,他也是博弈论的发明者。
以下是伯纳德和弗兰克的囚徒困境,这两个矩阵图显示了各种选项会造成的刑期:
在每个格子之间有小小的通道,箭头方向代表两人可以缩短刑期的选项。从图中可以清楚看出,不论一方选择为何,另一方合乎逻辑的选择只有认罪这一条路。博弈论研究者会说认罪是优势策略(dominantstrategy),不论另一方怎么选择,都能得到最佳结果。
博弈论研究者将以上两图合二为一,所包含的信息完全相同,但如果没有解释,可能无法第一眼就看懂:
这种图表能清楚看出结果的配对。格子中的数字,左边是伯纳德,右边是弗兰克。举例来说,你可以看出不会有(0,0)这种选项,表明不会出现两个囚犯同时免于牢狱之灾;任何一个囚犯想免于牢狱之灾,唯一的可能就是对方被判10年,换言之,只会有(0,10)或(10,0)的搭配。
如果我们在各个格子中加上小通道,伯纳德只能上下移动,弗兰克只能左右移动(和先前的图表相同),并且也加上小箭头,就可以看出他们的困境何在。他们如果能采用合作策略(两人都不认罪),会形成(2,2)的选项,但只要其中有一人动了自私的念头,连锁反应就会无情地将他们带到(4,4)这一格,而且再也无法逃脱!(请注意这一格没有向外的箭头。)现在我添加了表情图案,来代表他们面对各种境况的心情:
其中,(4,4)这一格就是纳什均衡(在此处和后续的图中,就用灰色网底表示),任何一方想独自逃脱,只会让自己的问题更大。例如,如果伯纳德选择不认罪,反而会判刑10年,而不是4年,弗兰克的情形也相同。两人必须合作、协调,“同时”不认罪,才能实现(2,2)的最佳选项。
要解决这种处境,秘诀在于双方要设法协调行动,而且不能有一方改变心意。我有个朋友看过一个有趣的例子,当时他正在意大利的山路上开着车。有一段道路缩减到只剩一条车道,双向来车必须有默契地谦让才能轮流通行,但正好碰上两位互不相让的驾驶员,就这么卡在狭窄的路中间,彼此大按喇叭,想要对方后退。两个人坚持不退让,后方很快形成长长的车龙,喇叭声此起彼落,怒火交加。后来,警察花了三天才疏解了这场塞车问题。
这件事的症结在于双方都站在自己的立场思考,希望对自己最有利。我们也常常如此,并因此困在纳什陷阱之中,既像是托斯卡和斯卡皮亚,也像弗兰克和伯纳德。让纳什荣获诺贝尔奖的论文,可能是诺贝尔奖有史以来最短的一篇,在论文中他同时使用了符号逻辑和高等数学,证明在不合作的情境中,纳什陷阱无所不在!(所谓的“不合作”情境,就是双方不愿或无法互相沟通。)
在纳什发表这篇论文之前,在讨论合作为何失败、无法共谋利益时,通常都是从个人的心理学、道德观角度切入。虽然这两者也的确很重要,但纳什指出,这些问题的核心都深埋着一个逻辑问题,而且这常常才是主因。这个逻辑问题用我们的自身利益作饵,不断让我们放弃最适当的合作策略,而陷入长远利益受损的局面。
读报纸或八卦杂志时常能看到纳什所说的这种逻辑。夫妻大闹离婚,通常只要双方妥协,就能好好收场,但如果一方拒绝妥协,另一方的退让也就毫无意义。结果双方坐困纳什陷阱,不仅得付给律师大笔金钱,过程中还必须承受情绪上的压力。
在此必须强调,双方之所以困在这个矛盾的逻辑循环中,是因为他们不愿或不能通过沟通来采取合作的策略。
不幸的是,这件事说来轻松,做起来很难。常常双方同意沟通协调,达成协议后却有一方反悔。问题在于:如果合作达成的解决方案(协议)并非纳什均衡,其中一方改变心意,就的确可能得到更好的结果。一般而言,要达成合作有两项重大挑战:第一是找到方式达成协议,第二是找到方式让每个人不改变心意。后者必须完善到足以令双方相信对方会遵守,而且还能维持到结果正式出炉。
这本书就是要告诉各位如何寻找以上两项挑战的答案,答案既涉及个人层面,也涉及人类共同重大议题层面。我发现主要的解决方式有三种,每种方式都有来自不同族群、不同文化的拥护者。
•改变态度:例如,如果我们都认为在合作中作弊是不道德的,就能避免许多社会困境。
•诉诸善意的权威人士:由外部的权威人士来促成合作并守护公平。
•能够自行运作的策略:开发出能够自行运作的策略,如此一来,只要合作一开始,就不会有作弊的机会。
下面我会一一审视这三种解决方式,而且我认为,只有第三种方式可以长久,而博弈论的新观点,可以协助我们在许多情况中运用这种策略。