博弈中的能力和理性
了解了很多的博弈理论之后,我们突然发现实际情况似乎并不像书中所说的那样,反而更加不可捉摸。这是为什么呢?因为我们在博弈分析的过程中选择性地忽略了一个问题:那就是博弈方的能力和理性。
能力和理性会决定博弈方的行为逻辑,也就是其参与博弈的目的是什么,还有其达成目的的能力怎么样,这直接决定了博弈方策略的选择和博弈的结果。所以,只有了解了博弈方的能力和理性,才能准确地做出判断和预测。比如说美国加入朝鲜核问题谈判的目的是什么,它又会对其目的投入多大的力量。准确把握这些信息之后,我国才有可能在谈判中取得主动权,然后获取得益。
我们之前列举的大多数例子都遵循了一个学术研究的惯例,那就是“理性经济人假设”。所以,每个例子中的博弈方都可以做出最准确的判断,而且从来不会犯错误。但是在日常生活中绝对理性的人是不存在的,所以拥有绝对完美的分析能力和从来不犯错误的“完全理性”的假设肯定是不符合常识的。
在博弈理论的研究当中,各个博弈方之间的相互影响和依赖性是非常强的,这时候只要有一个博弈方的能力和理性出现问题,甚至说只要有某个博弈方对其他博弈方的能力和理性产生怀疑,那么整个博弈分析的基础就会被破坏,我们以“理性经济人假设”为前提进行的分析和得出的结论也会完全失效。因为某些原因,我们在理论分析过程中暂时性地忽略了“有限理性”的存在。
但是现实的博弈过程中,错误的判断、遗忘、赌气,等等原因造成的决策偏差和过失是时常存在的,我们不能指望每个博弈方都能做出最完美的决策来迎合自己的理论。如果我们仅仅分析“完全理性”之下的博弈,就会局限博弈论的适用范围,甚至会造成错误。所以,我们在借助“完全理性”假设了解了博弈分析方法之后,就需要将“有限理性”代入其中,让博弈分析的结论更加真实和准确。
我们再回到那个买鞋的故事当中,按照“完全理性”的假设,我们的奶奶肯定要用自己认为最合适的价格来买那双鞋子,也就是300元。但是在“有限理性”的情况下,售货员如果坚持不肯降价,那么奶奶很可能会为了给我们买到满意的鞋子而选择妥协,那么她付出的代价可能是318元,也可能是320元。
我们在研究“有限理性”博弈时,需要注意博弈方理性的多层次和多样性。面对理性层次较高,而且学习能力较强的博弈方,我们采用的分析机制叫做“最优反应动态”,也就是采取最佳的策略选择来得到最符合自己利益的博弈结果。其结果很接近“完全理性”的博弈结果。
自2006年开始发生在全国各地的“彭宇案”,就可以当做一个简单的“最优反应动态”。当老人倒地之后,“彭宇们”的选择有两种:一是扶老人起来,我们可以标记为得益a;二是害怕被老人反讹,所以选择明哲保身,我们标记为得益b。当最初还没有发生过老人倒地反讹事件的时候,出于个人素养等原因,很多人都会选择得益a。但是当“彭宇案”闻名全国并且相继发生之后,使得选择得益a的风险变得极大。所以根据最优选择,也就是完全理性中的“自身利益最大化”原则,“彭宇们”的选择就开始集中在了得益b,即便有所偏移,也会被拉回既定轨道。例如2011年的扬州小伙因为怕惹事儿,所以扶起倒地老人之后又松手。从社会道德素养的角度来看,这个结果似乎有些令人沮丧,但是从“最优反应动态”的角度分析来说,这样的结果却又合情合理。
当我们面对理性层次较低,而且学习能力较差的博弈方时,我们采取的分析机制是“复制动态过程”。也就是当博弈方遇到类似的问题时,他不会去进行最优选择思考,而是模仿与之情况类似的处理方式。
在了解了“有限理性”之后,我们又发现了一个“完全理性”存在的问题。
在“完全理性”假设下,认为参与博弈的每个博弈方都是以“自身利益最大化”为目的进行决策的。但是,在日常生活中除了部分以自身利益为主的人以外,还有一部分博弈方却是以集体利益最大化为决策追求。因此,我们又可以把“有限理性”分为“个体理性”和“集体理性”。
个体理性和集体理性其实是一对不可调和的矛盾对立方,即便有妥协,也只可能是暂时的。比如说当集体利益损害了个体利益之后,个体可以从集体中得到一定的补偿,那么可能会出现个体利益向集体利益短暂地妥协。马云的阿里巴巴集团在创立之初,由于资金的短缺而导致无法给员工发工资,因为发了工资就会让企业失去流动资金而倒闭,这时候马云通过一系列承诺得到了这样一个结果:借员工的钱给员工发工资。这就是个体利益对集体利益的妥协。但是当企业渡过难关之后,阿里巴巴便会马上偿还员工的债务,并且做出相应的奖励。如果一直持续之前的状态,那么员工就会因为利益问题和企业产生不可调和的矛盾。
但是,非合作博弈有一个巨大的陷阱存在,烦琐的公式表达可能会让大多数人都比较头疼,所以这里我们利用美国生物学家哈定1968年提出的“公共地悲剧”来解释。
公共地悲剧讲的是有一个对所有牧民开放的牧场,根据非合作博弈的原则,每个牧民最优的策略选择就是最大限度地增加自己所放牧的牲畜。但是,当这里的每个牧民都做这样的策略选择时,导致的结果就是牧场荒芜,所有人都将无法放牧。在日常生活中大到环境污染、军备竞赛,小到人与人之间的攀比,都是属于这一类型的悲剧。这也正体现了集体理性和个体理性的冲突和矛盾。当人们发现这种冲突导致的结果之后,就会寻找一种解决的办法,那就是合作博弈。但是当这种冲突造成的后果消失之后,非合作博弈就会再次成为人们的首选。
所以,根据上面的两个例子,我们可以得出以下结论:
(1)在博弈过程中,合作只是暂时的和有条件的,不合作才是普遍的和最基本的。
(2)当非合作博弈的得益是无效率或者低效率的时候,合作博弈的形成就是必然的;但是当非合作博弈的得益不再是无效率或者低效率的时候,合作博弈的消失也是必然的。
由于集体理性比个体理性更复杂,更加难以研究,所以寻找合作博弈的一般分析方式就变得异常艰难,这也是造成现在非合作博弈研究成果远远超过合作博弈的原因。
在博弈理性问题的最后,我们谈一个特殊的例子,也就是合作博弈成为第一选择的情况。
有一个博弈模型叫做“诚实选择”,讲的是一位教授带了两个学生,在考试的前一天晚上两人要去参加一个通宵的聚会。参加聚会会影响第二天的考试,但是放弃参加又会觉得可惜。所以,两人合计一番之后决定打电话给教授,说:“我们晚上出来做调查报告,但是在路上车胎爆了,等修好肯定是半夜了,所以可不可以把考试推迟一两天。”在得到教授的肯定答复之后,两人放心地玩了一个通宵。
等到考试那天,两人打开试卷,发现有这样一道题:你们做调查报告的那天晚上,哪个轮胎爆了?坦白回答可以及格,不坦白的话就肯定不及格。两个学生的最优选择肯定是坦白,如果选择不坦白,他们就必须在四个轮胎中做出同样的选择,但是这样的概率并不高。我们在现实中的选择自然也是坦白。
在某些情况之下,当集体利益对个人利益产生束缚的时候,个人理性是一定会服从于集体理性的。我们在研究博弈论的时候把这个特殊的情况加入进去,才能让自己的博弈理论系统更加完整。
最后再谈一下关于博弈能力的问题,这无非就是一个量力而行的建议。博弈会有一定的制衡,但是博弈并不是完全公平的,所以我们在参与一场博弈之前一定要考虑好自己是否有能力参与。
了解了博弈的能力与理性,我们对于博弈论理论的介绍也就暂时告一段落,下面我们会着重介绍博弈理论与实践的结合和使用,并且穿插介绍一些这里没有提及的博弈知识。