博弈中的能力和理性_三天读懂博弈论-QQ阅读男生历史网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

博弈中的能力和理性

了解了很多的博弈理论之后，我们突然发现实际情况似乎并不像书中所说的那样，反而更加不可捉摸。这是为什么呢？因为我们在博弈分析的过程中选择性地忽略了一个问题：那就是博弈方的能力和理性。

能力和理性会决定博弈方的行为逻辑，也就是其参与博弈的目的是什么，还有其达成目的的能力怎么样，这直接决定了博弈方策略的选择和博弈的结果。所以，只有了解了博弈方的能力和理性，才能准确地做出判断和预测。比如说美国加入朝鲜核问题谈判的目的是什么，它又会对其目的投入多大的力量。准确把握这些信息之后，我国才有可能在谈判中取得主动权，然后获取得益。

我们之前列举的大多数例子都遵循了一个学术研究的惯例，那就是“理性经济人假设”。所以，每个例子中的博弈方都可以做出最准确的判断，而且从来不会犯错误。但是在日常生活中绝对理性的人是不存在的，所以拥有绝对完美的分析能力和从来不犯错误的“完全理性”的假设肯定是不符合常识的。

在博弈理论的研究当中，各个博弈方之间的相互影响和依赖性是非常强的，这时候只要有一个博弈方的能力和理性出现问题，甚至说只要有某个博弈方对其他博弈方的能力和理性产生怀疑，那么整个博弈分析的基础就会被破坏，我们以“理性经济人假设”为前提进行的分析和得出的结论也会完全失效。因为某些原因，我们在理论分析过程中暂时性地忽略了“有限理性”的存在。

但是现实的博弈过程中，错误的判断、遗忘、赌气，等等原因造成的决策偏差和过失是时常存在的，我们不能指望每个博弈方都能做出最完美的决策来迎合自己的理论。如果我们仅仅分析“完全理性”之下的博弈，就会局限博弈论的适用范围，甚至会造成错误。所以，我们在借助“完全理性”假设了解了博弈分析方法之后，就需要将“有限理性”代入其中，让博弈分析的结论更加真实和准确。

我们再回到那个买鞋的故事当中，按照“完全理性”的假设，我们的奶奶肯定要用自己认为最合适的价格来买那双鞋子，也就是300元。但是在“有限理性”的情况下，售货员如果坚持不肯降价，那么奶奶很可能会为了给我们买到满意的鞋子而选择妥协，那么她付出的代价可能是318元，也可能是320元。

我们在研究“有限理性”博弈时，需要注意博弈方理性的多层次和多样性。面对理性层次较高，而且学习能力较强的博弈方，我们采用的分析机制叫做“最优反应动态”，也就是采取最佳的策略选择来得到最符合自己利益的博弈结果。其结果很接近“完全理性”的博弈结果。

自2006年开始发生在全国各地的“彭宇案”，就可以当做一个简单的“最优反应动态”。当老人倒地之后，“彭宇们”的选择有两种：一是扶老人起来，我们可以标记为得益a；二是害怕被老人反讹，所以选择明哲保身，我们标记为得益b。当最初还没有发生过老人倒地反讹事件的时候，出于个人素养等原因，很多人都会选择得益a。但是当“彭宇案”闻名全国并且相继发生之后，使得选择得益a的风险变得极大。所以根据最优选择，也就是完全理性中的“自身利益最大化”原则，“彭宇们”的选择就开始集中在了得益b，即便有所偏移，也会被拉回既定轨道。例如2011年的扬州小伙因为怕惹事儿，所以扶起倒地老人之后又松手。从社会道德素养的角度来看，这个结果似乎有些令人沮丧，但是从“最优反应动态”的角度分析来说，这样的结果却又合情合理。

当我们面对理性层次较低，而且学习能力较差的博弈方时，我们采取的分析机制是“复制动态过程”。也就是当博弈方遇到类似的问题时，他不会去进行最优选择思考，而是模仿与之情况类似的处理方式。

在了解了“有限理性”之后，我们又发现了一个“完全理性”存在的问题。

在“完全理性”假设下，认为参与博弈的每个博弈方都是以“自身利益最大化”为目的进行决策的。但是，在日常生活中除了部分以自身利益为主的人以外，还有一部分博弈方却是以集体利益最大化为决策追求。因此，我们又可以把“有限理性”分为“个体理性”和“集体理性”。

个体理性和集体理性其实是一对不可调和的矛盾对立方，即便有妥协，也只可能是暂时的。比如说当集体利益损害了个体利益之后，个体可以从集体中得到一定的补偿，那么可能会出现个体利益向集体利益短暂地妥协。马云的阿里巴巴集团在创立之初，由于资金的短缺而导致无法给员工发工资，因为发了工资就会让企业失去流动资金而倒闭，这时候马云通过一系列承诺得到了这样一个结果：借员工的钱给员工发工资。这就是个体利益对集体利益的妥协。但是当企业渡过难关之后，阿里巴巴便会马上偿还员工的债务，并且做出相应的奖励。如果一直持续之前的状态，那么员工就会因为利益问题和企业产生不可调和的矛盾。

但是，非合作博弈有一个巨大的陷阱存在，烦琐的公式表达可能会让大多数人都比较头疼，所以这里我们利用美国生物学家哈定1968年提出的“公共地悲剧”来解释。

公共地悲剧讲的是有一个对所有牧民开放的牧场，根据非合作博弈的原则，每个牧民最优的策略选择就是最大限度地增加自己所放牧的牲畜。但是，当这里的每个牧民都做这样的策略选择时，导致的结果就是牧场荒芜，所有人都将无法放牧。在日常生活中大到环境污染、军备竞赛，小到人与人之间的攀比，都是属于这一类型的悲剧。这也正体现了集体理性和个体理性的冲突和矛盾。当人们发现这种冲突导致的结果之后，就会寻找一种解决的办法，那就是合作博弈。但是当这种冲突造成的后果消失之后，非合作博弈就会再次成为人们的首选。

所以，根据上面的两个例子，我们可以得出以下结论：

（1）在博弈过程中，合作只是暂时的和有条件的，不合作才是普遍的和最基本的。

（2）当非合作博弈的得益是无效率或者低效率的时候，合作博弈的形成就是必然的；但是当非合作博弈的得益不再是无效率或者低效率的时候，合作博弈的消失也是必然的。

由于集体理性比个体理性更复杂，更加难以研究，所以寻找合作博弈的一般分析方式就变得异常艰难，这也是造成现在非合作博弈研究成果远远超过合作博弈的原因。

在博弈理性问题的最后，我们谈一个特殊的例子，也就是合作博弈成为第一选择的情况。

有一个博弈模型叫做“诚实选择”，讲的是一位教授带了两个学生，在考试的前一天晚上两人要去参加一个通宵的聚会。参加聚会会影响第二天的考试，但是放弃参加又会觉得可惜。所以，两人合计一番之后决定打电话给教授，说：“我们晚上出来做调查报告，但是在路上车胎爆了，等修好肯定是半夜了，所以可不可以把考试推迟一两天。”在得到教授的肯定答复之后，两人放心地玩了一个通宵。

等到考试那天，两人打开试卷，发现有这样一道题：你们做调查报告的那天晚上，哪个轮胎爆了？坦白回答可以及格，不坦白的话就肯定不及格。两个学生的最优选择肯定是坦白，如果选择不坦白，他们就必须在四个轮胎中做出同样的选择，但是这样的概率并不高。我们在现实中的选择自然也是坦白。

在某些情况之下，当集体利益对个人利益产生束缚的时候，个人理性是一定会服从于集体理性的。我们在研究博弈论的时候把这个特殊的情况加入进去，才能让自己的博弈理论系统更加完整。

最后再谈一下关于博弈能力的问题，这无非就是一个量力而行的建议。博弈会有一定的制衡，但是博弈并不是完全公平的，所以我们在参与一场博弈之前一定要考虑好自己是否有能力参与。

了解了博弈的能力与理性，我们对于博弈论理论的介绍也就暂时告一段落，下面我们会着重介绍博弈理论与实践的结合和使用，并且穿插介绍一些这里没有提及的博弈知识。