博弈中的博弈方和得益
博弈就是若干个人或者团体之间的对抗,我们首先来了解一下什么是博弈当中的博弈方。
博弈方就是指在博弈过程中独立决策并且独立承担博弈结果的个人或者团体。我们可以通过一个例子来具体了解。
再回到“田忌赛马”的故事当中,出场人物有齐王、田忌、孙膑,还有双方的赛马,但真正的博弈方却只有齐王和田忌。孙膑和双方的赛马虽然都参与到了博弈的过程当中,但是孙膑只负责进言,决定赛马顺序的还是田忌,同时赛马结束之后“得王千金”的人也不是孙膑,而是田忌。所以孙膑并不是博弈中的博弈方。而赛马只负责跑,其余的更无从谈起。
或许有人觉得田忌和孙膑是一个团体,这种理解也是错误的。孙膑进言之后,要由田忌决定使不使用这样的计策,所以孙膑并没有决策权,同时也没有承担赛马结果(得王千金)的权利,这就说明孙膑和田忌并不是一个团体,而是两个独立的个体。和赛马一样,两者都是附属于这场博弈的两个博弈方,但自己不算博弈方。
博弈的基本工具是策略,不同博弈方之间的策略会产生极其复杂的变化,这种变化的复杂程度和博弈方的数量是成正比的,所以博弈方的数量就成了博弈结构的关键参数之一。因此,我们通常会把博弈按照博弈方的数量分成“单人博弈”、“双人博弈”和“多人博弈”。博弈分析的难度也在这三者间递增。这里需要特别说明的是,博弈方既可以是单个的人,也可以是一个组织或者团体。
“单人博弈”是最简单的一种博弈,我们通过一个例子来了解。
小明要去买药,因为还有十分钟药店就会关门,所以他必须用最快的速度赶往药店,但是当他走到一个十字路口的时候却忘记了应该向哪个方向拐弯(我们假设是应该向左拐)。此时他并没有带手机,而且街上也没有其他行人。
作为一个博弈问题,它的各方面规定是这样的:(1)有唯一的博弈方,也就是小明。(2)有向前走、向左走、向右走三种策略可供选择。(3)这三个选择中有一个方向会买到药,也就是得益,我们可以记作“1”。而其余两个方向则不会得益,我们可以记作“0”。所以三种策略所对应的得益分别是0、1、0。(4)因为只有一个博弈方,所以不存在行动次序问题。小明必须从三种策略中选出一种来达到自己的目的。
“单人博弈”不存在其他博弈方,我们因此认为它只是一般的优化问题,而不属于博弈范畴。之所以我们要把它也放在博弈论中了解和分析,有以下两个方面的原因:
1.单人博弈是博弈分析的基础,在我们能够很好地认识单人博弈之后,对于双人博弈和多人博弈的理解也就更加容易。而且,我们分析多人博弈的时候通常会把它分成若干个单人博弈来进行。
2.为了完善博弈理论。
“双人博弈”是由两个独立决策并且承担博弈后果的博弈方组成的博弈。比起单人博弈来,其最大的不同就是博弈双方需要考虑对方会选择什么样的策略,这是最常见,也是研究最多的一种博弈模式。大到两个国家的谈判,小到两个人在地铁中抢座位,都属于双人博弈。我们前面提到的田忌赛马和囚徒困境等都属于这个范畴。因为后面会涉及很多双人博弈,所以这里我们就不再赘述,但是其中的一些需要注意的问题我们在这里了解一下。
第一,博弈双方不一定是利益对抗的,因为他们的利益方向很可能会是一致的。例如两个企业的强强联合,甲企业的产品质量好,乙企业的销售渠道广。这时候两个企业合作才是最佳的发展方式,如果对立起来,只能让自己的得益变得更少。
第二,和单人博弈不同,信息量的多少并不能决定得益的多少。单人博弈中因为没有其他博弈方的策略来影响得益,所以可以用信息的多寡来判断。但是在双人,包括多人博弈当中,除了信息量的多少之外,其他博弈方的策略选择对自己的影响也是重要依据之一。在不同博弈方之间策略的相互作用下,得益的计算就变得非常复杂了。
第三,在双人博弈当中,如果每个博弈方都片面地追求最大利益,那么导致的结果可能正好与期望相反。比如说在囚徒困境中,每个罪犯都追求最大利益,也就是无罪释放的话,结果只能是两个人都去坐牢。这给我们日常生活处理问题带来一定的启发,以后的章节中我们会进一步地分析和了解。
“多人博弈”,是有多个博弈方参与到博弈当中,而且每个博弈方都必须意识到其他博弈方的存在,并且意识到其他人的策略对自己策略的反作用。它的基本性质和特征与双人博弈类似,所以我们可以借鉴或者直接采用双人博弈的分析思路和方法。
但是,“多人博弈”的多个博弈方也会带来更复杂的相互作用,比如说博弈方甲、乙、丙,甲和乙的策略都会对丙产生影响,但是同时甲和乙之间也会有相互作用,这就增加了我们分析和理解的难度。“多人博弈”中还会出现一些“破坏者”,就是他们的策略对自己本身并没有任何作用,但是却会对别人产生作用。比如说在选举当中,a、b、c三人同时参加竞选,b和c的票数不相上下。a自觉无望的情况下主动放弃了选举,然后支持b,那么b就会以绝对的优势取得胜利。
这里的a就是一个“破坏者”,他的策略对自己并没有作用,但是却使得本来旗鼓相当的b和c瞬间分出高下。破坏者的存在使得本来就复杂的情况变得更加复杂,因为他们的策略选择很难被分析和判断出来。
与双人博弈还有一点不同,就是多人博弈的得益更加复杂。
这里说到了博弈的得益。所谓博弈的得益,就是指在博弈当中各个博弈方所获得的利益。与投资理财类似,有可能赚钱,也有可能赔钱。所以博弈的得益有正有负,不可能只有获利没有损失。这里的得益可以是金钱或其他福利,也可以是某种资格或者权利。不同的得益会有不同的特征,这就会影响策略的选择,从而影响博弈的结果。博弈的结果又会反过来影响博弈的得益,所以我们在分析的过程中就需要注意更多的情况和细节。
当我们把博弈各方的得益都加起来的时候,就叫做“社会总得益”。大多数博弈当中,策略组合的不同就会造成得益的不同,得益的不同就会造成“社会总得益”的不同,这种情况叫做“变和博弈”。例如“囚徒困境”,两名犯人的选择不同,就会造成最终结果的不同,那么“社会总得益”自然就不会相同。在这种博弈当中,我们可以从总得益的角度来分析其产生的效益,是“有效率”还是“无效率”或者“低效率”的。
但是也有一些情况是例外的,在有些博弈当中,博弈双方的利益始终是对立的,一方得益的情况下另一方必定会损失。例如在两个人的赌博当中,其中一个人赢多少,另一个人就会输多少,所以他们的得益总和始终都是零,这种博弈叫做“零和博弈”。法律诉讼和赌博都是典型的“零和博弈”,在这种博弈之下,双方会一直处于对抗状态,直到得出结果,也就是分出胜负。
还有一种情况是博弈各方的得益总和始终是一个非零的固定数值,这种情况叫做“常和博弈”。例如遗产的分配就是一种常和博弈,各方的得益总和,也就是遗产的总数是不会改变的,不论各个博弈方采取什么样的策略,获得多少的得益。从一定程度上来说,“常和博弈”就是“零和博弈”的拓展,而“零和”就是“常和”中的一个特例。但是二者也有不同的地方,例如“常和博弈”的结果大多是某一方得益多,某一方得益少,所以博弈各方的对立并不会像“零和博弈”那样“至死方休”,很容易在妥协中达到一种平衡。
博弈中的博弈方和得益是博弈过程中的两个重要组成部分,也是博弈理论当中的重要因素。想要了解和掌握博弈论,就必须清楚这些基本概念,我们会通过后面的章节逐步了解博弈中的不同组成部分,以达到轻松掌握博弈论的目的。