4．选择“占优策略”与排除“被占优策略”_博弈思维：逻辑使你决策致胜-QQ阅读男生历史网

上QQ阅读APP看书，第一时间看更新

4．选择“占优策略”与排除“被占优策略”

通过上面的分析，我们看到，我们在选取策略时，如果一个策略在任何情况下均比另外一个策略差，任何一个理性的人都不会采取这个较差的策略。每个人均能够理解这个道理。在博弈论中，这个相比较而言较差的策略被称为“被占优的策略”（“被占优的策略”有时也叫作“劣策略”），在策略选取时，排除使用“被占优的策略”是理性人的做法。

与被占优策略相对应的是占优策略。占优策略是，在任何情况下人们采取该策略获得的利益总会比采取另外一个策略获得的利益要大。

如果在某个博弈中行动者只有两个备选策略，并且其中一个策略是占优策略，另外一个是被占优策略。那么行动者应当采取该占优策略。革命导师马克思、恩格斯在《共产党宣言》中号召无产阶级起来革命，他们豪迈地宣称：“让统治阶级在共产主义革命面前发抖吧！无产者在这个革命中失去的只是锁链，他们获得的将是整个世界！”革命导师告诉无产者：“革命”行动与“不革命”行动相比，“革命”是“占优的”行动策略；“革命”将使无产者失去锁链并得到整个世界，而如果“不革命”，无产者仍然是一无所有的奴隶！

“占优策略”与“被占优策略”是相比较而言的。对一个博弈参与人来说，策略S1和S2是其策略空间中的两个策略，不论博弈中其他参与人采取何种策略，该策略参与人采取策略S1所得的利益大于采取策略S2所带来的利益，那么，与S2相比较，S1是该博弈参与人的“占优策略”；与S1相比较，S2是“被占优策略”。

我们来看一个例子（表2-1）：

表2-1 剔除被占优的策略

在上面的博弈中，甲的策略空间中有三个策略（U, M, D），乙的策略空间中有两个策略（L, R）。对于甲来说，M与D相比，M是“占优策略”, D是“被占优的策略”。因为无论乙采取L还是R，甲采取M的收益均大于采取D的收益。因此，在这个博弈中，对于甲，他必定不会采取D策略。

甲的U、M相比不存在占优与被占优的关系，乙的L、R策略相比，同样不存在占优和被占优的关系。

对于有些博弈，我们可以反复运用剔除被占优的策略求得纳什均衡所谓纳什均衡是指这样一个策略组合状态：对于每个博弈参与人，其他博弈参与人策略不变的情况下，该博弈参与人的收益是最大的，此时，每个博弈参与人均不愿意主动改变策略。任何一个博弈至少存在一个纳什均衡，但这个均衡有可能是混合策略均衡。这就是著名的纳什均衡存在定理。。对于表2-1的博弈，我们无法通过剔除被占优的策略求得纳什均衡。如果一个博弈的所有参与人都只有两个可能的策略，并且每个人的两个可能策略之间均存在占优与被占优的关系，此时，每个博弈参与人均会剔除被占优的策略，从而得到惟一的策略组合对，这个策略组合对就是纳什均衡解——博弈结果。囚徒困境就是这样的例子（表2-2）。

表2-2 囚徒困境

两个共同作案偷窃的小偷被带进警察局单独关押，如果一方与警方合作，招认并供出自己与对方以前所做违法之事，而对方不招认，招认方将不受重刑，无罪释放，对方会被判重刑10年；如果双方都与警方合作共同招认，各被判刑5年；而如果双方均不承认有罪，因警察找不到其他证明他们以前违法的证据，则只能对他们的小偷行为进行惩戒，各判刑3个月。这两个小偷如何做出选择？

在这个囚徒困境中，囚徒的最后结果——是当场释放还是被判刑（10年、5年、3个月），不仅取决于该囚徒的决定，而且取决于另外的小偷的决定。

在这个博弈中，无论对方选择“招认”还是“不招认”，对于任何一个囚徒来说，选择“招认”是占优的，选择“不招认”是劣策略。因此，对于囚徒困境来说，“招认”与“不招认”相比较，“招认”是“占优策略”; “不招认”是“被占优的策略”。

在这个例子中，每个囚徒均剔除“占优策略”，博弈结果为双方均选择“招认”策略。这个结果为纳什均衡解——一个稳定的结果。

多家航空公司间的竞争是囚徒困境博弈。许多报道说，航空公司实施机票打折，使航空公司亏本运营。某些管理部门制定规则，规定禁止机票打折，然而机票打折屡禁不止。因为旅客在选择乘飞机以及乘哪家航空公司的飞机时，价格是主要因素。各个航空公司为了使自己的公司能够多揽客源，办法只有一个，降低机票价格！对于航空公司来说，其他航空公司“不降价”，我选择“降价”是“占优策略”；如果其他航空公司“降价”，我选择“降价”也是“占优策略”——并且应该降更多的价格。无论其他航空公司的机票“降价”还是“不降价”，我选择“降价”是“占优策略”, “不降价”是“被占优策略”——应当被排除的。当每个航空公司均这样做的时候，机票价格便大大降低了。航空公司之间进入了囚徒困境博弈。

当航空公司处于这样的状态中，理性的选择是“降价”！

当一个博弈存在惟一的纳什均衡时，这个均衡是可以预期的。即：一旦双方处于这样一个博弈时，理性的博弈参与人均会选择实现该均衡的策略。比如上面的囚徒博弈中，双方均选择“招认”策略，这个结果是任何理性的囚徒能够预期的。

我们来看另外一个例子。居民均匀地住在一条街上，他们要到商店里买东西。现在有两家商店，我们假定是A、B，这两家商店的老板要做出在街的何处开设商店的决策。假定商店所销售的商品的价格是一样的、质量也是一样的，居民购买商品时所考虑的惟一的因素就是居住地与商店的距离。现在，要问的是商店老板要将商店开在何处才能吸引较多的顾客？

如果这条街上只有一家商店，该商店开设在何处都是合适的，因为没有竞争对手，整个街上的居民均要到这个惟一的商店购买所需商品，而无其他选择。但当这个街道上存在两家商店时，这两家商店之间便存在竞争关系。任何一家商店均会这样想：顾客的总和是相等的，如果有较多的顾客去另外一家商店，来我这里的顾客就少了。这个博弈可以看成是常和博弈。

在这个竞争性的博弈中，商店老板要决定选择一个合适的选址以吸引更多的顾客。他们是如何决策的？

对任何一家商店来说，它最优的位置应当是：比对方更靠近这条街的中心。因为采取将商店安排到比另外一家商店更靠近街道的中心，更多的顾客到该商店的距离比到另外一家商店的距离近，这样才能争取到更多的顾客。

在图2-1中，我们假定A的位置给定，它在街道的左侧，此时，B的最好位置是，在A的右边一点点，即靠近中心的一侧，这样，B右边的街上的所有顾客以及它与A之间的靠近B的顾客将选择B商店来购买商品。因为，A右侧的居民多，这些居民离B商店的距离要近于A商店，他们自然选择B商店购买东西。

图2-1

如果A的位置在街道的右侧，B的最优位置是在A的左侧，并且紧靠近A。因此，对于商店B的老板来说，其设定商店位置时，所采取的策略应当是，选择紧靠A并在A的靠中心的一边。同样，对于A商店的老板来说，当B的位置给定时，其最优策略应当是选择紧靠B，并在B的靠中心的一侧。

该博弈何时达到均衡？当A、B均在街道的中心时，一个均衡态便出现了——这就是纳什均衡，见图2-2。在这样一个均衡位置上，任何一家商店均无法通过改变自己的位置来吸引更多的居民。此时如果其他商店不改变位置的话，它当然也不会主动改变位置。此时A、B的“收益”是：顾客数量各为街道上的一半居民。

图2-2

如果A、B商店的老板均是理性人，并且，“双方均是理性人”是公共知识，那么，中心点是均衡状态也是他们之间的公共知识。商店老板将不约而同地将商店选择在中心位置，每个商店各拥有街道上一半的顾客。当有3个商店时，均衡不是如人们想像的那样在街道的中间。此时，没有纯策略纳什均衡。

这个例子同样可以说明美国的两党（民主党和共和党）长期的博弈。美国两党均想赢得更多选民的支持，从而获得选举（如总统选举）的胜利。对每个政党来说，最好的策略是，在对方的政党的选举政策给定的情况下，提出的选举政策不要过激，紧靠竞争对手的策略，将所有可能的选民均争取过来。经过多年的重复博弈，民主党、共和党两党的政策相当接近，以至于人们难以以政策来区分两党。

本周热推：

摆渡在有-无之间的哲学：第一哲学问题研究逻辑的视野逻辑学若干问题研究本体诠释学（一）（成中英文集·第一卷）“全想脑力提升书系”思维导图