第二节博弈论与新制度经济学_新制度经济学(第二版)-QQ阅读男生武侠网

上QQ阅读APP看书，第一时间看更新

第二节博弈论与新制度经济学

本节主要探讨新制度经济学与博弈论的内在联系，博弈论的出现，丰富了制度分析的工具，也使得新制度经济学得到了进一步发展，博弈论与新制度经济学的结合将大大深化对制度起源及制度演变过程机制的分析。

一、新制度经济学与博弈论的关系

（一）博弈论与新古典经济学

自博弈论被引入经济学以来，经济学的许多领域都发生了巨大变化，诸多按新古典经济学思想写作的教材纷纷被作者利用博弈理论来重新演绎。可以说，博弈论冲击着新古典经济学的思维方式，也正引导人们彻底地重新认识经济世界和人们的经济行为。

1．个体主义与整体主义

新古典经济学主要以价格制度作为研究对象，它有两个很强的假设，一个是市场是竞争的，市场参与者都是在价格给定的情况下做出决策，另一个是市场参与人的信息都是对称的。在这两个假设下，人们接受的都是相同信息，个人作的行动决策对其他人并没有影响，因为反映人们行动决策的价格参数并没有改变，人们只是在既定价格参数和收入下最大化自己的效用，即第i人效用为Ui（Xi）, Xi为第i人在给定价格信息情况下的行动决策，因此，理性经济人的选择与行为既无需考虑自己选择对别人选择的影响，也无需考虑别人选择对自己选择的影响。显然这里所描述的世界与现实世界有很大差距。

反观博弈论，它强调经济活动过程的利益主体的行为所产生的相互作用和相互影响，主要研究主体之间行动决策的相互影响，以及在相互影响下个人如何做出决策。从而使经济分析更能反映社会经济系统的本质，这无疑是在研究方法上对新古典经济学的一次突破。在博弈论中，人们需要更多信息，在预期其他参与人行动决策的情况下，做出自己的行动决策，以参与者追求效用最大化为例，这里第i人效用为Ui（X1 X2…Xn），它不仅取决于自己的行动决策，而且还取决于其他博弈参与者的行动决策。如果强调理性个体之间的相互作用和影响，那就不可避免地会出现群体之中理性个体如何相互协调的问题。在新古典经济学中，价格机制可以使个体理性与集体理性必然地达成一致，不会出现囚徒困境，而在强调了个体间相互作用和影响的博弈论中，个体理性不一定会导致集体理性，即博弈均衡可以使所有博弈参与者都不满意，囚徒困境的问题会常常出现。

囚徒困境是博弈论中的一个经典案例。两个囚徒A和B被警察发现并抓了起来，但由于没有直接证据，两人分别被关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，囚犯有两个选择：坦白或者保持沉默。这两个囚犯都知道，如果他俩都能保持沉默的话，就只会被判1个月，但如果两人都坦白的话，两人会被判3年，如果他们中的一个人背叛，那么他就可以被无罪释放，而他的同伙就会被判5年。

那么，这两个囚犯是选择互相合作还是互相背叛呢？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：只有1个月的刑期。但他们不得不仔细考虑对方可能采取什么选择。对囚犯A而言，如对方选择沉默，那我最好选择坦白，如对方选择坦白，那我也应坦白，这样，不论对方决策是什么，囚犯A都会选择坦白。囚犯B也会这么推理，则最后结果是都选择了坦白，各判3年，而不是都沉默这个最好的决策。显然两个囚犯各自追求最大利益的行动并没有带来最好的结果。

2．均衡的多重性和唯一性

在非合作博弈中，解的一般形式是纳什均衡，并且有可能存在多重纳什均衡，特别是在多阶段动态博弈中，多重纳什均衡更为普遍。这些纳什均衡往往有着很不相同的性质，有的纳什均衡是没有效率的或者是低效率的，而且有的纳什均衡根本不能用帕累托最优原理来比较。但是，博弈过程本身，却并不能够自然筛选出高效率的纳什均衡，而把低效率的纳什均衡排除。这种博弈过程中的“多重均衡状态”意味着现实社会的高度不稳定性和不确定性。它们的存在是与社会分工以及各项知识分立状态的社会现实相联系的。因此，在博弈形成的多个可能的均衡状态中，人们究竟会选择哪一个均衡状态取决于人们的知识结构等多种因素，包括社会习俗、心理、行为习惯等诸多非理性因素的影响。这样，基于一般均衡的必然性和唯一性的新古典经济学的经济社会观就受到了博弈均衡的不确定性和不稳定性的挑战。

由此可见，不论是新制度经济学，还是博弈论，都更重视现实世界的实际状态，对新古典经济学中理想化的假设状态进行了修正，如果说新古典经济学是说明“尘埃落定后，世界是怎么样的”，那么新制度经济学和博弈论则更像是解释“尘埃是如何落定的”，只不过前者开创了新的研究领域，而后者则修正了研究的方法。

（二）博弈论与新制度经济学

博弈论与新制度经济学的结合将大大深化对制度起源及制度演变过程机制的分析。一方面博弈论方法对制度分析是很有用的，尤其是最近逐渐使用的演进博弈和重复博弈的分析方法。然而，把一个经济过程比做一个博弈的思想，可以追溯到亚当·斯密的时代，他认为“在人类社会这个大棋盘中，每一个个体都有他自己运动的规律，这与立法机关给他们强加设定的规则完全不一样”。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第20页。

通常博弈论在讨论重复博弈情形下社会惯例的出现时，就试图用同标准的理性最大化概念来解释社会规则。更明显的是，如果不服从的成本使个人在任何场合的最大化选择都是奉行现存的社会或法律规范，他服从该规范就是完全理性的（阿克劳夫1976）。 [英]马尔科姆·卢瑟福：《经济学中的制度——老制度主义和新制度主义》，陈健波、郁仲莉译，中国社会科学出版社1999年版，第65页。克罗斯基（Patrick Croskery）遵循了制度的理性选择理论，将惯例解释为重复协调博弈的均衡，将规范解释为重复合作博弈的均衡。 [美]戴维·L．韦默主编：《制度设计》，上海财经大学出版社2004年版，第15页。

当然，博弈论分析作为系统研究制度的理论工具尚不完备，从该框架出发考察制度的相互依存性可能会得出制度安排的多重性、次优性和帕累托不可比性，就是说，即使面对相对相同的技术知识和被相同的市场所联结，制度安排也会因国家而异，因此，为理解特定制度安排在某特定国家演化生成的原因，单单囿于博弈论框架本身是不够的。 [日]青木昌彦：《比较制度分析》，周黎安译，上海远东出版社2001版，第28页。

另一方面，博弈论中的许多思想本身可以作为新制度经济学的重要组成部分。这主要体现在以下几个方面：

1．博弈论视野下的三种制度观

一些经济学家为了更好地分析制度变迁以及解决一些悬而未决的问题，而从博弈论的角度定义制度。其实，以博弈论来分析经济社会现象早在亚当·斯密时代就已经出现，在亚当·斯密看来，博弈是个体参与者从各自动机出发的相互作用的一种状态，可见，博弈的观点可谓是无处不在。根据青木昌彦对制度观的分类，通过将经济过程类比于博弈过程，不同的经济学家分别将制度看做博弈的参与人、博弈规则和博弈过程中参与人的均衡策略。同上，第5页。我们可以看到，在博弈论视野下主要有三种制度观。

（1）将制度明确等同于博弈的特定参与人，诸如“行业协会、技术协会、大学、法庭、政府机构、司法等”（Nelson,1994）。这一定义符合《简明牛津英文字典》中“制度为一种形成了的组织”（an established organization）的定义。

（2）将制度视为博弈的规则。支持这一观点的有诺思。在《制度、制度变迁与经济绩效》一书中，他认为：“制度是社会的游戏规则（rules of game），更规范的说，它们是为决定人们的相互关系而人为设计的一些制约” [美]道格拉斯·诺思：《制度、制度变迁与经济绩效》，刘守英译，上海三联书店1994年版，第3页。以及“用经济学的行话来说，制度确定和限制了人们的选择集合”。同上，第4页。为了分析为什么其他国家不能采用在经济绩效好的国家中沿用的制度这个问题，诺思将制度分为非正式制度（包括道德的约束、禁忌、习惯、传统和行为准则）和正式制度（包括宪法、法令、产权）。他认为，正因为一些非正式制度的存在，制度设计有时是缺乏效率的。赫尔维茨（Hurwicz,1993、1996）对制度的博弈规则论作了更为技术性的定义，他认为，博弈规则可以由参与者能够选择的决策行动以及参与者决策的每个行动组合（profile）所对应的后果函数来描述，他将这一设定称为“机制”（mecha-nism）或“博弈形式”（game form）。 [日]青木昌彦：《比较制度分析》，周黎安译，上海远东出版社2001版，第7页。

诺思也提出了第二种观点：制度应该被当做博弈的规则，而不是把制度当做博弈中的参与人。一般而言，博弈规则可分为正式规则和非正式规则。根据定义，在参与人进行博弈的过程中，经济博弈的正式规则是不能被参与人所构建（改变）的，而是在博弈之前就被确定下来。如果我们关注制度的起源，那么马上就会产生一个问题：谁来决定经济规则？诺思对博弈规则和博弈参与人（组织及其政治企业家）做了严格区分，即参与人作为制度变迁的行为主体，是规则制定者。根据诺思的观点，现存的博弈规则确定了参与人如何（组织）交易和创新的激励机制，并最终在相对价格变化的影响下，对新规则产生有效的需求。这些新规则在政治市场中由各方经过讨价还价来决定，而政治市场是根据政治规则确定。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第20页。

（3）将制度视为博弈的均衡。这一观点的最早倡导者是肖特（Schotter）和格雷夫（Greif）。下面我们看看肖特对制度的理解。

肖特借鉴了哲学家刘易斯（Lewis,1969）对社会惯例（convention）的定义，他在《社会制度的经济理论》一书中对社会制度作了如下定义：

在一个人口群体P中，当其中的成员在反复出现的情境T下，作为行动人常规性的R只有在下列条件下而成为人口P中的共同知识时，它才成为一种制度：每个人都遵守R；每个人都预计他人遵守R；并且如果T是一个协调问题，在这种情况下，一致遵守R是一个协调均衡，于是在其他人都遵守R时，每个人都愿意遵守R；或者如果任何一个人偏离了R，人们知道其他人当中的一些或者全部也将会偏离，在反复出现的博弈T中采用偏离的策略的得益对于所有行为人来说都要比R相对应的得益低。 [美]安德鲁·肖特：《社会制度的经济理论》，陆铭、陈钊译，上海财经大学出版社2003年版，第17页。

从这个定义中可以看到，肖特正是用博弈的语言来定义他所研究的制度，制度是各个博弈参与者互动行为的均衡结果，而任何偏离这种均衡结果都是不利的，因为在肖特对制度定义的第四点中，他明确定义了这种均衡是符合“帕累托条件”的，这也意味着制度的存在实际上是对博弈参与者的一种行动的规则约束。

格雷夫也从博弈均衡角度给制度下了一个简明定义，他认为：“在博弈论框架中，两个相互联系的制度要素是（关于别人行为的）预期和组织……组织是非技术因素决定的约束，它们通过引入新的参与人（即该组织本身），改变参与人所得的信息，或者改变某些行动的报酬来影响行为。” [日]青木昌彦：《比较制度分析》，周黎安译，上海远东出版社2001年版，第10页。这里的组织指的是作为博弈参与者集合的一部分，受到博弈均衡衍生的约束的制约。显然，在这里，格雷夫也将制度是博弈参与者的观点纳入了他对制度的定义之中。

青木昌彦在《比较制度分析》一书中，将制度定义为：“制度是关于博弈如何进行的共有信念的一个自我维系系统。制度的本质是对均衡博弈路径显著和固定特征的一种浓缩性表征，该表征被相关域几乎所有参与人所感知，认为是与他们策略相关的。这样，制度就以一种自我实施的方式制约着参与人的策略互动，并反过来又被他们在连续变化的环境下的实际决策不断再生产出来”。同上，第28页。

在这三种制度观下，将制度视为博弈均衡的观点得到了许多经济学家的认可，尤其是从事比较制度分析和制度变迁理论研究的经济学家，很大原因是因为这种定义对于解释制度内生性和解决现实问题很有帮助。同时，将制度视为博弈均衡的观点更能表明制度的实质，因为传统制度观点以及将制度视为博弈参与人、博弈规则的观点都是将制度当成一个静止的状态，而博弈均衡的观点则是从动态角度定义制度，从而可以把制度系统与生物系统等其他生态系统相比较，因此，也就可以借鉴自然科学的研究方法来研究社会经济系统的演化。

2．不同制度观下的经济学家关于制度起源的分析的思路是不一样的

当考虑一种制度的起源时，我们已经看到，持博弈规则论（rule of the game）观点的学者们倾向于设计的观点，即规则不论是由立法者、政治企业家还是机制设计的经济学家等制定的，都是有意识地设计的结果。在持博弈均衡论（equilibrium of the game）的学者中间，刚开始的时候在这个问题上并未达成明显一致。那些采纳演进博弈论分析方法的专家们，很明显认同把制度起源当成是“自发的秩序”或者是具有自组织性质的组织体系。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第21页。在此我们重点分析一下博弈均衡论的观点。

博弈均衡制度观可以从内生的角度分析制度起源和实施问题。如果人们接受传统的外生博弈规则论，直接的问题是制度究竟从何而来、如何产生和实施。人们不得不在规则发挥作用的经济域之外寻找制度起源，如在政治域，或者作为一种理论可能性，在理性的参与人从诸种可能的规则中集体选择一种规则的元博弈的域中寻求制度起源。同注①，第16页。

格雷夫（1998）建议在运用均衡观点分析制度时，采用如下分析程序处理历史信息：①以历史和比较知识为基础。首先区分出哪些技术和制度因素可以看做“外生的”，哪些制度因素需要当做“内生变量”，即需要解释的变量。②建立对应特定背景的博弈论模型，其中那些被界定为外生变量的因素定义了博弈的外生规则，然后解出所有的均衡解。③考察是否存在一些均衡解有助于解释内生性制度的性质。④研究哪些“历史”因素促成了对特定均衡的选择，由此确定历史对制度形成的作用。 [日]青木昌彦：《比较制度分析》，上海远东出版社2001年版，第18页。

制度就是均衡行动选择规则的本质特征，而这些规则能被该领域参与人所普遍认可，并与他们的行动选择相关。制度是重复博弈的内生产物，但同时制度又规制着该领域中参与人的战略互动。对某一个参与人而言，忽略或者偏离制度是无利可图的。虽然制度是一种均衡现象，但不应把它们看做一次博弈下完美的演绎的结果，也不应视为一种根本不需要归纳推理的完全静态平衡。制度代表了在整个时期实际上重复参与博弈的行为人的战略互动过程的一种稳定状态。因此，一种制度是“由有限理性和具有反思能力的个体的社会长期经验的产物”。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第24页。

一些持博弈均衡的制度观点的经济学家认为，根据一些具体情况，我们或者借助于演进博弈的分析方法，或者借助于重复博弈的分析方法，并且使用相应的不同均衡概念（与完美均衡相对应的是一些演进均衡的概念）。这两种方法有着很强的假设条件，事实上，它们的假设处于两个极端：一个在分析参与人的动机和选择时，认可个体参与人的理性，一个正好相反。这大概反映了博弈论目前的状态，在构建个体有限理性模型中，博弈论还未取得令人满意的结果。有限理性是指经济行为人的目的是理性的，但仅仅是在有限的程度是如此的。因此，我们可以认为，这两种分析方法在根本上不是相互对立的，而是互补的。不论选择什么样的均衡概念，我们使用的分析工具全都是纳什均衡概念。也就是说，一种制度处于这样一种社会建构的状态，只要其他参与人不偏离这种状态，任何参与人也没有激励这样做。同上，第21页。

新古典制度经济学同样没能解决制度起源问题。肖特尝试用博弈论来解释制度的起源，认为制度是个人或组织间博弈的结果。菲尔德米罗斯基和霍奇森都对制度起源的这种博弈论解释提出了批评。他们认为，个人或组织的博弈行为本身就需要一个预先设立的规则，因此制度起源的博弈论解释仍然是假定了一个预先存在的规则体系，从而不能对这个规则本身的起源，或制度的起源做出解释。张林：《谁是制度经济学的正统—论制度主义中的凡勃仑—艾尔斯传统》，载《政治经济学评论》2002卷第1辑，第167页。

二、博弈论在制度分析中的应用

（一）重复博弈论

在传统博弈论中，通常参与者都假定在信息收集、信息形成、后果推断和决策制定方面都是超理性的。不同于一次性博弈的是，重复博弈中的参与人不只关注局部利益、短期利益。更多地考虑整个博弈过程的总体利益和长期利益，因此在重复博弈中，参与者就有可能采取更为合作的方式，从而避免囚徒困境的出现，实现比一次均衡更有效率的均衡。这种博弈模型主要用于分析需要界定明确的实施机制的制度，包括诸如规范、合同和治理结构之类的制度。与一次博弈相比，重复博弈运用的均衡概念更为精细，比如用子博弈精炼纳什均衡来分析制度的变迁过程。子博弈精炼纳什均衡是指只有当某一战略组合在每一个子博弈（包括原博弈）上都构成一个纳什均衡，这一战略组合才是子博弈精炼纳什均衡。

最早将博弈论引入制度变迁分析的是肖特，他在1981年出版的《社会制度的经济理论》一书中按照诺齐克（Nozick）的国家创生理论假设了一个洛克式的自然状态（state of nature），用博弈论模型再现了制度演化的情景，从实证角度表明了博弈参与者的现象型行为具有一种制度化倾向，以此验证了哈耶克的自发社会秩序理论。在他的分析中，制度是一个博弈的均衡解，制度变迁是经济行为人通过不同的战略最大化其收益的结果，而在重复博弈中，博弈参与人为避免无效率的博弈行为出现，博弈就会演化为某种有效率的规则或制度。应用重复博弈论研究制度变迁的最具代表性的人物当属进行比较制度分析的格雷夫，他将博弈论引入了经济史的研究尤其是制度变迁的研究，他认为，制度根源于积极的文化信仰，是长期历史自然演化的产物，这种分析方法在学术传承上综合了德国历史学派的传统和现代博弈论的理论成果，在博弈论分析框架下运用历史经验的归纳法分析方法研究制度选择与变迁。

艾德纳·乌尔曼—马加利（Edna Ullman-Magalit）认为当协调问题、囚徒困境问题、保持不平等问题中的任何一个发生时，社会制度将有可能得以产生。肖特还补充了另外一种可能，那就是合作博弈问题，他认为国家的产生就是一个合作问题的解，即合作博弈的均衡解，并成功解决了国家是怎样从自然状态演化出来的问题。 [美]安德鲁·肖特：《社会制度的经济理论》，陆铭、陈钊译，上海财经大学出版社2003年版，第33页。以下，我们通过交通博弈的例子来考察传统博弈论的制度分析方法及理论。

假定有两辆汽车正在一条路上以相同速度相向而行，他们几乎同时到达一个十字路口，而碰巧这个十字路口交通灯坏了，也没有交通警察。此时，司机甲想要左转，而司机乙想要直行，显然，如果这时司机甲左转，而司机乙直行，两辆汽车就会相撞，假定他们因两车相撞而都要去修理汽车及去医院，这时他们的损失都为4，即收益向量为（-4, -4），前者表示甲的收益，后者表示乙的收益，他们的收益都为-4。如果司机甲左转，而司机乙等待司机甲，让他先过，那么虽然司机乙有损失，但也小于因两车相撞而遭受的损失，假定此时，双方所得收益向量为（5, -2）。如果司机甲等待，让司机乙先过，而司机乙也心领神会的先过了，那么，双方收益向量为（-2,5）。但是，如果司机甲及司机乙都等待着对方先过，那么双方都会因等待对方而受到一定损失，比如他们都有一笔重要的生意，客户正等着，如果去晚了的话，这笔生意就做不成，假定他们的损失为（-1, -1）。此时，司机甲和司机乙应该怎么做呢？如果按照新古典主义的看法，应当建立一个市场，出售在十字路口处优先行驶的权利，价格制度会解决一切问题，一名类似于瓦尔拉斯均衡中的拍卖人从两名司机那里接受出价，谁的出价高，就将这个优先行驶的权利卖给他。现实社会中会有这样一个拍卖人存在吗？显然，由于这种拍卖过程不可能有高效率，因为等待司机出价，以及司机的讨价还价都浪费了很多时间以及成本。如果此时，存在一种规则或者制度对谁先谁后作了详细规定，包括违反这一规定的惩罚，那问题就比较好解决了，司机甲和司机乙只需遵循这种规定就行了。下面，我们就来看看这种规则或制度是怎么形成的。

图2.1

图2.1中，存在两个纳什均衡，（等待，直行）和（左转，等待），而且不存在一个纳什均衡帕累托优于另一个纳什均衡，从收益矩阵中可以看出，这是一个协调问题，协调问题是指在任何均衡点，不仅在给定其他参与者行为条件下没有参与者想改变行为，而且没有参与者希望其他参与者改变行为。假定社会中存在两种群体：一是诸如司机甲在十字路口左转的群体A，二是诸如司机乙在十字路口直行的群体B。在这个博弈中，群体A希望群体B可以等待让他们先左转，而群体B则希望群体A可以等待让他们先直行，此时还没出现相应的交通法规。假定群体A正好住在十字路口左侧，群体B也正好住在十字路口前面，这样可以将他们在十字路口的博弈看成是一个重复博弈。如果每当群体A中的个人在十字路口碰见群体B中的个人时，他们总是要做出让谁先通过的决策来进行协调，那么这种协调是高成本和低效率的，这样，博弈参与者与其在博弈出现时尝试去解决它，还不如期望社会中的群体A和群体B建立起某种惯例的均衡模式，每当这种博弈出现时，博弈参与者都遵循这个惯例。这样，一种惯例如果被遵循的话，就演变为了一个社会制度，也就可以避免出现无效率的非均衡收益。但这里出现了两个均衡，就是说有可能形成两种惯例，即群体A等待让群体B先直行以及群体B等待让群体A先左转。到底会形成哪一种惯例取决于历史、政治及一些随机因素，但是一旦这种惯例建立起来，就没有人愿意违背。

在交通博弈中，由于人们在博弈中面临着协调问题，在反复博弈中，一种制度将演化而成以决定在该博弈中，谁先通过十字路口，谁后通过十字路口，但是我们可以发现，在存在协调问题的博弈中，一种博弈均衡并不比另一种博弈均衡好，那么，建立起来的制度虽然解决了博弈中协调问题，但它也是一种不平等的制度，可见，制度的出现在一定程度上也就维持了一种不平等的状态。在交通博弈中，群体A偏好“先左转”这样的制度，而群体B则偏好“先直行”的制度，不论最后演化而成的制度是怎样的，都肯定会对其中的一个群体不利，可以看出，艾德纳·乌尔曼—马加利所提出的保持不平等问题也可以被认为是一种协调问题。

（二）演进博弈论

在传统博弈论框架下，重复博弈能够很好地解释制度的演进，然而，这种制度分析方法仍然遭到人们广泛的质疑，其质疑的根本点就在于传统博弈论对博弈参与者完全理性的假设。这种理想化假设使得经济学家逐渐将眼光转向演进博弈论的研究领域。演进博弈论摒弃了传统博弈论对博弈参与者完全理性的假设，认为参与者的理性是非常有限的，他们的行动被惰性和简单模仿所驱使，受制于他人行动的基本经验的信念，而且收敛于效率结果，还依赖于无法解释的随机事件。 [日]青木昌彦：《比较制度分析》，周黎安译，上海远东出版社2001年版，第197页

进入20世纪90年代以来，博弈论制度分析在杨、萨格登、青木昌彦、奥野正宽等人的努力下取得了许多研究成果，而演进博弈论的制度分析理论也在不断成熟，其基本理论可分为以下四个部分：

1．制度内生性理论

这种均衡导向的内生博弈规则方法对制度的分析前景是光明的，这是由于：①制度内生化的处理；②对多种制度形式的认可；③给出了分析制度相互依赖性的工具；④对制度多种作用的洞察；⑤揭示制度演进变迁的件质；以及⑥对与制度演进路径不相适应的一些有害政策建议的提防。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第30页。

制度是怎么产生的呢？制度的元制度又是从何而来呢？萨格登、杨等人运用演进稳定均衡策略（ESS）概念以及内生博弈规则论证了制度的内生性，在一定程度上解决了新制度经济学曾经遇到的制度循环论证问题。持演进博弈论观点的人认为，现实世界中，存在着当一个博弈群体采用一种策略，而该群体之外的其他人所采用的策略都不能干扰该群体所采用的策略，这种状态就是演进稳定均衡状态。这种演进稳定均衡中的任何一方都不愿偏离这种均衡状态，因为偏离均衡的一方所得的收益总是少于不偏离均衡所得的收益。另一方面，这种个别参与人选择偏离演进稳定均衡的战略也不会对其他人产生采取偏离该均衡策略的动机，即使他们知道其他少数参与人会改变选择，他们也不会改变自己的战略选择，因为无论其他个别人选择什么，对他们而言，在演进稳态均衡时的选择是最有利的。在长期中，通过模仿和对过去形成的预期，这种均衡就会逐渐成为一种习俗或惯例，而一旦这种习俗或惯例在一个群体中演化而成，每个社会成员都会自觉地遵守它。如果遵守这种习俗或者惯例的人越来越多，时间维持的足够长，那么它就会越稳定，这就是所谓的“吸同状态”（absorbing state）抑或“局部遵同效应”（local conformity effect）。因此，制度的演进过程可以看成是惯例到成文法的过程，可是由于博弈过程中确实存在着多重均衡解的可能，模型虽然可以内生地决定均衡解，但是却无法决定社会到底处于哪一个均衡解中。

2．制度化关联理论

为什么同样一种经济制度在不同国家会有不同效率呢？为什么在西方成功的市场机制用于俄罗斯的改革却并不成功？出现这种问题很大程度上是因为制度存在关联性与互补性，旧制度的遗留或者已经存在的非正式的制度影响了制度的变迁，导致了最后博弈均衡处于帕累托无效率的状态。为了分析这一问题，青木昌彦将制度空间划分为：公共资源、交易（经济交换）、组织、组织场、政治、社会交换六个域，域是由博弈参与者集合以及他们在随后各个时期所面临的技术上可行的行动集组成。对不同域之间的嵌入和捆绑进行讨论，他认为在博弈中，人们在不同域之间各自作出决策，结果产生的制度是人们单独在不同域中分别做决策所不能导致的，这种关联可以创造一定外部性，使其他参与人从中获得利益，从而促进这种制度的延续，与此相对应的另一种情况是，人们因决策空间或者认知程度有限，或者其他原因，无法在不同域之间协调其策略决策，但决策在参数上受到其他域所流行的决策规则或者制度的影响，结果是制度之间的跨域的相互依存关系即制度互补性有可能出现。 [日]青木昌彦：《比较制度分析》，上海远东出版社2001年版，第211页。关联在于协调博弈参与者在不同域之间的策略，这样就会产生在单独域分别作决策而得不到结果，同时由于制度化关联的存在，组织信息体制中的内在缺陷也可以克服，制度环境的治理合约也会更加有效率。而制度的互补性则保证了制度的有效性，因为，一种制度的演进，需要其他相关制度配合，在其演化过程中，非正式制度的作用不可小觑，与此同时，这种制度的演进也影响着组织信息体制和制度化关联方式，并进而影响到市场交易的效率。可见，制度的关联性和互补性导致了路径依赖，因为目前已经存在的制度是经过长期博弈筛选后而得到的制度，由于关联性和互补性，这个制度不仅影响着其他域中的制度，也被其他域中的制度所影响，如果要保证制度移植的成功，那么所有域中的制度都要根据与将要移植的制度的关联性和互补性作出相应变换，显然，其间困难重重。

3．制度多样性理论

长期以来，我们常常为制度的多样性感到困惑，为什么具有相似生态和技术条件的韩国和日本，没有演化出相同的社会结构和社会习俗呢？演化博弈论者认为制度是博弈的均衡状态，而在博弈中难免不会出现多重均衡，因此制度的多样性取决于均衡的多重性，哪一种均衡最终会实现依赖于历史、政治和其他社会因素。在演进博弈论中，博弈参与者的有限理性扮演着一个极为重要的角色，也许是因为他们有不断试错的勇气，也许是因为他们掌握的是不完全信息，所以，社会中总会存在一些博弈参与者采取非惯例行动的概率，即使社会中存在着某种惯例或者制度，而且这种惯例也进入了锁定状态（lock in），这种惯例也会不断演进，而演进的未来状态也是极为不确定的，它可能会依然保存下来，也可能会演化成另一种惯例或者在未来的社会中消失。因此，演进博弈论学者认为，即使两个社会以相同的初始状态演进，即它们有相同习俗，在经过一段足够长的时间后，这两个社会也有可能处于不同的惯例之中，这就是所谓的“整体多元化效应”（global diversity effect）。正是由于“整体多元化效应”的存在，具有相似生态和技术条件的韩国和日本，却有着不同的社会结构和社会习俗，同说汉语的中国内地、香港地区、台湾地区和新加坡，在社会交往和市场交易中也存在着不同惯例。

4．制度变迁理论

青木昌彦将制度变迁划分为两个阶段：第一阶段为相对短暂而失序的制度危机阶段，急剧的环境变化和内部危机导致了超过临界规模的社会群体的认知危机，各种相对现有制度进行的变异性试验纷纷涌现；第二阶段为进化稳定阶段，各种变异试验在进化压力的作用下展开竞争，接受进化过程的考验，一些决策也因此在演化过程中成为主导策略，制度进化调整的过程便逐渐稳定下来。同上，第246页。

青木昌彦、奥野正宽利用演化博弈论研究了经济制度的变迁，在他们的模型中，假定博弈参与人是有限理性的，原因有三点：

（1）惯性（inertia）。它是指在演化博弈中，由于策略变更会伴随成本增加，因此，如果有人试图改变策略，也会因为变更策略成本的存在，而对改变策略犹豫再三，这样，即使有人改变策略，也仅仅是一小部分人而已，社会中的策略分布只会渐渐被调整。

（2）近视眼（myopia）。它是指当人们改变自己战略的时候，总是将现存的策略分布作为已知的条件，以此来选择自己最佳的战略，他们忽视了当人们改变在其策略的同时，其他人也有可能改变策略的情况，这种情况下，社会的策略分布就会发生变化。

（3）试错法实验（trial and error or experiment）。它是指社会中具有革新意识的人也许会不仅仅拘泥于此时的最佳策略，而去尝试其他策略，这样也许会出现一些人采取与现在不相适应的新策略，这样历次打乱既存策略分布的因子称为试错法实验。 [日]青木昌彦、奥野正宽：《经济体制的比较制度分析》，魏加宁译，中国发展出版社1999年版，第264页。

下面我们引入以下一个简单的演进博弈模型来说明制度的变迁。

在社会中，假定人们有两种策略可以选择：A和B，社会的收益矩阵为用概略加权平均后的收益，并且社会中的人均为有限理性，他们在多次博弈过程中，不是采取相异的行动，而是在每次博弈中均采取同一行动，这样，他们初始的平均收益矩阵便如图2.2所示。此时，该博弈是一个囚徒困境，博弈双方都选择B，同时（B, B）策略向量也是一个演化稳定策略（ESS），在社会的历史初期，采取B行动是一种习惯抑或一种惯例。如果在该社会里发生了环境上的变化，平均收益矩阵发生了变化，如图2.3所示，此时存在着两个纳什均衡：（A, A）和（B, B）。由于社会中受历史初期条件约束的人们是处在采取策略B的状态之中，即使收益上发生了变化，存在帕累托更优的策略组合，如果其他博弈参与者采取策略B被视为给定的话，最佳反应也只能是B，这就是制度演化中的路径依赖性。

图2.2

图2.3

如何才能摆脱这种低效率的均衡状态呢，青木昌彦和奥野正宽认为，此时，至少存在三种方法：

（1）社会中的创意和实验。在图2.3中，存在两个演化稳定均衡（ESS），一般演化过程无法将劣势的均衡状态调整到具有优势的均衡状态，但是通过引入比较系统的突然变异可以达到这一目的，即由于博弈参与者都存在着一个改变策略的概率，当社会中博弈参与人选择某一策略的人数达到一定比例时，所选择的博弈均衡状态就将会发生改变。

图2.4

（2）政府的政策性介入。如果政府可以颁布法律对选择策略B的人进行惩罚，社会的平均收益矩阵就发生了改变，如图2.4。选择策略B的参与人的收益都因为惩罚而减少了3，这时帕累托更优的策略向量（A, A）就会成为支配策略向量。

（3）加强与其他具有不同习惯社会的交流。通过与不同文化习俗的社会的交流，同样可以改变社会的平均收益矩阵，使得（A, A）成为支配策略向量。 [日]青木昌彦、奥野正宽：《经济体制的比较制度分析》，魏加宁译，中国发展出版社1999年版，第270—276页

因此，制度变迁主要是因为外部冲击和博弈结构的内部均衡结果影响的积累，正是这种积累的效应导致了原有制度的危机，所以，如果现有制度遭遇到了外部制度环境的冲击，那么现有制度就会有出现变革和创新的可能，值得注意的是，制度演进过程既是一个渐进的过程，又是一个间断地被一些转折点打断的过程，这就是所谓的“刻点均衡效应”（punctuated equilibrium effect），即偶尔被短时期迅速出现的制度所打破的长时期的静态均衡状态，或者被制度的突变所打断的长期状态。因此，可以认为，制度的变迁在一定程度上综合了路径依赖与制度创新的因素，在渐进中存在突变，是“刻点均衡”和进化选择的结果。

当考虑一种制度的起源时，我们已经看到，持博弈规则论（rule of the game）观点的学者们倾向于设计的观点，即规则不论是由立法者、政治企业家还是机制设计的经济学家等制定的，都是有意识地设计的结果。在持博弈均衡论（equilibrium of the game）的学者中间，刚开始的时候在这个问题上并未达成明显的一致。那些采纳演进博弈论分析方法的专家们，很明显认同把制度起源当成是“自发的秩序”或者是具有自组织性质的组织体系。 [法]梅纳尔：《制度、契约与组织——从新制度经济学角度的透视》，刘刚等译，经济科学出版社2003年版，第21页。

（三）博弈学习理论

与一般演进博弈论相比，博弈学习理论中参与者虽然是有限理性，但是他们具有学习的能力，是一种适应性理性。博弈参与者即使面临有限的信息，他们依然可以使用简单的预测模型进行决策，总体而言，他们也是追求效用最大化，只不过在追求过程中受到环境约束和自身能力方面的限制。事实上，当演化博弈论从生物学领域转向经济学领域过程中，经济学家并不满足于仅仅对博弈参与者采用有限理性的假设，人类显然不能和大自然中的生物相类比，人类理应具有更高的理性，他们不仅可以模仿成功的策略，也可以通过学习，使得自己对博弈结构更加了解，也给予了人们改变博弈策略的动机，制度分析中的演进经济学毫无疑问已经采纳了部分博弈学习的相关理论，这点从肖特和扬在其著作中的观点就可看出来。肖特在其《社会制度的经济理论》一书中写道：“学习是导致制度出现的机制，个体学习约束了自己，也因此依赖于别人的自我约束。” [美]安德鲁·肖特：《社会制度的经济理论》，陆铭、陈钊译，上海财经大学出版社2003年版，第26页。杨也曾形象地指出这一点：“他们仍环顾四周，他们收集信息，在多数时间里，他们在所掌握的信息基础上相当理智的行动。简言之，很明显看出来他们是人。” [美]H．培顿·杨：《个人策略与社会结构——制度的演化理论》，王勇译，上海三联书店2004版，第9页。

一般而言，在博弈学习理论中，学习主要有三种类型：

（1）路径学习（routine learning）。它又被称为心理刺激反应模型（psychological stim-ulus response model）或强化模型（reinforcement model），即参与人根据他们最近关于成功或失败的经验来调整它们选择策略概率的过程，它并不要求博弈参与者考虑其他人的选择和支付，只需关注自己的选择和支付，并坚信如果一个行动策略在过去是有用的，那么在将来它也会是有用的。

（2）模仿（imitation）。模仿是指博弈参与者对获得成功的参与者的模仿，它与路径学习的区别在于其他人的成功会影响参与者选择策略的概率。

（3）信念学习（belief learning）。这一类型的学习比较复杂，它是指博弈参与者能够利用关于其他博弈参与者过去的选择与支付情况的信息来改变当前博弈阶段他们对其他博弈参与者的选择的信念。 [法]克里斯丁·蒙特、丹尼尔·塞拉：《博弈论与经济学》，张琦译，经济管理出版社2005年版，第258页。

在制度分析中，博弈学习理论依然延续着演进博弈论的思想，认为制度应被看成是一个动态的演进过程，只不过这里的博弈参与者虽然不至于完全理性，但也因学习的过程而更为精于计算，此时的博弈参与者通过不断学习来调整预期，当参与者的预期与观察相符合时，理性的参与人便不会改变自己的行为策略，一种固定的行为模型就会出现，而一旦这种符合观察的预期与固定的行为模式出现时，一种制度也就产生了，它是具有有限理性的人类在社会发展进程中，依据各自专有知识长期策略互动的结果。博弈学习理论以参与者的有限理性、但具有学习能力为行为人假设突出了制度分析中学习的重要性。简言之，制度就是博弈参与者利用后天学习到的和以前积累的知识，预测下一次博弈中其他博弈参与者的行为，并在此预期的基础上根据自己的目标和可能的行动集来确定自己的策略，由此形成的博弈均衡就演绎成了制度。显然，这一过程是漫长的不断反馈和调整的过程，博弈参与者学习认识现存的制度约束，但他并不是完全地被动接受，而是有一个与外部制度环境相互认知的过程，通过不断加深对制度环境的认识并提高学习的能力，以解决博弈协调问题和囚徒困境。可以说，制度的形成与变迁是在博弈参与者各自不同知识的基础上进行的博弈的均衡结果。

本周热推：

引进西方经济学四十年（1978—2018）杨格与国民政府战时财政（1937—1945）中国新材料产业发展十年（2011-2020）近代华商股票市场制度与实践：1872—1937 日本商业四百年2：从黑暗帝国到战后崛起