设为首页 加入收藏
   
     
   
行政•人事
 
博弈均衡及其对我国行政管理的启示
双击自动滚屏 发布者:admin 时间:2011-3-10 11:06:49 阅读:466次 【字体:


  现代博弈论的主要内容是非合作博弈理论。从非合作博弈的一般研究看,非合作博弈主要有两个研究角度:一是从博弈参与者的行动先后顺序研究,把博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈是指博弈参与者同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指在博弈中,后行动的参与者能够观察到先行动者的具体选择;二是从博弈参与者对信息相互了解的程度研究,把博弈分为完全信息博弈(games of perfect information)和不完全信息博弈(games of in - perfect information)。完全信息博弈是指博弈参与者在知道博弈的结构、规则和博弈双方的偏好、战略及各种战略组合下的利润水平条件下的博弈。不完全信息博弈是指博弈参与者在对博弈结构、规则和博弈双方的偏好与战略等不很了解条件下的博弈。每种博弈都存在博弈均衡问题,于是就有四种博弈均衡,即完全信息静态博弈均衡———纳什均衡(Nash equilibrium);完全信息动态博弈均衡———子博弈完美纳什均衡(subgame perfect Nash equilibrium);不完全信息静态博弈均衡——— 贝叶斯纳什均衡(Bayesian Nash equilibrium);不完全信息动态博弈均衡———完美贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。随着博弈论的不断发展,博弈均衡不仅广泛应用于经济学领域,还扩展到了政治、行政、法律、军事等学科领域。它们在公共行政领域的应用对我国行政管理有诸多启示。
  
  一
  
  纳什均衡概念是纳什于1949 年11 月在他未公开发表的博士学位论文中首先提出的。1950 年纳什正式发表了包括“纳什均衡”的定义以及它在n 人博弈中的存在性证明的,题为《n 人博弈中的均衡点》的经典论文,纳什均衡正式诞生。所谓纳什均衡,是指在n 人博弈中,每个博弈方各自选择自己的最佳策略所构成的一个策略组合。博弈方的策略有“纯策略”(pure strategies)和“混合策略”(mixed strategies)之分。“纯策略指博弈方在自己的策略空间中的一个确定性的选择,而混合策略则是指博弈方以一定的概率分布在自己的策略空间中随机选择。”[ 1 ] 因此,纳什均衡也有“纯策略纳什均衡”和“混合策略纳什均衡”之分。纯策略纳什均衡(如囚徒困境博弈中的纳什均衡)的现实意义,不论是在公共选择领域,还是在其他领域,都引起了众多专家、学者的关注。本文对此不再赘述,而重点探讨混合策略纳什均衡对我国政府开展反腐败斗争的启示。
  在借鉴我国学者易伟明的有关理论研究的基础上[ 2 ],我们来建构一个腐败方与反腐败方的博弈模型。腐败方代表腐败者的利益,反腐败方代表社会的利益。假设腐败的期望总收益为S,实际成本为C1,风险成本为C2,则期望利润L = S - C1 - C2。当C2 = 0 时,即不发生反腐败时,期望利润等于正常利润(用R 表示)。对于腐败方,若不反腐败则没有风险成本,可获得正常利润R,但被反腐败则遭受处罚,其所获利润为L,这里L <R,甚至L <0;对于不反腐败,若未发生腐败行为,则社会取得正效用X(包括物化和虚化的价值,可量化为利润单位),但若腐败则危害社会,产生负效用- Y;对于反腐败,若发生腐败行为,则所用成本与反腐败所产生的社会效益相抵消;对于不腐败,腐败者一无所得,反腐败也有劳无获。根据上述假定,在该博弈中腐败方有腐败与不腐败两种可选策略,反腐败方有反腐败与不反腐败两种可选策略,双方博弈的矩阵如下(见表一):从表一可知,该博弈没有双方都能接受的纳什均衡的纯策略组合,也就是说,由于博弈双方的利益始终都不会一致,在一次性博弈中策略组A、B、C、D 没有哪一个能成为一个确定性的选择。这里只有混合策略纳什均衡。双方策略的采用,都是以对对方行为概率的分析判断为基础的。就如何开展反腐败而言,我们可以先用图解法推导腐败方的腐败的概率分布。图一中横轴为腐败方选择腐败的概率,它分布在0和1之间;纵轴为对应腐败的各个不同概率,反腐败方选择不反腐败策略的期望得益。X 到- Y 连线上的点的纵坐标,就是在腐败方选择该点横坐标表示的腐败概率时,反腐败方选择不反腐败策略的期望得益或预期效用[ = X( 1 - Pb)+( - Y)Pb ( Pb 为腐败方选择腐败的概率) ] 。容易证明,图中X 到- Y 的连线与横轴的交点就是腐败方混合策略中选择腐败的概率。
  假设腐败方选择腐败的概率Pb> ,这时反腐败方不反腐败的期望得益小于零,于是反腐败方的最佳策略是选择反腐败策略。如果腐败方选择腐败的概率Pb <,则反腐败方不反腐败的期望得益大于零,因此,反腐败方的最佳策略是选择不反腐败策略。如果腐败方选择腐败的概率Pb = ,则反腐败方不反腐败的期望效用为零,此时反腐败方的策略可任意为之。
  我们还可以把腐败概率具体化为数据来为我国政府进行反腐败斗争提供技术理性。设腐败的概率为Pb,则对于反腐败方而言,其实施反腐败的预期效用为:
  0 × Pb + 0 ×(1 - Pb)反腐败方实施不反腐败的预期效用为:
  - Y × Pb + X(1 - Pb)则要使反腐败方实施反腐败,必有:
  0 × Pb + 0 ×(1 - Pb)> - Y × Pb + X(1 - Pb)得即当腐败方的腐败概率大于时,反腐败方的最佳策略是反腐败;当腐败方的腐败概率小于时,反腐败方的最佳策略是不反腐败;当腐败方的腐败概率等于时,反腐败方的策略可任意为之。
  
  二
  
  子博弈完美纳什均衡是对纳什均衡的发展和完善,是排除了“不可信威胁或承诺”后的纳什均衡。它不仅要求各博弈方的策略构成整个博弈的纳什均衡,而且要求它们在所有“子博弈”中都构成纳什均衡。这样各博弈方的策略就不可能包含任何不可信的威胁或承诺,因为子博弈完美纳什均衡策略组合,要求各博弈方的策略在博弈的任何局部都符合最优选择的纳什均衡原则,排除了任何不可信行为存在的可能性。
  在我国,各级政府为了发展经济,制定了一些优惠政策,吸引外资,但这些政策的承诺在外商看来,一般不认为是可信的,因为这些政策在执行中可能会发生改变。我们用图二中的扩展形博弈来阐释不可信性的消极作用[3],进而说明我国政府的一些政策的可变性的负面效应。在这个博弈中存在几个纳什均衡或纳什均衡路径。博弈方甲在“第一阶段选择b”,博弈方乙的策略是“如果第二阶段有行为的机会将采用d”,是一个纳什均衡。实际上这个纳什均衡的路径是博弈方甲在第一阶段的选择直接结束博弈。但如果博弈方甲的策略是“第一阶段a,当博弈方乙第二阶段选择d 时,第三阶段选择e”,博弈方乙的策略是“第二阶段c”,这也是一个纳什均衡,因为给定对方的策略,博弈方甲和乙的策略确实都是对自己最有利的选择。
  很明显,在上述两个纳什均衡中,后一个选择对双方来说都好于前一个,因为前一个选择双方得益为(1,0),后一个选择双方得益为(2,2)。那么,如果博弈双方的确都有足够理性能力,他们博弈的结果是否一定会是后者而不是前者呢?结论是否定的。下这样的结论的关键根据是后一个纳什均衡的博弈方甲的策略中,“第三阶段选择e”的“威胁”是“不可信的”。因为根据理性经济人假设,博弈方甲不可能采取任何损人不利己的行为。
  由于采用e 不符合博弈方甲自身的利益,所以博弈进行到第三阶段时博弈方甲不可能采用e。由于博弈方乙了解博弈方甲的行为准则,因此当他有机会选择的时候(即博弈方甲在第一阶段选择了a),他不可能理睬博弈方甲的不可信的威胁,肯定会选择d。反过来博弈方甲也知道博弈方乙的心思,因此决不会在第一阶段冒险选择a。所以后一个纳什均衡不是真正稳定的,不可能是博弈的结果。
  上述分析表明,在有相机选择(contingent play)的完全信息动态博弈中,由于不可信威胁或承诺的存在,两个理性的博弈方之间的博弈结果,不是对双方都有利的效率较高的纳什均衡,更可能是对双方都不有利的、效率较差的纳什均衡。这种情形也会出现在我国政府与外商的博弈中,一些政策的不可信性会使他们的博弈处于效率较差的纳什均衡,从而影响了外商投资的积极性,不利于我国经济的发展。有鉴于此,要大力吸引外资,加速经济发展,就必须使我国政府与外商的博弈处于子博弈完美纳什均衡之中。而要做到这一点,最重要的就是把优惠政策变成法律,因为法律的可信度高于政策的可信度。为此,我国必须加强法治环境建设,积极推进依法行政。要适应经济全球化和加入WTO 的新形势,要顺应经济发展的客观要求,抓紧制定与完善有关法律;制定依法行政规范,加快行政程序立法,强化依法行政监督。
  
  三
  
  1967 - 1968 年,Harsanyi 成功地将贝叶斯理性的方法引进了非合作博弈论,把对不完全信息博弈的纳什均衡分析,建立在主观概率的贝叶斯理论的基础上,发展出分析不完全信息博弈的“Harsanyi 转换”方法和“贝叶斯纳什均衡”概念,使得不完全信息静态博弈的分析有了一般解法。贝叶斯纳什均衡是完全信息静态博弈纳什均衡在不完全信息静态博弈上的自然扩展,即“在给定自己的类型和别人的类型的概率分布下如何确定参与人的期望效用最大化的问题”。[ 4 ] 它的重要应用领域是一次性招标和拍卖。招标是在相同的条件下选择出价最低的;拍卖是在相同的条件下选择出价最高的。这时不同的投标者或者竞买者之间就是一场博弈。此时的贝叶斯价与成本价之间的差取决于参与人的多少。参与人越多,政府就有可能获得一个最低的招标价和最高的拍卖价。举一个我国政府在工程招标方面的例子。[ 5 ]政府要将某一项工程以招标的形式交给某个企业建设。假定政府经过调查研究和周密测算后,预计工程成本为50 万元,据此设金额为52 万元的标底价。各个企业在2 万元租金的引导下,展开了一场招投标博弈(见表二):在表二中,只例举了四个企业,或许还有很多企业参与博弈。为了投标成功,它们在了解工程成本和政府标底信息及其他相关信息后,会计算自己的事前概率,从而确定投标价。
  在全部可能发生的事件总数一定的情况下,所要测定的偶然事件的数目越多,概率就越大;在所要测定的偶然事件的数目一定的情况下,全部可能发生的事件总数越多,概率就越小。在企业间不完全信息下的投标博弈中,为了增大概率,各企业所能做的就是使偶然事件发生的数目增多,这要求各企业尽可能压低投标价,因为一般来说,在参与人数一定的情况下,投标价越低,中标的偶然事件的数目就越多,概率也就越大,比如表二中企业D中标的概率最大。尤其是参与投标者越多,即全部可能发生的事件总数越多,各企业的投标价会越低,因为参与投标的人数与概率成反比例关系,在偶然事件的数目一定的情况下,参与人数越多,概率就越小,于是在参与投标者很多的情形下,各个企业只有通过最大限度地压价来增加其偶然事件的数目,进而增大概率以达到增大成功率的目的。其实,这正是政府所需要的。因此,在我国政府的有些行为中,如果能选择竞争,就尽量不选择行政手段。如国有中小企业的出售、国有土地的出售以及政府大型工程的施工建设等等,都应该选择拍卖或招标方式,而且还应该确定一个最低的招标和拍卖的参与人数。因为只有更多的参与人加入,才能保证贝叶斯价,这样就能适应我国政府的需要。
  
  四
  
  完美贝叶斯纳什均衡是完全信息动态博弈———子博弈完美纳什均衡和不完全信息博弈———贝叶斯均衡的结合,是在给定有关其他参与人的类型的主观事前概率后,参与人的策略在每一个信息集开始的“后续博弈”
  上构成的贝叶斯均衡。通俗地说,就是当面临不确定性时,参与人从对不确定性事物所假定的事前概率出发,进行分析、判断和决策,并且在决策的动态过程中,会根据获得的新信息,利用条件概率的贝叶斯公式或法则,对事前概率进行贝叶斯更新,作出事后概率判断并进行决策选择。可以说,完美贝叶斯纳什均衡的关键是参与人要根据所观察到的他人的行为来修正自己有关后者类型的主观事前概率,并由此来选择自己的行动(实现均衡)。在我国粮食储备过程中,企业与政府各自所出储备粮食的价格可用完美贝叶斯纳什均衡来分析。
  政府为了调节市场供求,需要掌握一定数量的粮食,但政府机构不可能直接经营或保管粮食,而是通过与企业博弈的方式让国有粮食企业储备。企业储备粮食需要支付费用,这个费用定在什么水平比较合理,双方要通过博弈来确定。双方经过大量的调查后认为每公斤粮食需要5 分钱的储备费用。政府依据掌握的信息作出事前概率判断,同意出5 分钱的储备费给企业。企业若同意以5 分钱的价格接受储备的话,则双方的博弈达成纳什均衡。但在不完全信息动态博弈中,当政府只能进行粮食储备而不能放弃,且政府所选择的国有粮食企业不从事粮食储备而从事其他经济活动同样能获得收入时,政府与企业进行一对一的谈判需要作出更大的让步.
  从图三中我们看到,政府与企业谈判的下限在5 分钱这个基点上,而上限则取决于企业与政府的博弈。由于企业了解到政府在粮食储备中处于非储备不可的地位,谈判的余地小,因而企业所出价格会高于5 分钱。对此,政府会利用条件概率的贝叶斯法则,根据博弈过程中获得的新信息更新自己的先验概率,作出后验概率判断,并把储备粮食的价格定在5 分钱以上的某个点上,以实现政府与企业间的博弈均衡。
  由是观之,完美贝叶斯纳什均衡中的贝叶斯理性或“Savage - 贝叶斯理性”对我国政府决策具有重大的现实意义。贝叶斯理性是结合了对主观概率的贝叶斯更新的savage 决策理性。一般决策理论的savage 模型中的理性研究的,主要是在具有某种不确定性环境中的一次性选择,决策者进行决策所利用的判断是一次性的,即使事后发现判断,即事前主观概率的偏差,也不可能再采取相应的措施。而贝叶斯决策理论研究的问题经常是动态的过程,是长期多阶段的或重复的过程。这个过程不仅仅只有不确定性的一次性选择,往往在一次选择以后还有另外的第二次、第三次,甚至更多次的选择或行为,而且在不同的选择和行为之间,决策者还以获得新的信息,并据此调整自己的判断和策略。可见,贝叶斯决策理性更能体现博弈方的“理性”,对解决现实生活中的许多问题更具适用性,因而应当成为我国政府行政决策的方法论和理性架构。

 

上一篇|下一篇

 相关评论

暂无评论

 发表评论
 昵称:
 评论内容:
 验证码:
  
打印本页 || 关闭窗口
 
 

咨询电话: 13891856539  欢迎投稿:gmlwfbzx@163.com  gmlwfb@163.com
617765117  243223901(发表)  741156950(论文写作指导)63777606     13891856539   (同微信)

All rights reserved 版权所有 光明论文发表中心 公司地址:西安市碑林区南大街169号-6
CopyRight ©  2006-2009  All Rights Reserved.


  制作维护:中联世纪  网站管理
访问 人次
国家信息产业部ICP备案:陕ICP备17019044号-1 网监备案号:XA12993