博弈基本要素汇总十篇

时间:2023-08-23 16:56:51

博弈基本要素

博弈基本要素篇(1)

中图分类号:F224.32 文献标志码:A 文章编号:1673-291X(2010)26-0277-02

一、博弈论的定义

博弈论是一门研究相互影响着的博弈参与者进行策略选择时的行为规律的科学。它研究:(1)存在若干博弈的参与者;(2)每一参与者有一系列可选择的策略;(3)博弈结果取决于参与者策略的组合;(4)参与者了解博弈局势预设的信息等。博弈包含四个要素:博弈的参与者、策略、可评价结果与信息结构。博弈论是研究博弈弈的参与者的理,博弈的参与者策略选择时的相互影响以及他们之间的利益冲突与吻合关系。博弈论研究利益冲突与吻合的,将特定经济问题纳入博弈四要素中以转化为待研究的博弈局势,然后加以分析解决。(1)将特定经济问题转化为博弈问题。(2)运用博弈理论方法得出博弈问题的解。(3)将博弈问题的结论转化回经济语言,同时与第一步中所省略的信息一起为原始经济问题提供解释。

二、标准博弈论的现状和缺陷

标准博弈论包括完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。尽管标准博弈论的发展就是不断放松一系列严格假定的过程,但它仍然存在一个重大的缺陷――严格的理性人假定。假定了现实行为主体能力以外的复杂思维过程,假设所有博弈参与者都符合三个条件:(1)策略思考,即在对其他参与者将如何行动的基础上形成信念;(2)最优化,即对于给定信念选择最优反应;(3)均衡,即参与者调整信念和最优反应至相互达成一致。但是,现实的博弈参与者并不都是经济理性的,并且,由于博弈参与者是相互影响的,即使只有极少数的博弈参与者违背经济理性,其他理性参与者的行为也会随之改变,理想化均衡也同样无法实现。因此,经济现实并不能满足标准博弈论对博弈参与者的假定条件。为了延伸博弈论对现实活动的解释,应该是有限理性的前提下重构标准博弈论。如果说,标准博弈论提供了有关经济理性的行为人如何行动的理论,那么,行为博弈论就试图探讨行为人如何在理想的经济理性和现实的有限理性之间进行折衷,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。

标准博弈论在“经济理性”假设下分析博弈参与者如何在追求各自最优目标的同时实现均衡。但由于现实行为人是“有限理性”的,标准博弈论对实践的理解和指导受到限制。为了延伸博弈论对现实活动的解释,行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

三、几种基本博弈的介绍及分析

1.投资博弈

投资博弈中有两位互不相识的参与人A和B。A得到一笔钱并被告知可以完全保留也可以将其中的任意比例投资于B,他给出的任何金额都会以大于1的某一倍数付给B,然后由B决定是否回报和回报多少给A。标准博弈论的均是:理性的B应该最大化他自身的利益,保留获得的所有支付,而理性 的A会估计到B的策略,因此,不会投资于B,结果双方都得不到超额支付。

标准博弈论认为理性自利的人不会信任别人,但它忽略了人类是自利的,是高度社会化的动物,因此,标准博弈论的结论是:博弈中理性人的个人理导致机体的非理性,而行为博弈论的结论是:博弈中参与人的个人非理性但而导致机体的理性。

2.可置信威胁的议价博弈

它是讨价还价博弈中最简单的一种,即如果双方的交易成功就会有一定的利益,A出价,要求对方 要么接受、要么拒绝,如果B接受,那么双方就按照A提出的分配比例瓜分利润,如果B拒绝,那么双方之间不会有交易行为。按照标准博弈论,这个博弈具有无穷多个纳什均衡。

但不少时候对应者宁愿牺牲自身的利益去惩罚那些未公平对待他们的出价者 ,这种报复性回报在社会领域表现得很明显,为了伤害对方不惜牺牲自己。人类当被欺侮时,反应机制会使人愤怒,因为愤怒在进化过程中是作为一种生存优势保留下来的。不同的文化观使人具有不同的公平标准,参与人有时并不在意分配比例是否公平,即使出价者只支付很少的金额对应者也愿意接受。议价博弈中的拒绝并不意味着参与人没有意识到标准博弈论中的最优策略,他们明白使自己经济利益最大化的策略是什么,只是因为情感或社会的因素使他们不再是传统经济学意义上最大化经济利益的理性人,在某些情况下,他们宁愿牺牲自己的经济利益以达到其他方面的满意。

3.协调博弈

在协调博弈中,参与人都希望自己的行动和其他参与人的行动取得某种一致。但是社会习俗、相互的交流、博弈呈现的不同方式、参与人曾有的类似经历以及自己的幸运数字都会影响均衡的形成。

4. 竞猜博弈

竞猜博弈指的是:让每个参与人去猜谁会是选美比赛中的最后得主,最后得主由所有参与人的平均看法决定,这时每个参与人既不是选择自己认为最漂亮的也不是选出所有人平均认为最漂亮的,而是要去思考所有参与人对平均看法的平均预期。因此,行为博弈论提出利用有限重复推理来理解参与人的初次选择,用认知的深化来解释参与人选择的变化。

5.总结分析

大量的实验研究为行为博弈论的提出提供了坚实的数据基础,行为博弈论并不是要否定标准博弈论,他们两者也并不矛盾。标准博弈论体现一种完美的策略分析过程,整个推理严谨周密,是由于经济理性人的假定使其缺乏可操作性,因为人类的目标不仅仅是经济利益最大化,而行为博弈论正是从这一点出发,将博弈论拉回到现实的框架中来,使其更真实,更人性化和社会化 。

四、行为博弈的模型研究

行为博弈的模型的构建遵循精确性、一般性和实验规则的原则。它研究的基础数据都是经实验取得的。博弈实验对博弈预测的敏感因素进行了严格的控制,包括博弈参与者知道什么、什么时候行动、各自的支付是多少等等。博弈实验的关键在于通过实验控制来区别哪种理论更加有效,然后再使用该理论来进行一般事件的研究。行为博弈研究就是要在标准均衡概念失效的情况下,以实验控制为主要手段,以实验数据为基本依据,通过不断地试错与修正建立能够对博弈参与者的未来行为进行准确预测的理论。

行为博弈模型主要包括三方面内容:第一,在一次性博弈中,有限理性条件下,构建博弈参与者的思考模型,发展一个有限理性的指标系来衡量博弈参与者的思考步骤,并且使用一个参数来说明博弈参与者的异质性。与最优反应相联系,该指标系可以对任何一个一次性博弈中的行动进行了唯一的统计预测。第二,在思考模型的基础上,构造一个学习运算法则来估计博弈参与者的行为均衡路径。这一运算法则既包括了虚拟的博弈和强化模型,也具有很强的经验预测能力。因此,EWA可以作为经验性工具去寻求表现为初始函数形式的行为静止点。第三,提出如何将有限理性指标系和学习运算法则应用于分析重复博弈中的博弈参与者行为,为利用行为博弈论分析价格竞争、专利竞赛等现实经济活动奠定基础。

五、总结

标准博弈论对实践的理解和指导是有限制的。为了延伸博弈论对现实活动的解释,作为研究不同条件下行为人如何进行互动决策的经济理论,博弈论应该尽可能准确地预言和解释经济现实活动;当经济现实和理论模型不一致时,研究者的工作方向就是改造模型,提高其实证效用。这一思潮引致了行为博弈论的出现。行为博弈论将实验经济学与标准博弈论相融合,在博弈实验的基础上,考察和解释标准理论推断和实验结果之间的差异,引入行为因素改进标准博弈的基本假定,重构博弈分析模型,以求达到准确解读有限理性的行为人在现实约束中如何行动的目的。

行为博弈研究的起点就是进行博弈实验,将实验结果与标准博弈论的预测进行比较,并用不同方法分析差异存在的原因,为进一步构建正式模型提供现实依据。需要说明的是,行为博弈论并没有否定纳什均衡的意义,而是作为标准博弈论的延续,在有限理性的前提下深化了对博弈均衡的讨论,以更加贴近现实的研究视角对具有某种内生变动性的博弈均衡的存在方式和形成过程进行了新的思索。行为博弈论最重要的观点就是在大量实验数据的基础上提出利用有限重复推理来理解参与者的初次选择,利用认知和学习的深化来解释参与者选择的变化,而行为博弈正式模型则试图为上述观点提供完美的数理表达,提高理论的精确性和一般性。

参考文献:

[1] 阿克罗夫,乔治 A.宏观行为经济学和宏观经济行为[J].当代经济科学,2OO2,(5).

博弈基本要素篇(2)

二、企业财务多主体博弈分析

(一)企业财务多主体的特征分析 企业财务系统主要包括6大子系统,即筹资子系统、投资子系统、采购子系统、生产子系统、销售子系统、利润子系统,它们完成了资金的筹集、投放、使用、收回及分配的财务循环。企业在周而复始的财务循环中,无时无刻不在与股东、供应商、客户、债权人和政府等利益相关者之间发生各种财务关系。笔者界定的企业财务主体正是指企业财务及其与企业财务密切相关的利益相关者。其中企业为系统的核心,它与其他财务主体通过物质、信息以及资金的流动相互作用、相互影响,构成了各种利益点交织而成的复杂巨系统。

根据复杂系统的基本原理,结合企业财务主体的自身特殊性,企业财务主体具有以下两个方面的特征:第一,企业财务主体具有适应性和智能性,个体会根据环境和其他利益主体来调整自身的状态和行为,使自身发生适应性变化。第二,企业财务主体是有限理性人。现代经济学表明,人的行为是不具有完全理性的,企业财务主体由于在社会地位、占有资源及获取信息能力上的差异性和不对称性,并不具备做出理性决策的条件,主体之间的适应和博弈的决策只能是有限理性的。

(二)企业财务多主体的博弈行为 企业财务系统是一个开放的复杂巨系统,每个主体有着各自不同的目的和利益,在一个利益分化和利益主体多元化的系统中,每时每刻都在发生着各种复杂的交易和利益冲突。因此,博弈是财务主体生存所面临的基本环境,也是财务主体发展的根本动力。每个财务主体之间的博弈行为是围绕着相关的价值创造活动进行的。从价值链的角度来看,企业是一个投入-产出的价值增值系统,它利用和协调价值链上各利益主体的特定资源进行投入-产出活动并取得回报,企业财务主体在成本和收益之间必然展开经济利益的争夺和博弈。如,在筹资活动中,债权人的总收益是利息,总成本包括贷款本金和机会成本,企业与债权人之间必然会围绕利息展开博弈。

(三)企业财务主体的演化博弈机制 传统博弈论中最基本的一个假设前提是参与人为完全理性人,这要求博弈双方都具备完美的判断和预测能力,这种完全理性假设在现实世界中显然不成立。诺贝尔经济学奖得主Simon认为,博弈环境的复杂性、信息的不完全性、人类认识能力的有限性都决定了人的行为理性是有限的。基于此,John Maynard Smith(1973,1974)等提出了演化博弈论的思想。演化博弈论认为,有限理性主体不能正确地计算自己的收益支付,做出最佳决策的能力有限,决策者大多是通过试错和对较高收益策略进行学习模仿,最终达到一种稳定均衡状态。因此,演化博弈的过程实际上是采用更高收益的策略的人数比率逐渐上升的动态演化过程。同样,企业财务系统中的利益主体也都是有限理性决策人,它们之间的博弈属于一种演化博弈。每个财务主体不可能严格按照效用最大化进行决策,在多数情况下是通过了解博弈的历史,通过学习模仿其他主体来动态调整决策。一组组单个的利益主体在寻求相互适应中不断发展,从而推动了整个企业财务系统的发展和财务危机的演化。

三、基于多主体博弈的企业财务危机演化动因分析

(一)企业财务危机演化的动力 根据上文分析,企业财务主体的演化博弈是财务系统运行的动力。单个财务主体为了更好地适应其他主体,在博弈过程中,会不断地“学习”和“积累经验”,修正相互作用的模式。在接受外界信息时,按照既有的规则,如果适应了其他主体,则不对规则做出修改,如果不能适应,则需要对自身规则进行修改。当多个主体对规则进行修改,则通过相互作用形成网络,构成受限生成过程,形成一个新的主体、新规则、新系统,从而产生涌现现象。从复杂系统理论的视角出发,企业财务危机正是构成企业财务系统的多个适应性主体在彼此之间的财务利益博弈中,相互作用、相互影响,不断地发展、演化,从而使企业财务系统不断分化、涌现的结果。

(二)企业财务危机演化的关键因素 根据企业财务危机演化的动力可知,企业财务危机演化的主要因素在于企业财务多主体的博弈行为,根据主体的类别不同,可将其分为内部博弈因素和外部博弈因素。

(1)内部博弈因素。企业财务危机的内部博弈因素主要源自于企业与内部财务主体之间的博弈,即与股东和员工之间的博弈。首先,股东是企业的发起人,为企业提供资本支持,是企业发展的原始动力;股东最关注的投入回报是股利和股价。对于企业而言,它倾向于选择留存盈余作为首要的资金来源,因而会相应降低股利支付水平。对于股东而言,它会通过股票的持有和出售引起股价的波动,从而左右企业的股利政策。因此企业与股东之间关于股利的博弈必然导致股价的波动,从而引发企业财务危机。其次,员工是企业的主体,是企业的劳动力资源。员工为企业提供专用技能并受企业职业约束,得到固定工资、奖金以及自我实现感。企业为了获取更高的收益而激励员工,员工为了获取丰厚的报酬而积极工作。因此,企业与员工之间关于报酬的博弈必然影响员工的工作效率,从而导致销售和产量的下降。

(2)外部博弈因素。企业财务危机的外部博弈因素主要源自于企业与外部财务主体之间的博弈,即与债权人、客户、供应商和政府之间的博弈。首先,债权人是企业发展的资金提供者。债权人最关注的投入回报是利息。对于企业而言,它更倾向于利用固定的利息成本获得更大的投资收益,同时也会带来投资风险的增大。对于债权人而言,它在制定利率政策时,必然会考虑企业还贷的风险。因此,企业与银行之间关于利率的博弈必然影响利率的波动,从而导致企业的融资成本和债务危机。其次,顾客是企业生存和发展的外部依赖者。企业与客户之间的利益冲突主要在于产品的价格和效用。在当前以买方市场为导向的经济环境中,企业逐渐认识到片面追求利润最大化而忽略顾客感受会导致顾客不满,引起销售额下降。因此,企业与客户之间关于产品质量和价格的博弈必然影响产品的销量。再次,供应商为企业提供原材料保证,这是企业生产经营的基础。企业与供应商之间的利益冲突主要在于原材料的价格。供应商提高报价能获得高额的利润,但可能因为高价而不被选中,导致失去交易的机会,而降低报价虽然交易的概率提高,但可能利润很低甚至亏损。因此,企业与供应商之间的博弈必然导致原料价格的波动,增加企业成本风险。最后,政府是公司税收政策和行业监管政策的制订者,它为企业提供了良好的生存环境。政府的投入回报是税费。企业在追求利益最大化的同时难免会忽略对政府相关规则因素的考虑。企业违规与政府监管之间必然存在着利益博弈问题,这种博弈也必然会带来企业生产经营上的操作风险和成本压力。

(三)基于多主体博弈的企业财务危机演化机制 企业财务主体之间的博弈属于一种演化博弈,这种博弈过程不是一蹴而就的,单个财务主体不但需观察企业的决策,由于其有限理性,更多会通过学习模仿同类其他财务主体行为来动态调整自身决策,随着多数财务主体决策的趋同,会最终导致企业相关财务要素随着时间逐渐改变。如,企业与股东的演化博弈,可能导致越来越多的股东选择出售股票,从而导致股价的逐渐下跌;企业与员工的演化博弈,可能导致越来越多的员工不努力工作,从而导致企业生产经营效率逐渐下降;企业与债权人的演化博弈,可能导致越来越多的债权人选择高利率放贷,从而导致企业贷款利率逐渐升高;企业与客户的演化博弈,可能导致越来越多的客户不愿购买本企业产品,从而导致企业产品销量逐渐下降;企业与供应商的演化博弈,可能导致越来越多的供应商抬高价格,从而导致原材料价格上涨;企业与政府的演化博弈,可能导致政府对企业的监管措施越来越严,从而导致企业经营成本压力越来越大。由此可以看出,企业财务危机因素的变化不是一朝一夕的过程,而是在企业与财务利益主体之间的不断博弈中,随着时间不断演化的过程。财务主体为了自身利益,采用对企业不利决策的人数比率逐渐上升,企业财务危机也就不断深化。

四、企业财务危机演化路径分析

(一)探测阶段 探测阶段是企业财务主体对外部环境的特征变量进行探测,包括宏观环境和其他利益主体行为,然后将探测到的信息传递给财务主体。其主要功能是完成企业财务复杂系统主体之间的信息交流。

(二)执行阶段 执行阶段是企业财务主体根据环境的变化以及其他主体的行为,通过自身的推理和历史经验,做出相应的决策。每一个主体都有自身的属性、决策变量和追求的目标,它们都会基于自身利益最大化选择相应的策略。由于企业财务主体的有限理性,在做决策时,往往会学习模仿同类主体的行为,或者做出不利的决策。现实世界中,财务主体决策通常不是由单个个体做出的,而是由一个群体按照某种规则协作完成的,所有决策会按时间序列形成决策流,决策流的执行过程与结果形成危机中的事件流。

(三)效应阶段 企业财务多主体的整体决策行为会对企业财务系统产生一定的效应和影响,这就是效应阶段的内容。财务主体的整体决策行为形成的危机事件流会改变企业的外部环境,形成宏观意义上的管理风险、股市风险、利率风险、市场风险、信用风险、原料风险和政策风险,这些风险会导致企业主要财务要素的变动,如工作效率下降、股价下跌、利率上涨、销量减少、原材料价格上涨和政府监管政策改变等。财务要素的变动最终会引发企业内部财务风险,包括盈利风险、营运风险和偿债风险,随着风险因子的不断增多增强,企业财务危机也会随之不断恶化。

企业财务危机演化路径的三个阶段如图1所示。

五、结论

通过分析,可得到以下方面的研究结论:(1)企业财务多主体博弈推动着企业财务系统的动态演化和平衡。企业财务系统中的利益主体作为有限理性决策人,它们之间的博弈属于一种演化博弈。(2)企业财务危机是在企业与其利益主体之间的永恒博弈下,随着时间不断地发展、演化,从而使财务系统不断分化、涌现的结果。(3)企业财务危机的演化路径主要分为探测、执行和效应三个阶段,它们是周而复始的循环过程,共同实现了企业财务主体博弈行为到企业财务危机演化的传递。

博弈基本要素篇(3)

从博弈论角度看,资本市场具备了一般博弈的全部要素,是典型的博弈竞局。

1、资本市场的博弈主体。资本市场作为证券交易和资本融通的场所,其博弈主体主要有股份公司、投资者、交易所、券商、证监会等。这些主体之间实际上都是博弈关系:股份公司和投资者之间是一种是否(以某一价格)发行股票和是否提供资金的博弈;投资者与投资者之间是一种是否买进股票和卖出股票的博弈关系;券商和公司之间是一种是否愿意承销股票的关系;证监会与其他市场参与者之间是一种约束与遵守、监管与反监管的博弈关系。这些参与者构成了资本市场的博弈主体。

2、资本市场博弈的目标函数。资本市场博弈者都是理性的“人”,具有明确的目标函数。股份公司的目标是在发行费用最低的前提下,以较高的价格发行股票,筹集最多的资金;投资者买卖证券的目的就是获得股息分红或低买高卖,赚取价差,实现投资收益最大化;券商在证券发行时的目标是赚取更多的承销费,在证券经纪时则希望交易量越大越好,以获得更多的佣金收入;交易所在股市低迷时希望庄家炒作,活跃股市,在股市过热时则希望投资者理性行动,防止过度泡沫化;庄家炒作时希望散户(中小投资者)跟风,以便进出;散户交易时希望跟庄又不希望被套,赚钱而又规避风险;证监会的目标则是希望资本市场活跃而规范,希望高效运行而又持续等。因此,博弈者都有明确的目标函数,资本市场实际上就是博弈者单独决策、追求利益最大化的场所。

3、资本市场博弈者的相互和对抗。传统的技术分析理论把资本市场看成是一个不受博弈者自身行为影响的客观系统,没有考虑到人的操作行为对市场的影响。实际上,资本市场博弈者之间不是孤立的,而是直接作用、相互影响的,每个主体的决策不仅影响自己的行为,而且影响他人的行为,进而影响整个资本市场的运动,特别是当资金量大时对市场的影响更大。博弈论把资本市场看作一个竞局,市场参与者处于博弈对抗中,投资决策就是一个博弈过程。博弈计算过程必须要有对手意识,考虑对手的存在,考虑到对手的多种可能的选择,同时还要考虑到对手决策时也会考虑到我的存在和我的多种选择的可能等。从博弈论角度分析资本市场,更注重博弈者之间的这种相互影响和对抗。

4、资本市场的博弈“规则”。资本市场的博弈并不是杂乱无章的,而是在一定规则约束下运行的。这些规则就是“博弈规则”,博弈规则的集合就是经济学上所说的“制度”。资本市场上的规则是多种多样的,包括有关、法规、规章、条例、章程、政策等。从结构上讲可以分为组织制度、发行制度、上市制度、交易制度、监管制度、信息披露制度等主要方面。具体来说,宏观上包括《公司法》、《证券法》、《信托法》、《基金法》等大法,微观上还有各种有关发行、上市、交易的规则和条例等。博弈规则对资本市场博弈者来说,是一种“共同知识”,是一种公开信息,是博弈者行动决策的依据。博弈规则是资本市场正常运行的制度保障,资本市场监管当局的主要职责就是通过博弈规则的制定和市场制度的完善而求得资本市场的公平交易和安全运行,否则,没有“博弈规则”和相应制度,资本市场就无异于完全投机的“赌局”,只能是一片混乱,不会持久地存在和发展下去。

显然,从博弈论角度看,资本市场是一个典型的博弈竞局,把资本市场看作博弈竞局更接近于资本市场的实际状态。

二、资本市场博弈的信息问题

资本市场博弈中信息是一个重要因素,更是博弈胜负的关键。我认为资本市场是信息最重要、信息最集中、信息最不对称、信息时效性最强、信息价值体现最充分的市场。

1、信息是资本市场的“轴心”和“生命”。首先,信息是决定证券价格的基本因素,不同的资本市场上价格对信息的反映程度是不同的,据此资本市场可以相应地划分为弱式、半强式、强式市场三种类型,三种类型市场的效率和成熟程度是不同的。而且,信息是资本市场有效运行的内在要素,它是市场参与者进行证券交易、进而实现资本融通的决策基础;市场参与者既是信息需求者,同时又是信息供给者,它们的交易活动既需要信息,又会产生和显示信息;资本市场既是资本交换的场所,又是信息交换的场所,正是从这个角度讲,可以说资本市场也是一个信息市场。

2、资本市场博弈的信息是不完全的。这是因为资本市场有两个方面的不确定性:第一,资本市场外部环境状态的不确定性。包括国家的经济政策、市场监管当局的监管政策、实物市场的状况和上市公司的经营状况等,这些因素是资本市场博弈竞局外部的力量,硬性影响着竞局的发展,市场博弈者只能接受而没有能力改变它。这些外部信息对资本市场博弈者来说是“不完全”的。第二,资本市场内部的不确定性。资本市场本身信息也是不完全的,例如投资者对其他投资者的市场操作行为和状态缺乏了解,即对市场博弈状态缺乏了解。通过行情报价人们只能看到股价的涨涨跌跌,而不可能知道这股价涨跌背后是谁在推动,每个人的行为都隐藏在背后,博弈过程信息极不完备。而且退一步讲,即使获取了这些微观信息也不能直接指导操作,因为没有办法直接计算这么多人各自采取行动对市场的影响,而只能用统计的分析,但统计方法本身必然带来随机误差,所以这种不确定性是内生的不可避免的。不管是外部信息还是内部信息,对于每一个博弈者而言都是不完全的,因此资本市场是一种不完全信息博弈竞局。

3、资本市场博弈信息也是最不对称的。在资本市场博弈中,信息不仅是不完全的,而且是不对称的。表现在:(1)有些人能通过特殊的信息渠道获取其他人所不具有的信息,例如上市公司的内幕消息、庄家持仓情况的信息等;(2)有些人掌握了比较快捷的信息传递通道,能更快地获得市场公开信息。(3)即使是获取信息方面是平等的,不同人掌握的信息分析方法和分析工具不同,从原始信息中加工和提取有价值信息的情况也不同。(4)庄家至少了解自己的仓位情况,获取信息的能力更强,因而在市场博弈信息方面天生就比散户更具优势。(5)广大散户在信息占有方面处于最底层,多数人不仅不能得到优于他人的信息,即使公开信息都无法有效利用,甚至对许多公开信息都不知道。这样,现实资本市场上,信息的分布是不对称的,总有一些市场博弈者必其他博弈者占有更多的信息。无疑,具有较多信息的博弈者在竞局中处于优势地位,而信息少的博弈者则处于不利地位。现实资本市场博弈中庄家之所以常常战胜散户,主要就是信息不对称造成的。

4、资本市场信息的不完全和不对称,不仅直接影响着博弈者的经济利益的差别,而且会引起“劣股驱逐良股”的逆向选择和道德风险等效应,更为严重的是会引起市场交易的不公平,降低市场运行效率,引起市场萎缩甚至市场失败。

信息在资本市场的重要性要求我们在资本市场运行、管理和制度设计中给予信息因素以足够的重视,建立完善的强制性信息披露制度,以减缓资本市场信息不对称程度,实现资本市场的公平交易和有序运行。 三、资本市场博弈的“零和”性

博弈按照收益分配结果可以分为零和博弈和非零和博弈两种类型。零和博弈指的是博弈各方收益的和正好为零,即博弈中一方博弈者所得到的收益恰好是另一方博弈者的损失。非零和博弈是指所有的博弈者的收益(支付)的和不为零,是一种变和博弈。变和博弈又包括正和博弈和负和博弈两种情况。一般来看,资本市场应该是一种变和博弈:在这里,市场交易费用如交易税、佣金等是一种负的因素,从市场上抽走资金;上市公司利润分配如现金派息是一种正的因素,它向市场注入资金。两种因素同时存在、共同作用的结果,资本市场应该是一种变和博弈;到底是一种负和博弈,还是一种正和博弈,就看正负两种因素那一方力量大。总的来说,资本市场基本上是一个负和博弈或是总和很小的正和博弈,近似地都可以看作是零和博弈(杨新宇,2000)。资本市场的情况是交易费用(税收和佣金)较高,而分红派息比例很低,所以是显著的“负和博弈”。

资本市场总体上的“零和博弈”特征,可以帮助我们理解人们通常的一个疑惑:为什么投资者总是“输多赢少”。(1)作为一种零和竞局,甚至是更严酷的负和竞局,考虑到交易费用的支出,股市实际的平均线不是不赚不赔而是输,结果处于平均线附近的投资者实际上都是赔钱的。(2)输赢的分布也是不平均的,庄家由于资本、信息、技术、人才等方面的优势,一般为赢家,而中小投资者(散户)多为输家。可见,资本市场“零和博弈”甚至“负和博弈”的特征是决定投资者“输多赢少”的根本原因。

四、资本市场博弈的现实性

博弈论的是理想博弈。理想博弈是上的,一般假设博弈者是理性的人,以自身利益最大化为目标,有足够的智力做出正确的和决策。理想博弈排除了人的行为不确定性对博弈的,其演化方向仅仅取决于博弈规则,带有很强的必然性。理想博弈有自己稳定的最优解,当博弈达到均衡状态时,任何一方若离开这一均衡点都会利益受损,因而没有积极性改变策略。理想博弈是从各种现实博弈中抽象出来的,是对复杂的现实博弈的简化和“理想化”。

资本市场显然不是理想博弈。资本市场的参与者都是现实的人,不可能达到理性人的境界,他们的类型多种多样,智力有高有低,能力有限,在市场中的决策和计算不可能完全正确,而且经常出现错误,在现实中参与者的一个错误就可能完全改变博弈竞局的态势。这些因素决定了资本市场不可能是理想博弈,而是现实博弈。

资本市场博弈的现实性并不否认博弈论对资本市场研究的指导作用。由于理想博弈毕竟来源于现实博弈,因而博弈论对现实博弈具有启发性意义。(1)虽然现实资本市场博弈中对单个投资者的行为很难把握,但是,所有投资者的整体行为还是可以研究和分析的,资本市场整体的运动还是有一定的,博弈论可以从整体上对资本市场博弈进行分析和研究,发挥其理论指导作用。(2)资本市场作为信息不完全、多方参与的现实博弈竞局,传统理论是很难分析的,但我们可以运用博弈论中“海萨尼转换”原理,将资本市场的不完全信息博弈转换成“完全但不完美信息博弈”,从而使股市变得可分析。(3)资本市场又是一种“概率性”博弈,也就是说,投资者的行为虽然是不确定的,但根据由大量统计得出的主观概率判断进行决策,可以提高决策的性,避免盲目性,从而有利于在现实博弈中取胜。

五、结论

以上分析,我们的结论是:(1)资本市场是众多投资者参与的、相互作用、利益争夺的博弈场所,是一种典型的博弈竞局;(2)资本市场博弈是在严格的“规则”约束下运行的,规则的集合就是“制度”,缺乏“制度”约束的股市无异于“”,制度建设是资本市场管理的头等大事;(3)在这种博弈中,信息是至关重要的,可以说是信息不完全且最不对称的博弈竞局;(4)资本市场博弈具有“零和博弈”甚至是“负和博弈”的特征,总是表现为投资者“输多赢少”的结果;(5)资本市场不是一种理想博弈,而是一种“真刀实枪”的现实博弈,具有极强的对抗性和残酷性。显然,资本市场的博弈性是其有生俱来的特征,是资本市场真实状态的反映。

博弈基本要素篇(4)

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

博弈基本要素篇(5)

问题的由来

新闻传播学比之其他社会人文学科,方法论的研究尚未深入,本文所要论及的新闻传播学研究中的博弈论方法,就表现得比较典型。

将博弈论与新闻传播学相交叉的思路, 在上个世纪80 年代社会科学方法论讨论最热烈的时候,新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究,开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中,一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间, 涉猎了一些有关博弈论的论著,产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的,从新闻文化的外延角度来看,新闻传播的竞争生态研究,不能缺少博弈论的思想。

上个世纪90 年代之后, 有关博弈论的书籍开始增多,后来出现了普及性的博弈论读物, 这些书籍大都将社会生活、经济领域、历史经验等方面内容,与各种博弈类型相类比,说明博弈论的道理,但也带来某些副作用,即博弈论的庸俗化。在这样一种背景下,“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系,真正被新闻传播理论界重视, 是在2004 年第八次传播学研讨会上,会上提出“传播即博弈”的观点,并存在争议。2008 年10 月,孙光海、陈立生的《传媒博弈论》由三联书店出版,有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题,或在文章论著中有意识地使用“博弈”概念来看,可以分为以下三种情况:

一是狭义基础上的理解。仅仅从传媒市场竞争的角度, 来研究新闻传播的博弈。如《传媒博弈论》一书,“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象, 对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析,从新闻到版面到受众再到发行, 通过大量案例剖析与实战推演,总结出各大媒体在不同环境下,针对不同的竞争对手以及竞争对手采取的策略,从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然,从最严格意义上来看,该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看,完全是从社会主义市场经济的媒体之间竞争策略着眼,探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发, 来探讨新闻传播领域中,如何把握新闻活动的规律,有学者称之为“大博弈的思维观”。实事求是地说,新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解,所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念,但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论,说明他已经把博弈论纳入到传播学视野了,不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题,即所有社会科学理论都存在传播的问题, 传播学强调传播的双向性,恰好说明了与博弈论的紧密联系。另一位讨论者强调:“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的,但“传播之中有博弈”,“博弈之中有传播”,在一般的传播现象中存在部分博弈现象, 也是不争的事实。而且,我们注意到,在正常的新闻传播过程中,传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的,从而认定传播学一般现象无法以博弈论进行解释,不尽妥当。我们知道,传播模式研究的前提,也要求理性的状态。[ Www.]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约,或传统哲学所说的作用与反作用意义层面,来使用“博弈”概念。诚然,博弈论研究确实离不开这些因素, 但所有事物间的这些因素,不一定都是博弈论所讲的博弈。也有在互动反馈意义层面, 来理解博弈的,比起前者进了一层,然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为,但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象,把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象,这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词,而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法,而是力图客观地思考博弈论方法在新闻传播学研究中,究竟能否作为一种研究视角,起到对新闻传播学研究的建构作用,甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理:第一不完备性定理———任意一个包含算术系统在内的形式系统中,都存在一个命题,它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的,但是其革命意义远远涉及科学哲学、逻辑学,而这种情况也注定要影响社会科学研究领域。诚然,新闻传播研究中,也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性,目的主要是运用其基本思想, 扩展研究视域,在新闻传播领域内最合适的地方,找到双方的契合点,从新的角度描述新闻传播现象与活动的规律, 调整我们的传播行为,使社会信息资源得到有效的配置。

博弈论最基本的思想,其一,在同一活动中,某事物的行为效果如何,有赖于它事物的行为。其二,是均衡概念。其三,假设人是理性的。理性的人,指行动者具有一定的逻辑推理能力,进行决策选择策略的目的就是自身利益的最大化。现实生活中,人们在作决策时可能往往是有限理性。其四,博弈论是竞争与合作的游戏,一般有协议契约。根据以上的简单概括,随之需要思考的问题就是,新闻传播现象与活动过程中,有没有相类似的情况? 其一,在同一新闻传播活动中,双方各自的行为要视对方的行为而定?其二,均衡概念在新闻传播过程中能否实现?其三,新闻传播活动的行为主体是不是理性的?情况允许的话,自己的利益最大化是否是追求的目标?其四,竞争与合作的契约关系,在新闻传播过程中能否建立?答案是倾向积极的。

有了上述基本思考,我们再从更大一些的方面来探讨运用博弈论的可能性:

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态,即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然,马克思主义承认社会历史的发展有着诸多的因素, 正如恩格斯所说的“平行四边形”合力作用,但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况,人们之所以在各类社会活动、人际关系中发现博弈的因素,是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动,归根结底是由交往关系决定的。因此,博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后,包括新闻传播业在内的文化产业,亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下,力求社会效益与经济效益的双赢,这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为,都存在博弈论的问题,因为在某一次传播活动中的传播者之间、传受之间等,都有一个行为对策选择的问题,在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化,可能追求的就是整体国家民族利益的最大化,如我国文化产业的双赢策略,即博弈论的“均衡”。公益与私利、赢利的矛盾,在社会主义初级阶段会一直存在,博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道,博弈论最初作为应用数学的一个分支,是运筹学下面的对策论。后来应用于经济领域。在西方发达国家,作为西方经济学前沿领域的博弈论,已逐渐变为一种占主流地位的基本分析工具, 人们十分重视其方法论意义。

从中国的传统文化来说,经史子集弈的思想无处不在。过去曾有学者提出这样的观点, 自然科学最基础的学科是数学,而社会科学的基础可以是博弈论。我们不能说它完全正确,但是至少应该承认有其一定的合理性。

从广义的角度看,传播应用学派的传播模式研究, 实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中, 许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式, 第二版介绍了66个传播模式。除了个别早期线性模式外, 在控制论的反馈概念出现之后,传播模式越往后越具有博弈的性质,甚至可以这样说,研究当代传播模式离开了博弈的思维, 其研究是存在欠缺的,虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学,从它们的发生与发展的历史来看,是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代, 在需要破除自然与社会科学鸿沟的时代, 谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学,从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响,人们思考博弈论在新闻传播研究领域的运用时,可能认为仅仅反映在传媒的经营管理上。这种狭义的理解,导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为,新闻传播研究中重视运用博弈论,并不是要求新闻传播理论“范式”像经济学那样转向博弈论,并把它作为核心的理论分析工具,而是在理论体系建构中,对博弈论方法给予足够的重视, 将其中合理的内容,吸纳到基础理论中来。更重要的是,将博弈思维作为指导理论研究的一个窗口,扩展新闻传播理论空间。当然,也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”, 进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年,但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意,原因是新闻传播理论界对博弈论尚不太熟悉,对博弈论的理解也参差不齐,甚至还存在部分抵触心理,致使研究成果的质与量不甚理想。新闻传播研究需要理论创新,对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论,对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上,在新闻传播研究领域都有用武之地,关键在于我们的观念。

参考文献

1.肯尼斯·赫文[美]、托德·多纳著:《社会科学研究的思维要素》,重庆大学出版社,2008年版。

博弈基本要素篇(6)

【关键词】博弈论会计信息失真纳什均衡

一、博弈的基本理论

博弈论又称对策论、竞赛论,用于分析竞争的形势。在博弈论的研究中,一个核心问题就是均衡,即纳什均衡。在经济学中,均衡意即一些相关量处于稳定值。

所谓博弈论(GameTheory),是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的一种方法。博弈论把现实世界中不同参与者之间的各种行为抽象概括为不同参与人之间利益的冲突与一致,进而通过构建博弈模型来研究不同参与人的策略选择问题,使分析更加准确。同时,博弈论把信息的不完全性作为基本前提之一,这就使得博弈论所研究的问题和所提出的结论与现实非常接近,具有现实性。

二、会计信息失真的博弈分析

1.博弈分析的基本要素

博弈分析的基本组成要素有三个:一是博弈主体,即指参与博弈的各方,包括企业、投资者、政府监管部门和其他有关的个体等。二是博弈规则,即一切规范会计行为的会计法规、准则和制度。三是社会监督者,即会计理论界、社会公众、政府审计以及其他经济监督人员。

2.博弈分析的基本假设

会计信息失真博弈的基本假设主要有六个:一是各主体之间存在信息的不对称性。二是强调个人理性和有限理性。三是企业和政府监督部门、投资者都完全了解自己和对方在各种情况下的利益。四是非合作原则,即企业与政府监督部门、投资者不能“串通”以谋取双方利益的最大化。五是不存在会计做账技术上的障碍或政府监管部门检查技术上的缺陷。六是会计准则留有灵活性和“真空地带”。

3.博弈分析

(1)企业与政府监管部门的博弈

随着我国会计法规的不断完善,政府加强了对企业的监管力度和措施,但也不乏疏漏之处。有些企业仍抱着侥幸心理,偷偷做假。下面,构造企业和政府监管部门两个参与人的对策模型。企业有两种选择策略:做假账和做真账。政府监管部门也有两种选择:检查与不检查。两者博弈过程可用图1表示。

第一个数字表示企业的得益;第二个数字表示政府监管部门的得益。R表示监管部门查出假账后所得的奖励;L表示政府监管部门的检查成本;R-L表示政府监管部门查出假账后的净得益;C表示企业做假账被查出后的损失;d表示政府监管部门没有查出假账的损失;e表示企业做假账没被查出所得好处.

一给定企业做假账的概率P,政府监管部门选择检查和不检查的期望收益分别为∏查=(R-L)×P+(-L)×(1-P)=RP-L和∏不查=(-d)×P+0×(1-P)=-dP.

要达到纳什均衡,政府监管部门检查和不检查的期望收益一定要相等,否则政府监管部门将改变现在的策略获得更大的收益。因此,政府部门预期收益最化的一阶条件是∏查=∏不查,即RP-L=-dP.解得P=L/(R+d).

也就是,如果企业做假账的概率小于L/(R+d),则政府监管部门的最优选择是不查;如果企业做假账的概率大于L/(R+d),政府监管部门的最优选择是检查;如果概率等于L/(R+d),政府监管部门随机选择检查或不检查。

二给定政府监管部门检查的概率q,企业选择做假账和做真账的期望收益分别为∏假=(-C)×q+e×(1-q)=e-q×(e+c)和∏真=0×(1-q)+0×q=0.同理可得∏假=∏真,即e-q×(e+c)=0,解得q=e/(e+c).

若政府监管部门检查的概率小于e/(e+c),则企业的最优选择是做假账;若政府监管部门检查的概率大于e/(e+c),则企业的最优选择是做真账;若政府监管部门检查的概率等于e/(e+c),则企业随机选择做假账或做真账。(2)企业与投资者的博弈

企业作为独立的经济人,追求的是企业利益最大化。所以,企业作为会计信息的提供者有时会少披露、不披露甚至歪曲披露企业的某些会计信息。投资者对企业进行投资是为了取得投资收益,为使投资效用最大化,投资者也并非完全需要企业提供真实的信息。因而,在企业与投资者之间博弈的最后均衡很可能是企业做假账,提供虚假的会计报表。

博弈基本要素篇(7)

2博弈论视角的大学生诚信缺失行为分析

2.1诚信与失信的简单博弈分析

博弈论主要是用来解决主体之间的行为发生直接相互作用时候的决策,以及这种决策之间的均衡问题。为研究方便,本文选取了大学生申请助学贷款与银行放款这二者之间在诚信与失信方面的博弈分析,并在分析中做出了以下的假定:①本文只研究两个行为主体之间的诚信与失信的博弈,假定一方为大学生,另一方为银行,假定大学生和银行这两者都是“经济人”,以追求自身利益最大化为目标,并且不能控制对方的决策;②博弈的双方均为“理性人”,具有机会主义的倾向,即在双方博弈过程中,一方发现欺骗可以获利时,就会采取或选择欺骗策略;③博弈双方可以选择的策略为诚信或失信;④博弈双方的获益。采取诚信,大学生和银行双方都可以获益5;如果银行放款,大学生失信不还款,则大学生获益10;如果大学生诚信贷款,而银行失信不放款,则银行获益10;如果大学生选择不贷款,银行选择不放款,即双方均选择失信策略,这样助学贷款制度就失去意义,则双方的获益均为0。在上面的博弈矩阵表可以看出,表中策略组D为纳什均衡解,即大学生、银行双方都以自身利益为选择目标,其最终的选择结果有很大可能是“失信”,因为“失信”是能实现个体利益最大化的最优策略。之所以会出现这种结局,是基于信息不对称的角度双方博弈的结果,如果大学生选择贷款但是不还款,那么学生得到的效用最大,即得到了免费完成学习的机会成本,而银行损失最大,失去了放贷本金和利益以及可以投资在其他领域的沉没成本;而银行如果存在比给学生放款更有收益的项目,那么银行会选择不放款而转向其他,这样银行可以获取自身经济利益的最大化,学生损失最大,不能贷款助学,失去了完成学业的机会。但以上两种策略的选择都不是博弈的均衡点,必然无法达到稳定。实际上只有在学生不贷款,银行不放款的时候,即达到失信的纳什均衡,这样一来大学生助学贷款制度将毫无意义可言,如果这项制度取消了,最后损失最大的还是大学生。然而,经济博弈理论告诉我们,在非价格因素和博弈双方信息不对称的情况下,个体理选择的结果,往往是非理性的。上述例子说明,由于双方的理,导致了诚信的缺失和社会资源的浪费。

2.2诚信与失信的重复博弈分析

重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈可以重复多次,甚至无限次。当博弈只进行一次时,每个参与人都只关心一次性的获益;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响博弈均衡的结果。在上述的分析中,之所以会出现这种失信的“囚徒困境”局面,最根本的原因在于双方所进行的是一次性的简单博弈,即大家所说的“一锤子买卖”。学生和银行双方都无法根据这一次的博弈结果再组织一次博弈、再做一次选择,基于此,博弈双方都只关心一次性的效益。但从动态博弈的过程来看,如果这种博弈是重复的、持续进行的,那么博弈的结果就会发生根本性的改变,诚信策略的纳什均衡就会成为双方博弈的必然结果。因为在动态博弈中,参与博弈的主体过去的行为都是可以看到或者查询到的,因此博弈中的一方可以通过这阶段博弈的选择,来回应博弈中另一方在上一阶段博弈中的失信行为。在诚信的动态博弈中,如果银行在上一次助学贷款的博弈选择中因采取放款的诚信策略,而大学生选择拖欠还款甚至不还款使银行利益收到损失,那么在本次的博弈过程中,银行必然会选择失信的策略来“报复”失信的大学生,比如将他(她)列为银行系统征信的黑名单,那么他(她)将面临银行以后所有的“报复”。在这里,银行所采取的策略被称为“以牙还牙”策略。基于此,为了更加长期、稳定获取各自的效用,博弈双方都会理性选择自己的行为,双方都会选择诚信,于是必然会出现诚信纳什均衡的博弈结果,由此可见,要想使诚信成为博弈双方的主动选择,其关键是要把一次性的简单博弈转化为重复博弈,从而达到双方共赢的目的。

3以重复博弈促进大学生诚信教育的探索

3.1增加博弈双方信息的对称性,将一次性的简单博弈有效转化为重复博弈。

现实生活中,由于信息的不对称、理性人的机会主义、利己主义等行为,因此博弈双方在博弈过程中出现失信的现象是在所难免的。在一次性的简单博弈中,由于博弈双方都无法根据这一次的博弈结果再进行一次博弈或再做一次选择,因此,博弈双方都只关心一次性的效用,那么选择失信策略是理性人的最佳选择。要想克服这种困境,必须将一次性的简单博弈转化为重复博弈。而将一次性的简单博弈转化为重复博弈的主要思路是要加强大学生诚信教育的认知,深刻认识重复博弈与诚信之间的关系。诚信是大学生应有的基本道德素养,但现实是接受过多年素质教育的大学生对诚信内涵的认知还是很模糊,很多人认为诚信已过时,加之受社会多元化思想的冲击,直接导致其诚信缺失行为的出现。其实主体间诚信关系的建立并非一蹴而就,这需要一个长期的选择、磨合、认同的过程,诚信是双方博弈的试金石,诚信关系的确立是双边的、动态的,任何一方的失信都可能导致诚信关系的中断。所以在大学生的诚信教育中,必定要将一次性的简单博弈转化为重复博弈,不能只顾眼前失信利益而忽视长期诚信利益。

3.2建立大学生诚信档案,畅通大学生诚信信息获取的渠道。

大学生诚信档案是一种写实的记录,主要用于对大学生在校期间的诚信情况进行真实描述,同时这种诚信的描述会起到一种客观评定的作用;同时大学生诚信档案也是一种特殊的教育,这种教育会及时发现问题,正视问题,纠正问题,对失信行为有一定的鞭策作用。学校应该将大学生的诚信档案纳入常态化管理,及时公布诚信档案,特别是面向社会公开,畅通社会获取大学生在校期间的诚信档案信息,如果诚信档案不公开,大学生诚信档案信息不能及时获知,这对于失信之人不能起到监督的作用,诚信之人不能起到标杆作用,“囚徒困境”的一次性简单博弈失信策略必然再抬头,那么制定大学生诚信档案也就失去了其应有的作用,所以大学生诚信信息应当及时公开,特别是要面向就业部门公开,并将考试作弊、学术不端、拖欠贷款等诚信缺失行为直接与就业联系起来,对有失信行为的学生暂缓或不予推荐就业,增加失信的一次性博弈成本,让失信之人无处遁形。3.3加大对诚信缺失行为的处罚力度,增加对失信行为处罚的可信性。在多元价值取向下,诚信如果被仅仅当成一种道德规范,很难要求所有人都遵守。在诚信的动态博弈中,若诚信收益与处罚机制不对称时,双方在博弈时基于个人利益必定会选择失信。在经济社会发达的当下,一个可信的处罚威胁是减少诚信缺失最有力的武器,从某种程度上而言,大学生之所以会出现诚信缺失的行为,有很大部分原因是由于高校对大学生失信行为的处罚力度还不够,因此,高校在大学生的诚信教育方面应加大对失信行为的处罚力度,比如针对考试作弊,给予取消考试成绩、记过、甚至取消学位等处分,让大学生意识到失信行为所付出的的巨大代价,并且这种代价要大于通过不诚信行为所获得的一次性博弈的收益。当成本大于收益时,博弈双方基于理性的角度,必定会选择诚信。

博弈基本要素篇(8)

【关键词】知识型员工 监管激励 演化博弈 研究综述

1 前言

随着全球化竞争和区域竞争的到来和加剧,如何提高企业的核心竞争力是关系到企业生存发展的关键。但是,就目前在对知识型员工的管理即如何监督、激励等过程中仍存在不少问题。正是基于此,我们选择“企业中知识型员工的监管激励演化博弈分析模型”作为研究方向,针对企业中的实际情况,在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,对知识型员工的激励机制进行研究;在此基础上,设计可行的激励机制,激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定激励政策提供理论依据和决策参考。

2 知识型员工的定义和特征

2.1 知识型员工的定义

管理大师彼得·德鲁克首先提出知识型员工这一概念,即知识型员工是指那些掌握和运用符号和概念、利用知识或信息工作的人。

概括来说:知识型员工是凭借自己所受教育,实用脑力劳动创造价值,与一般员工相比,具备较强的学习知识和创新知识的能力,拥有知识资本和创新能力,利用现代科学技术知识提高工作效率为企业带来知识资本增值,并以此为职业的脑力劳动者。

2.2 知识型员工的特征

(1)强烈的自我价值实现愿望,他们往往更加在意自身价值的实现,并强烈期望得到社会的认可,他们往往更加热衷于具有挑战性的工作,希望展示自我价值。

(2)对权威的蔑视性,知识型员工由于渴望展示自己的价值,往往表现出权威的蔑视。

(3)具有高度的独立性。由于知识型员工拥有丰富的知识资本,因此往往主观上不愿受制于人。他们更强调自我控制、自我管理、自我引导和自我发展。

(4)学习愿望强烈,富于创造精神。他们喜欢做前沿性、挑战性的研究,在易变不完全确定的系统中发挥个人的资质和潜力,创新是他们体现自我价值的方式。

3 关于知识型员工监管激励的研究状况

3.1 国外知识型员工监管激励的研究状况

美国著名的管理学家彼得·德鲁克(2001)提出了知识工作的概念:知识型员工是指“那些掌握和运用符号和概念,利用知识或信息工作的人”。知识型员工一方面能充分利用现代科学技术知识提高工作效率,另一方面知识型员工本身具有较强的学习知识和创新知识能力。知识创新能力是知识型员工最主要的特点。此外,知识型员工的工作主要是一种思维活动,知识的更新和发展往往随环境条件的变化而有所适应,具有很大的灵活性。所以知识型员工兼具知识型、创造性、灵活性等方面的特征。加拿大的著名学者、加拿大优秀基金评选主审官弗朗西斯.赫瑞比(2000)认为:简而言之,知识型员工就是那些创造财富时用脑多于用手的人们。他们通过自己的创意、分析、判断、综合、设计给产品带来附加值。在西方发达资本主义国家,员工监管激励在管理界已经是一个相当古老的话题,早在十八世纪末,十九世纪出,企业界和管理界就对监管激励员工、提高劳动生产率进行广泛而深入的研究。

3.2 国内知识型员工监管激励的研究状况

国内学者张伶,张正堂(2008)认为虽然双因素理论和工作特性理论都说明与工作有关的内在激励因素对于员工行为重要的激励作用,但是,双因素理论因素中关于“激励因素”和“保健因素”的划分是模糊的,而不同学者对于工作特性唯独的划分也是模糊的,因此,他们基于知识型员工的特性分析,提出内在激励特性包括工作自、晋升机会、上级支持、人与组织匹配等4个方面,并建立了这些内在激励因素对知识员工工作态度、工作绩效影响关系的假设模型和以苏北地区企业的知识型员工为研究对象,通过实证检验发现,工作自、晋升机会、上级支持、感知的人与组织匹配通过工作满意度、组织承诺对工作绩效有正向显著影响。郝敏怀(2009)从如何培训开发、职业生涯规划和薪酬激励等方面针对企业专业技术人才这一典型的知识型员工的人才激励策略进行了探讨,同时认为按照马斯洛需求层次理论,为满足专业技术人员各个层面的需求还必须多种激励方式相结合,实现多渠道激励。余莉(2009)通过阐述激励的机制和基本理论,在分析研发人员个性特征和主导性需求的基础上,提出了针对研发人员的激励方法策略,其指出在物质激励中的薪酬激励的设计上,既要注重刚性工资的竞争性、成本性,更要突出激励性因素的作用,加大基于绩效的弹性工资力度,并且在这方面拉开差距。

3.3 对国内外知识型员工监管激励的评价

纵观国内外研究,我们可以看到目前对监管激励的研究主要是沿着监管激励的作用机理展开,在分析诸如专业技型员工,科技研发人员这些典型的知识型员工的特征的基础上,分析激励因素和激励过程,建立监管激励模型,监管激励模型基本上是在企业利润最大化和“经济人”的人性假设,以主客体的博弈研究各种监管激励机制。但目前对于监管激励模型的构建大多都是基于传统博弈论 ,传统博弈论假设行为主体都是具有完全理性即行为主体始终以自身最大利益为目标,具有各种环境中追求自身利益最大化的判断和决策能力,具有在存在交互作用的博弈环境中完美的判断和预测能力,不会发犯错,不会冲动,没有不理智。很显然,现实世界中这种假设通常是得不到保证的。同时,纵观国内外研究,我们发现,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工监管演化博弈机制尚不多见,因而本课题采用演化博弈论的方法,对行为主体采取有限理性的假设,即行为主体被假设为程序化地采用某一既定行为,他对于经济规律或某种成功的行为规则、行为策略的认识是在演化过程中得到不断地修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益,这与现在情况更符合。因此,我们在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方面均具有有限理性的情况下,运用演化博弈的方法构建知识型员工监管的演化博弈模型,运用复制动态方程对企业和知识型员工的演化稳定策略进行分类讨论,找出政府、企业和知识型员工三群体类型比例变化复制动态关系,对如何有效监管和激励企业知识型员工提出对策和建议。

4 基于演化博弈论对知识型员工监管激励的研究思路

本课题将通过基于行为主体有限理性假设的演化博弈理论,打开对企业知识型员工监管激励的新思路。

4.1 演化博弈论基本理论的概述

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。

演化博弈论(evolutionary game theory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(bounded rational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。随后,经济学家将之引入经济分析中,将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(adaptive evolution)的过程中产生并发展起来的。演化博弈论的产生、发展在本质上就是起因于博弈论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。

4.2 基于演化博弈论方法的知识型员工监管激励的研究思路

纵观国内外的相关研究,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工的监管博弈机制研究尚不多见。正是基于此在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,构建知识型员工监管的演化博弈模型,运用演化博弈论的方法对相关职能部门、企业与知识型员工之间相互作用时的策略选择行为进行分析,对知识型员工的监管激励机制进行深入研究;在此基础上,设计可行的监管激励措施,从而能最大程度激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考。

5 结语

本文对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,在简要概述知识型员工的内涵及其特征的基础上,对知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景进行了探讨。特别需要强调的是,演化博弈理论摒弃了博弈论完全理性的假设,比博弈论能更好的解释和分析现实中的经济和管理问题,因此,期望通过对知识型员工监管的演化博弈模型的构建能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考,从而在对知识型员工的监管激励机制问题的研究上迈出更加深入的一步。

参考文献

[1] 弗朗西斯·赫瑞比:managing knowledge workers [m].机械工业出版社,2000.

[2] [美]约瑟夫m.普蒂.海茵茨.韦里奇.哈罗德·孔茨著.丁彗平、孙先锦译.管理学精要(亚洲篇) [m].机械出版社,2005:363.

[3] 斯蒂芬.p罗宾斯.组织行为学.中国人民大学出版社,1997:81-92.

[4] 余莉.研发人员个性特征与有效激励方法研究[j].中国钼业.2009.33(1).53-56.

博弈基本要素篇(9)

【关键词】知识型员工 监管激励 演化博弈 研究综述

1 前言

随着全球化竞争和区域竞争的到来和加剧,如何提高企业的核心竞争力是关系到企业生存发展的关键。但是,就目前在对知识型员工的管理即如何监督、激励等过程中仍存在不少问题。正是基于此,我们选择“企业中知识型员工的监管激励演化博弈分析模型”作为研究方向,针对企业中的实际情况,在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,对知识型员工的激励机制进行研究;在此基础上,设计可行的激励机制,激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定激励政策提供理论依据和决策参考。

2 知识型员工的定义和特征

2.1 知识型员工的定义

管理大师彼得·德鲁克首先提出知识型员工这一概念,即知识型员工是指那些掌握和运用符号和概念、利用知识或信息工作的人。

概括来说:知识型员工是凭借自己所受教育,实用脑力劳动创造价值,与一般员工相比,具备较强的学习知识和创新知识的能力,拥有知识资本和创新能力,利用现代科学技术知识提高工作效率为企业带来知识资本增值,并以此为职业的脑力劳动者。

2.2 知识型员工的特征

(1)强烈的自我价值实现愿望,他们往往更加在意自身价值的实现,并强烈期望得到社会的认可,他们往往更加热衷于具有挑战性的工作,希望展示自我价值。

(2)对权威的蔑视性,知识型员工由于渴望展示自己的价值,往往表现出权威的蔑视。

(3)具有高度的独立性。由于知识型员工拥有丰富的知识资本,因此往往主观上不愿受制于人。他们更强调自我控制、自我管理、自我引导和自我发展。

(4)学习愿望强烈,富于创造精神。他们喜欢做前沿性、挑战性的研究,在易变不完全确定的系统中发挥个人的资质和潜力,创新是他们体现自我价值的方式。

3 关于知识型员工监管激励的研究状况

3.1 国外知识型员工监管激励的研究状况

美国著名的管理学家彼得·德鲁克(2001)提出了知识工作的概念:知识型员工是指“那些掌握和运用符号和概念,利用知识或信息工作的人”。知识型员工一方面能充分利用现代科学技术知识提高工作效率,另一方面知识型员工本身具有较强的学习知识和创新知识能力。知识创新能力是知识型员工最主要的特点。此外,知识型员工的工作主要是一种思维活动,知识的更新和发展往往随环境条件的变化而有所适应,具有很大的灵活性。所以知识型员工兼具知识型、创造性、灵活性等方面的特征。加拿大的著名学者、加拿大优秀基金评选主审官弗朗西斯.赫瑞比(2000)认为:简而言之,知识型员工就是那些创造财富时用脑多于用手的人们。他们通过自己的创意、分析、判断、综合、设计给产品带来附加值。在西方发达资本主义国家,员工监管激励在管理界已经是一个相当古老的话题,早在十八世纪末,十九世纪出,企业界和管理界就对监管激励员工、提高劳动生产率进行广泛而深入的研究。

3.2 国内知识型员工监管激励的研究状况

国内学者张伶,张正堂(2008)认为虽然双因素理论和工作特性理论都说明与工作有关的内在激励因素对于员工行为重要的激励作用,但是,双因素理论因素中关于“激励因素”和“保健因素”的划分是模糊的,而不同学者对于工作特性唯独的划分也是模糊的,因此,他们基于知识型员工的特性分析,提出内在激励特性包括工作自主权、晋升机会、上级支持、人与组织匹配等4个方面,并建立了这些内在激励因素对知识员工工作态度、工作绩效影响关系的假设模型和以苏北地区企业的知识型员工为研究对象,通过实证检验发现,工作自主权、晋升机会、上级支持、感知的人与组织匹配通过工作满意度、组织承诺对工作绩效有正向显著影响。郝敏怀(2009)从如何培训开发、职业生涯规划和薪酬激励等方面针对企业专业技术人才这一典型的知识型员工的人才激励策略进行了探讨,同时认为按照马斯洛需求层次理论,为满足专业技术人员各个层面的需求还必须多种激励方式相结合,实现多渠道激励。余莉(2009)通过阐述激励的机制和基本理论,在分析研发人员个性特征和主导性需求的基础上,提出了针对研发人员的激励方法策略,其指出在物质激励中的薪酬激励的设计上,既要注重刚性工资的竞争性、成本性,更要突出激励性因素的作用,加大基于绩效的弹性工资力度,并且在这方面拉开差距。

3.3 对国内外知识型员工监管激励的评价

纵观国内外研究,我们可以看到目前对监管激励的研究主要是沿着监管激励的作用机理展开,在分析诸如专业技型员工,科技研发人员这些典型的知识型员工的特征的基础上,分析激励因素和激励过程,建立监管激励模型,监管激励模型基本上是在企业利润最大化和“经济人”的人性假设,以主客体的博弈研究各种监管激励机制。但目前对于监管激励模型的构建大多都是基于传统博弈论 ,传统博弈论假设行为主体都是具有完全理性即行为主体始终以自身最大利益为目标,具有各种环境中追求自身利益最大化的判断和决策能力,具有在存在交互作用的博弈环境中完美的判断和预测能力,不会发犯错,不会冲动,没有不理智。很显然,现实世界中这种假设通常是得不到保证的。同时,纵观国内外研究,我们发现,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工监管演化博弈机制尚不多见,因而本课题采用演化博弈论的方法,对行为主体采取有限理性的假设,即行为主体被假设为程序化地采用某一既定行为,他对于经济规律或某种成功的行为规则、行为策略的认识是在演化过程中得到不断地修正和改进的,成功的策略被模仿,进而产生出一些一般的“规则”和“制度”作为行为主体的行动标准。在这些一般的规则下,行为主体获得“满意”的收益,这与现在情况更符合。因此,我们在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方面均具有有限理性的情况下,运用演化博弈的方法构建知识型员工监管的演化博弈模型,运用复制动态方程对企业和知识型员工的演化稳定策略进行分类讨论,找出政府、企业和知识型员工三群体类型比例变化复制动态关系,对如何有效监管和激励企业知识型员工提出对策和建议。

4 基于演化博弈论对知识型员工监管激励的研究思路

本课题将通过基于行为主体有限理性假设的演化博弈理论,打开对企业知识型员工监管激励的新思路。

4.1 演化博弈论基本理论的概述

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。

演化博弈论(Evolutionary Game Theory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(Bounded Rational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。随后,经济学家将之引入经济分析中,将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(Adaptive Evolution)的过程中产生并发展起来的。演化博弈论的产生、发展在本质上就是起因于博弈论中关于理性行为人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。

4.2 基于演化博弈论方法的知识型员工监管激励的研究思路

纵观国内外的相关研究,在政府相关职能部门、企业与知识型员工相互博弈的情况下,学界对知识型员工的监管博弈机制研究尚不多见。正是基于此在考虑到相关职能部门、企业与知识型员工相互博弈以及这三方均具有有限理性的情况下,构建知识型员工监管的演化博弈模型,运用演化博弈论的方法对相关职能部门、企业与知识型员工之间相互作用时的策略选择行为进行分析,对知识型员工的监管激励机制进行深入研究;在此基础上,设计可行的监管激励措施,从而能最大程度激发知识型员工的积极性和创造性,并期望能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考。

5 结语

本文对国内外关于知识型员工监管激励的研究做了总结并指出其存在的问题,在简要概述知识型员工的内涵及其特征的基础上,对知识型员工监管激励的理论渊源、发展情况及存在的挑战与演化博弈论在知识型员工监管激励研究中的应用前景进行了探讨。特别需要强调的是,演化博弈理论摒弃了博弈论完全理性的假设,比博弈论能更好的解释和分析现实中的经济和管理问题,因此,期望通过对知识型员工监管的演化博弈模型的构建能为相关职能部门和企业制定监管激励政策提供理论依据和决策参考,从而在对知识型员工的监管激励机制问题的研究上迈出更加深入的一步。

参考文献

[1] 弗朗西斯·赫瑞比:Managing knowledge workers [M].机械工业出版社,2000.

[2] [美]约瑟夫M.普蒂.海茵茨.韦里奇.哈罗德·孔茨著.丁彗平、孙先锦译.管理学精要(亚洲篇) [M].机械出版社,2005:363.

[3] 斯蒂芬.P罗宾斯.组织行为学.中国人民大学出版社,1997:81-92.

[4] 余莉.研发人员个性特征与有效激励方法研究[J].中国钼业.2009.33(1).53-56.

博弈基本要素篇(10)

基础设施是社会经济发展的基础,对社会经济发展具有巨大拉动作用。 随着经济的发展,社会对基础设施的需求也进一步增强。 由于基础设施具有投资大、回收期长和收益率低等特点,加之固定资产具有巨额沉淀特性,基础设施领域投融资非常困难,这也严重影响了经济发展的速度。 随着投融资制度改革的深入,触及社会最深层次的基础设施领域投融资制度改革也逐渐被提上议事日程。

演化博弈理论是演化生物学与经济学结合的产物,该理论认为生物可以通过试错的方法达到最终的博弈均衡。 历史、制度和经济等因素以及均衡过程的某些细节均会对博弈的多重均衡选择产生影响。 smith和 price1973年在开创性论文中提出了演化稳定策略(evolutionary stable strategy,ess)的概念,标志演化博弈理论的产生。 演化博弈理论的基本思想是通过体制内的群体抵抗体制外群体侵入的一种复制动态过程,对不同群体演化博弈进行分析,找出影响制度演化方向的关键因素,再对这些因素进行分析,调整相应的应对策略,最终实现制度动态合理发展。 因此,演化博弈适用于存在利益冲突的决策分析过程。

在基础设施投融资制度变迁过程中,一直存在国有资本和社会资本两种投融资群体,这两种群体之间的合作关系直接受到政府管制政策的影响。 基础设施投融资制度演化是制度内外各相关群体动态博弈的互动过程,演化博弈模型可以有效地分析基础设施投融资制度变迁过程,揭示制度变迁影响因素并寻求最终达到稳定状态的路径。 本文正是运用演化博弈模型来研究基础设施投融资制度的动态演化的过程,试图分析影响投融资制度变迁、稳定的因素,找出制度变迁的决定力量。

二、相关研究综述

世界银行 1994年将基础设施分为经济性基础设施和社会性基础设施,其中,交通运输、邮电通讯、能源等经济性基础设施直接参与生产过程,可以提高社会生产能力进而加快经济增长速度,而科教文卫等社会性基础设施有利于调整和优化经济结构、改善投资环境、巩固经济发展的基础[1]。

学者们围绕基础设施投融资政策环境和政策选择等问题进行了深入探讨。 亚当·斯密在《国富论》中提出建设并维持某些公共事业及某些公共设施是政府的主要职能;20世纪 30年代,凯恩斯从理论层面论证了公共工程政策的必要性;20世纪 40年代,基础设施受到了发展经济学家的高度重视,被视为经济发展的前提条件;而内生经济增长理论认为基础设施投资等活动是经济长期增长的根本源泉,基础设施的外部性逐步成为研究的重点[2]。 学者们发现政治环境对基础设施投融资具有重要影响。 如 evans认为基础设施本身及其引致投资是最容易度量的“政绩”之一,有话语权的官员基于仕途发展的考虑,很容易进行政治性诱致的基础设施建设[3];rauch发现文官制度的改革、政府任期时间的延长会激励政府将更多的资源投入到基础设施建设,政府提高基础设施投资的政策具有内生扩张倾向[4];randolph指出较完善的政治制度会增加私人供给基础设施的可能性[5];henisz认为政治环境和政府组织的差异是基础设施投资的重要决定因素,他通过对一百多个国家长达两个世纪的数据进行研究发现,政治环境是解释国家间基础设施投资差异的重要因素[6];gwartney的研究表明完善的经济制度对基础设施边际产出的促进作用更加突出[7];张军等人研究发现外商直接投资对地方政府竞相提供优良的基础设施具有激励作用[8];banerjee和 sudeshna提出地方分权硬化了地方政府的预算约束,有利于提高基础设施投资效率,且地方分权增强了地方政府独立解决问题的能力,可促进各种投融资方式的出现[9]。

学者们采用了各种方法对基础设施投融资制度变迁进行研究。 有学者采用相关性研究分析基础设施对经济的作用,如 aschauer通过检验基础设施投资对私人产出及全要素生产率的影响,发现基础设施投资减少可以解释美国生产率的下降[10];shioji、esfahani和 ramirez、范九利与白暴力、郭庆旺与贾俊雪等学者均采用类似方法证实了基础设施建设对经济增长具有积极意义[11 14]。 也有学者采用因果关系方法(主要是联立方程法、向量自回归、协整分析等方法)研究基础设施和经济发展关系,如demetriades和 mamuneas、calderón和 servén等学者[15 16]。 还有学者采用贡献度方法研究基础设施对经济发展的贡献,如 romp和 de haan、刘生龙和胡鞍钢等学者[17 18]。纵观国内外研究成果,学者们多采用计量经济学模型对基础设施投融资进行实证分析,而较少从理论上研究,这也使基础设施投融资的理论研究深度不足,尤其缺乏对基础设施投融资政治环境影响的理论分析,这也制约了基础设施投融资的进一步发展。 本文从演化博弈理论视角出发,研究政府管制政策对基础设施投融资制度的变化过程的影响,并以公用事业民营化为案例进行实例分析,探索基础设施投融资制度演化的决定因素。

三、演化博弈模型的构建

(一) 基本假设

本文构建的演化博弈模型建立在以下基本假设基础上:(1)基础设施投融资制度中存在两个群体,分别为国有资本和社会资本;(2)两个群体都为理性的“经济人”,它们根据自身的成本收益来决定其行为;(3)两个群体分别有合作和不合作两种策略;(4)假设群体主要受政府管制影响,忽略其他因素影响;(5)为便于分析,政府的管制程度采用税率表示,税率越高则管制程度越高,反之越低①。

【①在《国务院关于鼓励和引导民间投资健康发展的若干意见》(简称“非公36条”)中政府鼓励和引导民间资本进入基础产业和基础设施领域,鼓励民间资本通过参股、控股、资产收购等多种形式参与基础设施相关企业经营。 但“非公36条”主要是通过准入标准降低和优惠扶持政策来体现出放松管制,这使得博弈过程中的政府管制程度难以得到有效衡量。 税率作为最直接的管制政策,可以用来体现管制程度,即用来表征政府管制从紧到松的政策变化过程,因此本文以税率作为管制程度变化的衡量指标有一定的合理性。

(二) 动态重复博弈

基础设施投融资制度共经历了以下四个阶段:(a)国有资本直接投资经营,(b)国有资本投资市场化运营,(c)国有资本和社会资本共同投资市场经营,(d)社会资本投资市场化经营。 在传统计划经济时代,基础设施投资融资主要是政府直接投资政府运营,随着市场经济的发展,市场力量逐步进入基础设施领域。 基础设施投融资制度发展如图 1所示。

由于制度供给结构不合理、市场化进程限制、政府角色错位等原因,中国基础设施领域成为垄断竞争市场。 在基础设施投融资过程中,博弈的双方地位存在不对等的情况,主要体现在信息不对等、政策待遇不对等等方面,在博弈过程中,由于存在信息不对称等情况,国有资本群体和社会资本群体处于一种不对称博弈状态,两个群体中的个体随机配对进行博弈,双方主要通过对博弈事件概率判断和策略选择来进行博弈。

在基础设施投融资制度变迁过程中,国有资本群体和社会资本群体有合作和不合作两种策略,国有资本选择合作的概率为 x,不合作的概率为1 - x,社会资本选择合作的概率为 y,不合作的概率为1- y。基础设施投融资制度变迁的支付为 u,其方程为 u(c,r) =x′ix= μi(ci,ri) - μ0(c,r),其中 μ0,μi分别为投融资制度变迁前后的收益,c为投融资制度变迁成本,r为变迁个体产生的增值利润。当 μ> 0,此时投融资制度变迁的收益大于旧制度收益,即个体选择策略增长率为正,反之为负;当 μ = 0时,投融资制度成本就等于投融资制度变迁收益,则制度变迁过程必然处在均衡状态,即渐进演化中的均衡状态。博弈双方的支付如表 1所示。

 

五、结论

本文构建基础设施投融资演化博弈模型,分析了国有资本和社会资本两个博弈主体在基础设施投融资制度变迁过程中的博弈过程,并以公用事业民营化改革为案例进行分析,发现政府管制政策对基础设施投融资制度的演化有着决定性作用。 在基础设施投融资制度演化过程中,博弈双方的行为取决于博弈主体自身的收益,同时管制政策对博弈双方行为有重要影响,在不同的管制程度下,博弈双方会采用不同的对策,这会影响学习方向和演化速度,进而加速投融资制度的变迁和稳定演化。 在内部原动力不变的情况下,如何提高政府的管制水平,促进基础设施投融资制度变迁和稳定是政府管制政策的重要研究方向。

政府管制政策对基础设施投融资制度变迁具有举足轻重的作用,直接影响和决定着基础设施投融资制度演化方向,这在我国基础设施投融资制度发展和演化历史中体现得尤为突础。 基于此,本文研究的政策启示在于:(1)由于基础设施的固有特征和政府管制的作用,政府制定管制政策时,必须根据基础设施投融资制度的现状和现实社会的需求,树立引导基础设施制度科学而合理演化的观念;(2)国有资本和社会资本作为基础设施投融资过程中的两种重要力量,对基础设施投融资制度演化具有重要影响,进而引导基础设施投融资制度演化,并最终达到均衡状态;(3)在政府管制政策中,税收仅仅是直接影响基础设施投融资制度博弈双方的重要手段之一,政府还可以综合运用其他手段,如行政许可、特许经营等方式,间接影响基础设施投融资制度,使其向政府和社会预期的目标演化。

参考文献:

[1]青木昌彦.比较制度分析[m].周黎安,译.上海:上海远东出版社,2001:134136.

[2]盛昭瀚,蒋德鹏.演化经济学[m].上海:上海三联书店,2002.

[3]王辰.基础产业融资论[m].北京:中国人民大学出版社,1998.

[4]谢识予.经济博弈论[m].上海:复旦大学出版社,2002.

[5]史普博 f d.管制与市场[m].余晖,何帆,钱家骏,等译.上海:上海三联书店,1999.

[6]彭秀丽,陈柏福.矿业集群演化与区域协同发展[j].吉首大学学报:社会科学版,2011(2):9499.

[7]weibull j. evolutionary game theory[m]. cambridge, mass: mit press,1995.[8]samuelson. evolutionary games and equilibrium selection[m]. cambridge, mass: mit press,1997.

[9]friedman d. evolutionary game in economy[j]. econometrica,1991,59:637666.

[10]aoki m. organizational conventions and the gains from diversity: an evolution game approach[j]. industrial and corporate change,1998,7:399432.

[11]etsuro s. public capital and economic growth: a convergence approach[j]. journal of economic growth,2001,6:205227.

[12]esfahani h s, ramirez m t. institutions, infrastructure, and economic growth[j]. journal of development economics,2003,4:443477.

[13]范九利,白暴力,潘泉.基础设施资本与经济增长关系的研究文献综述[j].上海经济研究,2004(1):3643.

[14]郭庆旺,贾俊雪.政府公共资本投资的长期经济增长效应[j].经济研究,2006(7):2940.

[15]demetriades p o, mamuneas t p. intertemporal output and employment effects of public infrastructure capital: evidencefrom 12 oecd economies[j]. the economic journal,2000,7:687712.

[16]calderón c, servén l. the effects of infrastructure development on growth and income distribution[r]. bank policy re

上一篇: 采购管理基础知识 下一篇: 发展个体经济的意义
相关精选
相关期刊