博弈最优策略汇总十篇

时间：2023-08-17 17:52:32

序论：好文章的创作是一个不断探索和完善的过程，我们为您推荐十篇博弈最优策略范例，希望它们能助您一臂之力，提升您的阅读品质，带来更深刻的阅读感受。

博弈最优策略

篇（1）

1.引言

美国诺贝尔经济学奖第一人萨缪尔森说过，“要在现代社会做一个有文化的人，你必须对博弈论有大致的了解。”博弈于我们的生活中无处不在，凡是两个及以上的行为人进行决策的过程，都会涉及到博弈，因利益而发生冲突或对抗是人类社会的一个普遍现象。大到国家政治、生死之地、存亡之道，小到人生棋局、日常生活、赌博游戏，谋略型对抗都是最为常见的局势。本文将用博弈论的观点解释商家选址问题，为什么卖同类商品的商家会紧挨着布局。

2.什么是博弈

所谓博弈，就是策略性的互动决策。任何一个博弈，至少包括三个要素：

2.1一组局中人（一个局中人集合）；

2.2局中人可以采取的行动（出招）；

2.3局中人可能得到的赢利。

标准的博弈论，假设人们不会有道德、良心和情感上的考虑，所有的一切都唯一以是否符合自身的利益作为行动选择的标准。任何一个博弈中，每个人的赢利不仅取决于自己如何“出招”，也取决于别人如何“出招”。正是这种战术上的互动，使得博弈充满了趣味、新奇，甚至惊险、刺激。而所谓博弈论，就是一套研究互动决策行为的理论，它实际上也可以看做是一种思维方式，即谋略型思考问题的方式。

3.最优反应与纳什均衡

最优反应是指，给定对手选定一个策略，则我选择某个策略比选择其他策略都要好，那么选择这“某个策略”就是我对于对手选定策略的最优反应。

纳什均衡是这样一种状态，在该状态下每个参与人所采取的策略都是对于其他参与人的策略的最优反应。以二人博弈为例，纳什均衡就是一个策略组合（甲的策略，乙的策略），甲的策略是对于乙的策略的最优反应，而乙的策略也是对于甲的策略的最优反应。

4.商家选址问题

不管我们出门旅游，还是城市购物，您会发现，卖同类商品的卖家经常会紧邻在一起。最大的快餐连锁店肯德基和麦当劳，也经常会集中在一个地点，甚至相连。好多人都会想，这不是增大了自身的竞争吗？用博弈论的观点，我们很容易解释这个问题。

4.1商家选址模型

设两地A、B的距离为1000米，两个商家甲、乙要在此选址开店。设两地间均匀分布着1000名顾客，每个顾客都将在距离自己最近的店铺消费。那么这两个商家将如何布局他们的店铺？

设商家甲将在距离A处x米开店，乙将在距离甲y米出开店，如图1所示：

将该模型中，商家的支付系数越大，则吸引的顾客越多，设计支付矩阵，如表1所示：

由表1支付矩阵，我们可以得出，当x

同理，当x=500米，甲选在中点时，乙的最优策略也是选在中点；

当x>500米，甲选在距离B地较近处时，乙的最优策略是距离甲左侧y米处，所得支付系数为：x-0.5y，当然，y=0时最大，即紧挨着甲的左侧开店；

在上述模型中，两个商家会发现，如果自己摆在中点以左（或右）的位置都是不好的，因为对方可以通过摆在紧邻自己的右（或左）边，即可获得超过1/2的顾客消费者，而自己只能获得少于1/2的顾客消费者。只有自己安置在中点位置，这才是最好的，因为无论对方紧邻自己左边还是右边，自己始终可以得到1/2的顾客，其他位置不可能得到这么多顾客，于是，两个商家就紧挨着将店铺都开在了中点上。

5.现实问题解释

上述的商家选址模型的博弈，还可以用于政治选举中拉票活动的分析，也可以用于解释为什么卖同类物品的商家都紧挨着布局，为什么有麦当劳的地方大多数都会有肯德基。在上述博弈模型中，（中点，中点）是一个纳什均衡，两个商家都已选取了他们的最优反应，甲选择中点是对已选择中点的最优反应，而乙选择中点是对甲选择中点的最优反应。只有在这样的策略组合下，博弈的双方才能得到一个稳定的结果，即达到了纳什均衡。

参考文献：

篇（2）

中图分类号 F830 ， O225 文献标识码 A

1 引言

均值方差投资组合选择的目标是，在终值财富的均值给定时使其方差最小.文献[1]第一次用计量数学方法研究了该问题，并给出了求解投资组合策略的理论框架.近年来，由于人们对经济问题的持续关注，均值方差投资组合选择问题已成为数理金融研究的最热点问题.文献[2]研究了动态多个时代的均值方差组合问题.文献[3]在随机LQ的框架下研究了连续时间均值方差组合问题，通过随机LQ得到了最优策略和有效边界.文献[4]研究了马尔柯夫调制市场上具有资产负债的均值方差组合问题，获得了最优策略和有效边界.

在研究中，发现已有文献对均值方差问题的研究，大多只从投资者的角度出发，获得最优投资组合，而没有考虑市场不确定性对投资者的影响.在实际中，投资者肯定会受到市场不确定性因素的影响，因此从投资者和市场2个角度同时考虑才更符合实际.这就是随机微分博弈问题.随机微分博弈属于博弈论的范畴.博弈论虽然古已有之，但文献[5]的发表才标志着随机微分博弈时代的真正到来.随机微分博弈，假设市场是博弈的“虚拟”对手，通过投资者和市场之间的双重博弈得到最优的投资组合.它如今已成为数理金融学、管理学科的研究热点.文献[6]在跳-扩散金融市场中，利用随机微分博弈论研究了风险最小化的投资组合策略问题.文献[7]利用随机微分博弈论研究了Markov调制模型下的期权估值问题.文献[8]研究了两个具有相关但不同投资机会的投资者之间基于随机微分博弈的最优投资问题.文献[9]在幂效用和指数效用下研究了具有负债的随机微分博弈.文献[10]在幂效用和指数效用下研究了基于再保险和投资的随机微分博弈.

已往文献对随机微分博弈的研究大多数都是基于效用的，很少研究基于均值方差准则的随机微分博弈.基于已往文献对均值方差问题和随机微分博弈的研究，本文尝试把这2个问题结合起来研究.另外，目前资产负债管理已经受到理论界和许多金融机构的重视，有越来越多的学者对其进行研究，这里不再一一列举.因此本文在文献[9]基础上研究了基于均值方差随机微分博弈的资产负债管理.目标是当终值财富的均值一定时，在市场最坏的情况下，投资者选择一个最优的投资策略最小化终值财富的方差.应用线性二次控制理论求得了最优投资策略、最优市场策略和有效边界，并分析了负债对它们的影响.本文的创新点是：在资产负债管理中引入了均值方差随机微分博弈.通过本文的研究在实践上可以指导投资者在具有负债和市场出现最坏情况下，选择恰当的投资策略使自身获得一定的财富而面临的风险最小；同时在理论上丰富和发展了资产负债管理和随机微分博弈.

2 模型设定

2.1 金融市场

参考文献

[1] H M MARKOWITZ. Portfolio section [J]. Journal of Finance， 1952， 7（1）：77-91.

[2] D LI， W L NG. Optimal dynamic portfolio selection： multiperiod meanvariance formulation [J]. Mathematical Finance ， 2000， 10（3）：387-406.

[3] X ZHOU， G YIN. Markowitz’s meanvariance portfolio selection with regime switching：a continuoustime model [J]. SIAM Journal on control and optimal， 2003， 42（4）：1466-1482.

[4] S X XIE. Continuoustime portfolio selection with liability and regime switching [J]. Insurance： Mathematical and Economics， 2009， 45（1）：148-155.

[5] R ISAACS. Differential Games [M]. New York：Wiley，1965.

[6] S MATARAMVURA， B OKSENDAL. Risk minimizing portfolios and HJBI equations for stochastic differential games [J]. Stochastics An International Journal of Probability and Stochastic Processes， 2008， 4（3）： 317-337.

[7] T K SIU. A game theoretic approach to option valuation under Markovian regimeswitching models [J]. Insurance： Mathematics and Economics， 2008， 42（3）：1146-1158.

[8] S BROWNE. Stochastic differential portfolio games [J]. Journal of Applied Probability， 2000， 37 （1）：126-147.

篇（3）

创新是企业永续发展的源泉。企业技术创新战略模式的选择是技术创新活动的起点和创新绩效的根本保证。在创新过程中，企业面临着竞争对手和潜在竞争者的威胁，其技术创新战略模式的选择本质上就是多方博弈的结果。实践证明，中小企业技术创新战略模式的选择要根据外部环境和企业的内部条件，特别是企业自身的技术储备和技术创新能力，才能实现技术创新战略的成功实施从而提高企业的竞争优势。

一、企业技术创新战略模式的基本类型

技术创新战略模式是指企业对技术创新经济活动的带有全局性、长远性和方向性的谋划。依据技术来源技术创新战略模式主要划分为自主创新和模仿创新。

1.自主创新是指企业依靠自身的努力产生核心技术或概念的突破，并在此基础上完成创新的后续环节，实现科技成果商品化的创新行为。

自主创新战略模式首先强调技术突破的内生性，即企业在研究开发方面的核心主导技术必须是企业依靠自身的技术力量而获得的。其次，自主创新战略模式强调技术与市场开发的率先性，第三，自主创新战略模式强调知识和能力支持的内在性。在研究开发、设计、生产、销售等创新链的每一环节都需要有相应的企业自身积累的知识和能力支持。

2.模仿创新是指企业通过引进、购买等合法手段，吸收和掌握率先创新者的核心技术和技术诀窍，充分吸取率先者成功的经验和失败的教训，在此基础上对率先者技术进行二次创新，进一步开发和生产富有竞争力的产品，参与市场竞争的一种创新行为。模仿创新决不是一种纯粹简单的照搬行为和拿来主义，而属于一种渐进型的创新行为。

二、企业技术创新战略模式选择的博弈分析

在博弈论中，从参与人对有关其他参与人(竞争对手)的特征、战略空间及支付函数所具有的知识角度划分，博弈可分为完全信息博弈和不完全信息博弈。本文应用完全信息静态博弈中最优策略均衡和重复剔除的最优策略均衡模型，对企业技术创新战略模式的选择进行博弈分析。

1.技术创新战略模式选择的最优策略均衡分析

由于每个参与人的效用(支付)是博弈中所有参与人的战略的函数，因此每个参与人的最优战略选择依赖于所有其他参与人的选择。这种不论其他参与人的策略如何，能够使自己的支付(效用)对自己最为有利的策略叫最优策略。

假定A、B为同一行业并生产同类产品的两企业，同时都面临着是否进行自主创新的战略选择，技术创新战略模式的支付短阵如表1：

表1 技术创新战略模式选择的支付矩阵（I）

表1矩阵中的数值表示A、B两企业分别选择对应技术创新模式的利润水平。根据最优策略的定义描述，企业A的最优策略为自主创新的战略模式。因为对企业A来说，针对企业B的两种策略，假如B选择自主创新，A选择自主创新战略模式时利润为10个单位，而A选择模仿创新只有6个单位的利润；假如B选择模仿创新，A选择自主创新时利润为15，而选择模仿创新时利润只有10单位，所以A当然选择自主创新的战略模式。即不论B选择哪种策略，自主创新是A的最优策略。同理，企业B的最优选择也是自主创新的战略模式。因此上述支付矩阵中，支付组(10．5)构成了一博弈的均衡点，从而构成了最优策略均街。即A、B两企业均选择自主创新的战略模式。

该博弈模型的均衡解是（自主创新，自主创新），在知识产权制度和市场竞争较完善的情况下，A、B企业都有自主创新的压力和动力，创新行为得到有效激励。假定A、B两企业规模、市场竞争实力等相当，则博弈双方的市场份额基本保持不变，但产品附加值得以提升，博弈双方的收益和利润率提高，能够在整个社会范围内形成鼓励创新的氛围，从而促进社会整体技术水平和技术创新能力的提升。

2.重复剔除的最优策略均衡分析

最优策略均衡是一种理想情况，在现实企业市场竞争中,博弈双方的实力有时有较大的差异。如规模较小的企业市场份额小，创新效率低，面临的创新风险大，创新的动力则明显不足，下面运用“智猪博弈”（Boxedpigs）加以说明。

在“智猪”博弈中，有一大一小两只可以做出理性选择的智猪在一个食槽进食，食槽有一个电钮，每按一次电钮可出8单位食物，但按电钮要付出2个单位的成本。大猪和小猪都有两种策略可供选择：一是等待对方按电钮；二是自己主动按电钮；针对两种策略，可能出现四种不同的结果，各自得到的收益不同。

应用该模型分析，假定A为大企业，即“智猪博弈”中的大猪，B为小企业，即“智猪博弈”中的小猪，此时就会出现智猪博弈的行为，是否“按电钮”则表示企业是否选择自主创新行为，矩阵中的数值则表示扣除自主创新和模仿创新成本后企业的创新收益。博弈支付矩阵见表2。

表2技术创新战略模式选择的支付矩阵（II）

显然，这个博弈没有最优策略均衡，尽管“模仿创新”是小企业的最忧策略，但大企业没有最优策略，其最优策略依赖于小企业的策略。我们用“重复剔除严格劣战略”的思路来求出均衡解。首先找出参与人的劣策略，并除去这个劣策略，重新构造一个不包含这个劣策略的新的博弈；然后再剔除新博弈中的劣策略，直至唯一的策略组合，即为均衡解。称之为“重复剔除的最优策略均衡”(Iterated dominance equilibrium)。

对小企业而言，给定大企业选择“自主创新”，小企业选择自主创新时，得到1单位收益，而选择“模仿创新”则得到4个单位收益；给定大企业选择“模仿创新”，小企业选择“自主创新”，得到－1个单位收益，而选择模仿创新则得到0个单位收益。因此不管大企业选择何种策略，小企业的理性选择都是“模仿创新”。在剔除小企业“自主创新”这个策略后的新博弈中，小企业就只有一种策略即“模仿创新”。此时“模仿创新”已成为大企业的劣策略，再剔除，剩下的惟一策略组合(自主创新，模仿创新)，即矩阵中的（2，4），就是这个博弈的均衡解。该博弈模型表明，如果小企业和大企业都是理性的，则小企业选择模仿创新战略模式，而大企业的最优策略只能选择自主创新创新的战略模式。

三、中国中小企业技术创新战略模式的现实选择

1.中小企业及其技术创新现状

中小企业是一个企业规模形态的概念，是指相对于大型企业而言，一些规模较小或处于创业阶段和成长阶段的企业。我国中小企业具有数量众多，投资主体多元化，产业分布面广，目前我国中小企业总数占到企业总数的99.6%，创造的最终产品和服务价值占中国国内生产总值的58.5%，上交税收占48.2%。中小企业成为创造社会财富和提高整个社会财力的主体之一。

虽然我国部分中小企业的技术创新具有创新速度快、创新效率高等一些优势，但总体来看中小企业技术创新普遍存在着技术创新人才匮乏、创新资金投入不足、技术设备落后、以及一些宏观政策和法律环境等许多制约因素。2001年青岛市中小企业创新状况调查表明，中小企业科技人员的比例较低，而企业研发人员比重更低。近有70%的企业从事R&D的人员占据科技人员总数的5%以下。有关调查表明，我国企业平均的R&D经费投入强度平均为0.5%，其中大企业R&D经费投入强度是中小企业的两倍多。可以看出，我国中小企业技术创新能力和技术水平与大企业相比有着一定的差距，同时在市场竞争中，大企业整体在规模、市场份额等方面也表现出更强的竞争优势。

2.中国中小企业技术创新战略模式的现实选择

基于上述的博弈模型分析，可以给我们深刻启示：目前在提倡企业自主创新的同时，不能一概而论，并不是所有类型的企业都适合进行自主创新。同时鉴于对中小企业技术创新现状分析，笔者认为，现阶段我国中小企业技术创新战略模式的现实选择应以以模仿创新为主，充分利用外部创新资源，通过合作创新，提高中小企业技术水平和企业创新能力，最终实现创新的最高境界――走自主创新之路。

日本、韩国的经济发展、三洋、联想等企业的成功经验已证明，模仿创新是一种广泛采用的技术创新模式。选择模仿创新战略模式的企业在技术方面，不做原理技术的开拓探索者和率先使用者，而是做有价值的新技术的积极跟随学习者，将自己的研发活动集中在特定的领域，以最低的成本获取最高的产出。从市场开拓方面来说，模仿创新企业可以充分利用并进一步开发率先创新者的市场领域，享受自主创新者开辟的新市场投入的诸多外溢效应，最大程度地避开了市场“沉默期”，减少新市场开发初期需求和市场行为的不确定性风险。

模仿创新是以模仿为基础的一种创新活动，目的在于通过增加企业的知识储备和技术积累，实现二次创新。但模仿创新有也其局限性，如模仿创新的时滞性，由于模仿创新者产品的推出较率先创新者在时间上有一定的延迟性，因此，在这段时间内，可能有大量其它模仿者进入该产品领域，往往市场竞争会越来越激烈；模仿创新的被动性，模仿创新者在技术上易受制于人，难以在市场竞争中占据主动地位，甚至会陷入技术追赶陷阱不能自拔。因此从长远考虑，我国中小企业技术创新战略模式应尽早从模仿创新过渡到自主创新，自主创新是企业技术创新的最高境界，也是中国中小企业提升自主创新能力和增强企业活力的源泉。

参考文献：

[1]银路:技术创新管理[M].北京:机械工业出版社, 2004 70-83

[2]刘东:微观经济学新论[M].南京: 南京大学出版社,1998 27-36

篇（4）

一、引言

企业作为一种以盈利为目的的经济组织，在环境问题日益严重的今天，如何使他们在获取利益的同时能更多更好的承担环境责任成为社会的关注焦点。而金融行业作为国家经济发展的命脉，它也越来越多的承担环境责任。2002年10月，由世界银行下属的国际金融公司和荷兰银行提出了赤道原则（the Equator Principles，简称EPs），它将实行赤道原则的银行在项目投融资中的环境与社会的标准基本确定，为金融企业在承担环境责任和维持盈利之间平衡点的寻求提供了支持。

二、利益相关者视角下联盟博弈模型

利益相关者理论从企业的角度来考察企业与其利益相关者之间的关系，在环境问题逐渐突出的今天，金融企业在其承担环境责任和维持盈利水平之间的平衡点，是它们与其利益相关者相互博弈的结果。从联盟博弈的角度，以金融企业的利益相关者为参与人，对它们在金融企业承担环境责任时进行的行为进行博弈分析，以期证明博弈均衡的存在，即金融企业在承担环境责任和维持盈利之间的平衡的存在性。

（一）金融企业利益相关者分类

在利益相关者理论和在金融企业承担适度环境责任的条件下，参考徐彻在《基于利益相关者视角的企业社会责任管理研究》一文中对于企业的利益相关者的分类，我们将金融企业的利益相关者分为支持型利益相关者、威胁型利益相关者、利弊兼有型利益相关者、无关紧要型利益相关者这四类。

（二）联盟博弈模型的构建[1]

1、参与者

A――支持型利益相关者

B――威胁型利益相关者

C――利弊兼有型利益相关者

D――无关紧要型利益相关者

A：支持型利益相关者――在承担环境责任时，对金融企业造成正面影响力大而对企业负面影响力小。比如说：公司股东、新能源企业、绿色投资策划等等。对于这类利益相关者，金融企业要采取参与的战略，使其能够参与到金融企业承担环境责任的运营中来，让双方都能获得利益。

B：威胁型利益相关者――在承担环境责任时，对金融企业造成正面影响力小而对企业负面影响力大。比如说：传统的能源消耗型企业或污染型企业等。对于这类利益相关者，金融企业要采取防范的战略，尽量避免它们采取一不利于金融企业承担环境责任的措施，最好是能将其转换成其他类型的利益相关者。

C：利弊兼有型利益相关者――在承担环境责任时，对金融企业造成正面影响力大而对企业负面影响力大。比如说：金融企业的顾客等等。对于此类利益相关者，金融企业要采取合作的战略，使其能尽量采取对金融企业承担环境责任有利的行动而减少对其的不利影响。

D：无关紧要型利益相关者――在承担环境责任时，对金融企业造成正面影响力小而对企业负面影响力大。比如说：非以上举例的利益相关者等等。对于这类利益相关者，金融企业要采取监控的战略，因为它们有可能会向不利于金融企业承担环境责任的利益相关者类型转化，这也是金融企业要极力避免的情形。

2、参与者的策略及其相应支付

（1）A――支持型利益相关者

：积极行为；消极行为和不行为；对应的支付为（5，-1）

（2）――威胁型利益相关者

：积极行为；：消极行为和不行为；对应的支付为（1，4）

（3）――利弊兼有型利益相关者

：积极行为；：消极行为和不行为；对应的支付为（3，1）

（4）――无关紧要型利益相关者

：积极行为；：消极行为和不行为；对应的支付为（4，0）

其中，以上所说的积极行为是指有利于金融企业承担适度环境责任的行为，消极行为是指不利于金融企业承担适度环境责任的行为，不行为是指对于金融企业承担适度环境责任不作为的行为。

为使以上假定能更加符合金融企业承担环境责任的现实，考虑到不同类型的利益相关者的不同行为会产生不同的效力。同时结合前面金融企业利益相关者的分析矩阵中不同利益相关者对金融企业的不同影响力，我们假定以上参与者的策略若出现，所有参与者支付减去3；若出现，所有参与者支付减去1；若出现，所有参与者支付减去2。

3、联盟博弈矩阵及其最优策略分析

在支付矩阵中，是所有参与人的集，是联盟集，IS是指除了联盟以外的剩余参与人集，V是对策的特征函数，MN1表示各行的最小值，表示各列的最大值。为了计算特征值，当矩阵的MN1中的最大值与中的最小值相等时，根据矩阵的最大最小值原理，该支付矩阵就构成了一个鞍点，该鞍点的支付是对策的最优解；当矩阵的MN1中的最大值与中的最小值不相等时，根据策略的优超关系来确定最优策略。

（1）单人联盟博弈支付矩阵和最优策略

在金融企业承担适度环境责任时，通过单人联盟博弈支付矩阵和最优策略分析可知：不论金融企业的支持型利益相关者选择积极行为还是消极行为和不行为，威胁型利益相关者、利弊兼有型利益相关者、无关紧要型利益相关者的最优策略都是消极行为或不行为。因此，在单人联盟背景下，金融企业承担适度环境责任的最优策略是支持型利益相关者选择积极行为。

（2）双人联盟博弈支付矩阵和最优策略

在金融企业承担适度环境责任条件下，双人联盟博弈支付矩阵和最优策略分析表明：金融企业的利弊兼有型利益相关者和无关紧要型利益相关者的行为具有随机性，但其支持型利益相关者会选择积极行为，威胁型利益相关者选择消极行为或不行为。因此，在双人联盟背景下，金融企业承担适度环境责任的最优策略是支持型利益相关者会选择积极行为，威胁型利益相关者选择消极行为或不行为。

（3）三人联盟博弈支付矩阵和最优策略

在金融企业承担适度环境责任背景下，通过进行三人联盟博弈支付矩阵和最优策略的分析，我们可以知道：联盟之间的策略选择具有相对性，当一个联盟选择消极或破坏性的政策时，另一个联盟会选择积极的策略，说明在给定对方行为选择的情况下，自身的策略选择是唯一的。

三、总结

通过借助于金融企业利益相关者的分类，和联盟博弈模型的构建和分析，我们可以知道在金融企业选择承担适度环境责任行为时，各类参与者存在最优策略和博弈均衡。所以，金融企业在承担环境责任和维持盈利之间的平衡是存在的。

根据以下三个博弈矩阵和特征函数的定义：

因此，这是一个实质性的博弈，并且存在三方联盟优于双方联盟，双方联盟优于单人联盟的情形[1][2]。所以，金融企业在承担环境责任和维持盈利之间的平衡不仅是存在的，而且存在最优情形。

通过以上博弈均衡结果分析，目前我国金融企业承担环境责任仍存在以下的不利因素：第一，在各种联盟博弈中，对于支持型利益相关者来说，它们的最优策略均是积极行为，但在实际中，因为要预先承担支付成本、回收期限等风险，不会很主动的选择采取积极行为。第二，在双人博弈中，就威胁型利益相关者的利益来说，它们的最优策略是选择消极行为或不行为，但这对于承担环境责任的金融企业来说，势必存在更多的阻碍因素。第三，在三人博弈中，要在给定对方行为选择的情况下，自身的策略选择才才是唯一的，这让各个利益相关者的行为选择充满着随机性，不利于金融企业制定合理的方案来承担环境责任。

四、对策建议

通过以上分析，并结合我国金融企业承担环境责任的现状，并进一步促进我国金融企业更好的承担环境责任的平衡性发展，现提出以下对策建议：

第一，政府应加强相关支持法律制度的建设和对我国金融企业承担环境责任承担的规范监督作用。在以上博弈模型分析中，我们可以知道金融企业的利益相关者对于金融企业承担环境责任行为的选择有着影响。政府可以利用其对金融企业及其利益相关者的强制力，对金融企业承担环境责任提供良好的外部环境。[4]

特别是在双人博弈和三人博弈中，对于威胁型利益相关者和利弊兼有型利益相关者的最优策略选择（消极行为或者不行为），政府可以采取更强有力的手段，比如说制定合理有效的法律制度和奖惩措施、建立监督机构、加大税收力度等，增加它们采取积极行为的支付水平，并且弱化它们的不利影响，这也是金融企业更好的承担环境责任的核心所在。

第二，我国金融企业应加强其在市场表现中的运营战略选择。联盟博弈的结果让我们知道三方联盟要优于单人和双人联盟，这使得金融企业在承担环境责任时可选择战略的影响因素更多，在一定程度上提高了金融企业在承担环境责任时的运营风险，但也增加了它们的盈利机会。所以，金融企业在其运营中，对于不同类型的利益相关者要采取不同的战略，比如说支持型的战略是参与、威胁型的战略是防范、利弊兼有型的战略是合作、无关紧要型的战略是监控等，这将更有利于我国金融企业承担环境责任平衡性的发展。

第三，加强我国金融企业自身对承担环境责任行为的创新发展。对于金融企业自身来说，它们的最优策略是采取积极行为。它的积极行为主要可以从内部和外部来说，内部积极行为是指从企业内部文化、企业形象等方面采取的有利于承担环境责任的行为，外部积极行为是指金融企业在业务拓展和市场开发等方面有利于承担环境责任的行为，比如说投资风险比较大的新兴绿色产业或方案、碳金融市场的开发等。[5]

参考文献

[1]淮建军,刘新梅,雷红梅.我国房地产市场管制中四人联盟与对抗的博弈分析[J].系统工程,2007,25(12).

[2]李胜.两型社会环境治理的政策设计――基于参与人联盟与对抗的博弈分析[J].财经理论与实践,2009,30(161).

[3]张维迎.博弈论与信息经济学[M].上海三联书店,上海人民出版社,2006.

[4]吴椒军,张庆彩.企业环境责任及其政策法律制度设计[J].学术界,2004(6).

[5]冯蕾.基于低碳经济视角的企业环境责任研究[J].长春师范学院学报(人文社会科学版),2010,29(5).

篇（5）

一、前言

大学生就业一直是高等教育界乃至整个社会共同关注的话题。近几年我国经济进入新常态，在经济下行压力和产业结构调整的大背景下，就业压力问题更加突出，结构性矛盾更加凸显。与此同时，高校毕业生人数逐年增加，2017年高校毕业生将达795万，较去年增加30万人数，这在一定程度上导致我国当前就业形势更加严峻和复杂。基于此，本文借鉴“产学研合作”研究的方法，提出大学生就业UIG合作机制，并进一步探讨了UIG合作机制中相关利益主体的博弈分析，试图缓解当前就业难问题。

二、大学生就业UIG合作创新体系中的利益主体

政府在大学生就业UIG合作过程中发挥宏观指导作用，政府主要通过制定相关方针政策起作用，它是引导大学生就业的重要力量。就业政策就像是“看得见的手”，不仅可以弥补劳动力市场这只“看不见的手”的不足，而且能够引导和促进“看不见的手”，在大学生就业过程中更好发挥作用。政府具有资金和政策的优势，政府应制定相应的政策法规，地方各级政府也必须高度重视，发挥政府的组织优势、资源调控优势、公共管理优势，形成政府、高校和企业的协同运作，在税收、信贷、经费等方面积极发挥调节作用。企业在大学生就业UIG合作具有实践作用。企业作为人才的需求方，应利用自身对市场的联系，及时反馈市场对人才的需求。这样，高校才能快速调整培养模式，向企业输送急需人才。此外，企业应为毕业生提供实习平台，参与人才培养的过程来，这样培养的人才，有助于企业未来的发展。高校就业率是评价一个学校的标准，社会对就业率的强势关注在一定程度上促进了高校对大学毕业生就业工作的重视。高校作为劳动力市场的供给方，每年向企业和政府部门培养和输送大批优秀人才，应该打破传统人才培养模式，在产学研合作的基础上，促进校企合作培养人才，实现企业需求与人才培养之间“零距离”，社会需求和岗位要求“零距离”，实施教育与上岗就业之间“无缝连接”，结合市场需求、企业要求和大学生自身需求，积极推进人才教育模式的革新，进行顶层设计。高校学科专业结构需要同社会、经济发展规律相适应，根据不同的办学层次、类型和定位，形成特色专业，使培养的学生能够符合现有市场的要求。政府也应该在高校教育体制改革上给予一定的支持，确保新的培养模式的能够进行。其次，针对大学毕业生，高校就业指导需要有效“补位”。高校应促进校企合作，让企业加入高校人才培养中来，利用企业的资源和平台，从而实现毕业生有效、快速的就业。

三、大学生就业UIG合作创新体系的博弈分析

政府、企业、高校三者之间的利益既存在一定矛盾，也有协调的一面。由于涉及政府、企业、高校三者之间的利益博弈，为简单起见，本文在“经纪人”和不完全信息假设条件下，采用博弈（EvolutionaryGame）方法，分别讨论政府与企业、企业与高校、高校与政府之间的利益博弈，以此来解释大学生就业UIG合作创新体系的可行性。

（一）政府与高校的利益博弈分析

政府与高校博弈的收益矩阵如表1所示。通过对政府与高校博弈的收益矩阵的分析可知，对高校而言，无论政府选择“支持”或者“不支持”策略，“作为”是高校的最优选择（理由：1＞-1；6＞3）。同理，对政府而言，无论学校选择“作为”或者“不作为”策略，政府都会选择“支持”策略。因此，策略组合（作为，支持）是该博弈的纳什均衡，此时，双方也达到帕累托最优状态，即最优均衡策略，其均衡报酬为（6,4）。政府和高校的博弈过程和结果表明，在大学生就业UIG合作方面，政府与高校的利益目标基本一致，政府关注大学生就业问题，有利于社会的稳定和发展，而高校重视毕业生就业率对自身以后的招生和长期发展十分有利。因此，政府和高校会达成共识，共同努力，来解决大学生“就业难”问题，从而实现双赢的效果。

（二）高校与企业的利益博弈分析

高校与企业博弈的收益矩阵如表2所示.通过对高校与企业博弈的收益矩阵分析可知，对企业而言，无论高校选择“作为”或者“不作为”策略，“配合”是企业的最优选择（理由：3＞1；5＞2）。同理，对高校而言，无论企业选择“配合”或者“不配合”策略，高校都会选择“作为”策略。因此，策略组合（配合，作为）是该博弈的纳什均衡，此时，双方也达到帕累托最优状态，即最优均衡策略，其均衡报酬为（5,4）。企业和政府的博弈过程和结果表明，在大学生就业UIG合作方面，企业与高校的利益目标基本一致，企业需要符合自己发展的人才，而积极与高校交流，有利于企业科研成果转化为产品，是企业在市场立于不败之地。高校重视毕业生就业率对自身以后的招生和长期发展十分有利，而与企业合作，可以共享其资源和平台，将有利于高校科研的发展。因此，政府和高校会达成共识，共同努力，来解决大学生“就业难”问题，从而实现双赢的效果。

（三）企业与政府的利益博弈分析

企业与政府博弈收益矩阵如表3所示。通过对企业与政府博弈的收益矩阵分析可追，对政府而言，无论企业选择“配合”或者“不配合”策略，“支持”是政府最优的选择（理由：1＞-2；6＞1）。同理，对企业而言，无论政府选择“支持”或者“不支持”策略，企业都会选择“配合”策略。因此，策略组合（支持，配合）是该博弈的纳什均衡，此时，双方也达到帕累托最优状态，即最优均衡策略，其均衡报酬为（6,5）。企业与政府博弈的过程与结果表明，在大学生就业UIG合作方面，企业与政府的利益目标基本一致，企业一方面能够招聘到符合自己发展的人才，另一方面参与大学生就业UIG合作，在一定程度上可以获得政策支持，这有利于企业的长期发展，而政府通过在大学生就业UIG合作发挥积极作用，可以降低社会失业率，有利社会的稳定和发展。因此，企业和政府会达成共识，共同努力，来解决大学生“就业难”问题，从而实现双赢的效果。

四、研究结论

在大学生就业UIG合作过程中，政府、企业和高校三者既有协调的方面，也存在一些矛盾，总体上，三者之间利益目标基本一致。本文基于博弈论的视角，利用数值模拟讨论了三者在大学生就业UIG合作过程的利益博弈，得到其最优策略，从博弈结果可知，大学生就业UIG合作在理论上具有很强的可行性，是一种多方“共赢”的模式。

参考文献：

篇（6）

一、博弈论下的货币政策博弈分析

货币政策博弈分析即利用博弈论方法分析宏观金融博弈问题。因而,博弈论是宏观金融博弈分析的方法论基础。纳什(Nash) 在1950年和1951年发表了两篇关于非合作博弈的重要文章,从一般意义上定义了非合作博弈及其均衡解,并证明了均衡的存在,基本奠定了现代非合作博弈论的基础。因而,该均衡以后被博弈理论称为“纳什均衡”。即是指由所有的参与者的最优策略组成的策略组合。在这种策略组合中,给定其他参与者的策略,没有任何单个参与者有积极性选择其他策略,也就没有人主动去打破这种均衡。相反如果一种均衡或制度安排,如果不是一种纳什均衡,即不是所有参与者的最优策略组合,那么,这种组合就不能成立或者至少不能持续。合作博弈强调团体理性、效率和公平。而非合作博弈强调个人理性、个人最优决策。其结果可能是有效的,也可能是无效的。现实中,大量的经济博弈问题是非合作博弈。非合作博弈理论的发展为其在经济研究中的广泛应用创造了条件并推动了合作博弈的进一步发展。

纳什均衡假定博弈参与者在选择自己的策略时,把其他参与者的策略当做给定的。而不考虑自己的选择如何影响博弈对手的选择。这个假定在静态博弈下是成立的,但在动态博弈下却不成立。在静态博弈中,所有参与者同时行动,不可能在自己采取行动前观察到其他人的行动,因而就无暇反应。但在动态博弈中,一方行动在先,另一方行动在后,后者自然会根据前者的选择而调整自己的选择,前者自然会理性地预期到这一点,所以不能不考虑自己的选择对其他参与者的影响,由于决策者不考虑自己的选择对他人选择的影响,纳什均衡允许了不可置信威胁的存在。1965年泽尔腾(Selten) 将纳什均衡的概念引入了动态分析,定义了“子博弈精练纳什均衡”的概念,将不可置信的威胁策略从纳什均衡中剔除出去,从而解决了完全信息动态博弈均衡求解问题,将不可置信的策略变成可置信策略的行动,即经济学中的“承诺行动”。如果当事人不履行其承诺时将为之付出相应的代价,这种承诺就是可置信的,否则就是不可置信的。该概念的提出,对利用博弈论方法研究货币政策问题奠定了基础。

二、纳什均衡在货币政策效应中的应用

在理性预期条件下,我们考察一期的货币政策博弈均衡。假定中央银行的目标成本函数为:

其中:π为通货膨胀率；y为实际经济增长率；y*为中央银行期望的经济增长率。

根据卢卡斯供给曲线:y=yn+α(π-πe), α＞0

其中:ynt为潜在经济增长率；πet为公众的预期通货膨胀率； α表示非预期通膨胀对经济的影响程度,即总供给曲线的斜率。

假定α=1,即:y=yn+(π-πe)

同时假定中央银行对货币增长有完全的控制能力,公众的预期完全理性；不存在真实供给冲击和货币流通速度变化的影响,通货膨胀率π等于货币供给增长率m,通货膨胀预期πe等于货币供给增长率me；中央银行期望的经济增长率与潜在的经济增长率相等。有:

令公众的目标函数为避免由于预期误差导致的通货膨胀之害,因此可把公众的效用函数定义为:U＝-(m-me)2

篇（7）

中图分类号：TM925.07 文献标识码：A 文章编号：1009-914X（2015）05-0282-01

1 引言

近年来，随着网络应用复杂度的不断提高，网络攻击方法层出不穷。各种网络攻击方法中，木马攻击是最具危险的手段之一。一旦计算机系统被种植木马，就将长期潜伏，对系统的保密性、可用性造成致命伤害。本文提出了一种在新型木马检测系统中，基于不完全信息博弈理论的计算机木马检测策略选择方法，为解决准确检测木马问题提供了新的思路。

2 计算机木马检测系统构成

本文成果应用的计算机木马检测系统由主机信息检测模块、网络信息检测模块和智能决策模块三个模块组成。

主机信息检测模块对主机的文件、进程、网络连接、加载文件等信息结合白名单检测、端口关联等检测方法，按照检测策略进行检测。网络信息检测模块基于网络协议的分析，对宿主主机发出的数据包进行层层剥离，准确获取数据包信息，同时根据各种信息特征进行统计，从中发掘可疑网络流量信息。智能决策模块将网络和主机获取的数据根据攻击特征进行逐项分析，然后对分项结果关联形成检测结论，最终显示给用户。

3 木马检测与反检测博弈行为分析

3.1 木马反检测的一般方法及分析

木马必须的功能包括隐蔽启动、网络外联。木马反检测方法大体有隐藏进程、隐藏模块、隐藏网络连接、隐藏文件、隐藏服务、隐藏启动项、穿透防火墙。

3.2 木马检测的博弃行为

在木马检测过程中，自始至终存在着对抗双方检测与反检测的博弈。木马检测系统要制定应对不同等级木马的检测策略。从检测到的可疑程序中将这些正常程序甄别出是系统的重要工作。在计算机被种植木马的环境下，检测工作是一个双方不完全信息动态博弈的过程，检测系统必须逐步寻找最优策略，以达到检出目的。

3.3 不完全信息动态博弃

根据随机博弈的思想，检测系统的每一个部分检测的结果概括成一种“状态”。双方在该部分的收益取决于各自采用的策略。通常，一个两方随机博弈用如下七元组描述（S，，， Q，，，β），其中：

一般的木马检测博弈过程如下：在某个检测模块工作的时刻t，博弈处于状态∈S。，木马从反检测策略集中选择策略，，系统从检测策略集中选择策略，然后木马得到一个收益= （，，），系统得到收益= （，，），然后博弈进入第二个状态∈S。

根据不完全信息动态博弈理论，当期收益不仅取决于当前状态和这种状态下木马与检测系统选择的策略，还取决于双方针对对方类型所做的概率分布判断。根据随机博弈理论，木马的收益应该为= （，，），假设此时木马对不会被检测出的概率判断为μ，根据不完全信息博弈理论，其收益为= （，，，μ），同理，假设此时检测系统对木马是否判断出被检测出的概率判断为λ，此状态下其收益为= （，，，λ）。

4 基于动态博弈的木马检测策略选择

木马检测环境下，针对一个特定的状态，策略选择过程为：

（1）首先确定检测系统和木马的策略集；

（2）当前状态下，确定针对检测系统不同的策略，木马对被检出的概率μ分布；

（3）根据木马实现技术水平的高低确定木马类型，然后检测系统确定木马类型的概率分布ν，在此基础上根据木马在当前状态下采取不同的策略下，确定木马判断出被检出的概率分布λ；

（4）确定木马的收益函数。为了长时间牢固控制主机（I），木马需具备反检测手段（T），由此确定木马的线性收益函数为：=（I-T）（1-μ）（1）

（5）确定检测系统的收益函数。检测系统的收益函数与木马反检测水平（T），检测系统获取的信息（），木马判断检测系统会采取的检测方式信息（）相关，由此确定检测系统的线性收益函数为：=（γI-T-）（1-γ）（2）

假设检测系统对木马类型的判断概率是，则对n类木马，系统在该状态下的收益为：

（6）计算纳什均衡解，确定木马检测策略。要达到纳什均衡解必须满足两个条件：检测系统采取的策略要实现自己的收益最大化；要使木马的收益尽可能高。

成立的策略'为其最优策略，其中表示确定检测系统所有策略下的最大收益，'为选择该策略下的木马的判断概率。

对检测系统而言，使得条件：

成立的策略'为其最优策略，其中'表示系统在木马自防护策略下的最大收益，'为选择该策略下的系统的检出判断概率。

5 示例与仿真

以主机信息检测部分为例，使用简化策略进行仿真分析。

（1）确定双方策略集

在主机信息检测状态下，检测系统的策略集。

（2）确定木马对检测系统策略类型评估的概率μ分布

根据木马反检测能力的高低分为三类，高级木马，中级木马，和初级木马，根据经验，木马对检测系统策略评估正确的概率μ分布如表1。

（4）确定木马在当前状态下的收益

根据经验确定控制主机I值，反检测T值表。

（6）计算纳什均衡解

木马的最优策略是；根据式（3）及表3，检测系统的最优策略是。

6 结论

木马检测策略是木马检测系统的关键之一。本文提出了一种基于不完全信息动态博弈的木马检测策略选择的方法，该方法基于对抗的动态性及对抗双方信息不完全的特点，把信息获取和不完全信息动态博弈有机结合，示例与仿真初步验证了模型的有效性。

参考文献

篇（8）

在我国农业产业化过程中订单农业是居于主要形式的，其未来的发展对我国农业产业化进程至关重要。在订单农业中最为关键的就是农户与农业加工企业间的关系，“农+企”的关系构成了订单农业的核心。目前在我国订单农业中农户与农业企业间的关系并不是很稳定的，在一定范围中存在着履约率低的现象，这严重束缚了订单农业在我国的进一步发展。

一、订单农业中“农+企”关系的现状介绍

订单农业目前出现了履约率较低的现象，究其原因是复杂的。主要表现在：当原料市场价格高的时候，哪家企业出的价格高，农民就把农产品卖给那家企业，不履行合同中规定的义务，进而会出现几家企业甚至地区间企业抢购原料的无序竞争状态；当原料市场价格低的时候，企业又不愿敞开收购或压级压价收购，变相不履行合同，造成订单农业执行难，产生大量的经济纠纷，束缚了当地订单农业的进一步发展。

二、订单农业中“农+企”关系矛盾的博弈分析

我们就以农产品加工企业和当地的种植农民之间的关系作为例子，运用博弈论的知识来对此加以分析：假定在这场博弈中有两个博弈的参与者，一个是种植农户，简称博弈参与者A；另一个是当地收购并且加的企业，简称博弈参与者B。同时假定在这个博弈过程中双方享有的信息是平等的，不存在任何一方占有信息优势。对于参与者A和B来说，都有两种可供选择的博弈策略：履约和不履约。由此，可得关于A,B博弈参与者的收益矩阵：（见表1）

表1 A、B博弈参与者的收益矩阵（注：b>a>d>c）

由上表中关于博弈参与者A，B的收益矩阵可知，当博弈参与者B遵守合同时，A遵守合同获得的收益为a，不遵守合同获得的收益为b，因为b>a，在此情况下A作为一个理性的人来讲会选择不遵守合同；当博弈参与者B不遵守合同时，A遵守合同获得的收益为c，不遵守合同获得的收益为d，因为d>c，在此情况下A作为一个理性人会选择不遵守合同。这样，对于博弈参与者A来讲，不管博弈参与者B采取何种博弈策略，它的最优策略是不遵守合同较为有利。同样，对于博弈参与者B而言，最优策略也是不遵守合同较为有利。

综上，在该博弈里，对于博弈的参与双方而言，各自的最优策略都是不遵守合同，这样得到一个纳什均衡博弈结果，此时双方的收益为(d,d)。由收益矩阵可知，该博弈的最优均衡结果是双方都选择遵守合同的策略，相应的收益为(a,a)。因而，此种博弈的纳什均衡并不是最优的纳什均衡结果。

三、增加外部干预措施后的博弈分析

导致前面博弈没有取得最优均衡结果的根本原因是：博弈双方的利益分配得不合理，增加了博弈双方的违约动机。如果我们能对博弈棋局的外部采取干预措施来改变博弈双方的利益分配格局，进而降低博弈双方的违约动机，就有可能使双方的收益达到最优的均衡博弈结果，即双方将都从干预中获益。

下面我们就以对博弈参与双方的违约行为采用高额罚金进行处罚的干预方式作为例子来分析利益双方的博弈行为。

假定在博弈的一方遵守合同而另一方违约的情况下，违约的一方将面临高额罚金（假如该罚金为），同时该罚金的所得都用于补偿遵守合同的另一方的利益损失。此时违约的一方所获得的收益为，遵守合同的另一方的收益为，其他情况则保持不变（收益矩阵见表2）。

表2 收益调整后博弈参与者A，B的收益矩阵

下面分析的不同取值对博弈双方最终博弈结果的影响：

1.当时。在此条件下我们很容易得出结果：对于博弈双方AB来说，不管对方采取何种博弈策略，它都会选择不遵守合同的博弈策略。这样，最终博弈双方的均衡结果与先前的博弈结果是相同的，此时该种干预措施的效果是比较差的。

2.当时。对于博弈的参与者A来说，当博弈参与者B遵守合同时，它遵守合同获得的收益a要大于不遵守合同获得的收益，从理性人的角度来看，A会选择遵守合同的博弈策略；当B不遵守合同时，它遵守合同获得的收益要大于不遵守合同获得的收益d，此时A同样会选择遵守合同的博弈策略。即不管B采取何种策略，A都会选择遵守合同的博弈策略。同理，对B加以分析，也会得到相同的结果。这样，最终博弈双方的均衡结果是最优纳什均衡，即大家都选择了遵守合同的博弈策略，最终收益为(a,a)是最优的，即该种干预措施对利益双方都是有利的。

3.当时。分析结果是此时博弈双方无最终的均衡博弈结果，也就是说此时的博弈结果是不确定的，因而此时该种干预措施的效果也就是不确定的。

综上所述，适当增加干预条件，当罚金值满足的条件时，经过收益调整后的博弈双方就会得到一个最优的纳什均衡，此时双方也将会从该博弈中获得最大的收益。

四、对策与建议

我们论证了：通过外界的干预措施来降低博弈双方违约的动机是解决先前的非最优均衡博弈结果的有效方法[4]。具体的干预方法和措施主要有：

1.增加博弈双方的违约成本，降低违约动机

（1)可以设立一个中介机构，比如称为农产品交易中心，通过以该交易中心为中介，来完成双方的交易（这有点像期货交易中的清算所的作用，具体见图）。这样不论哪一方都不会轻易的违约，因为保证金会作为它们违约的代价。同时也避免了违约金被长期占用的情况，双方履约完成后保证金会自动退回双方。而且，交易的双方可以互相选择交易对象，有利于农户维护自身的权利，改善了单个农户与企业之间订立合同时所处的劣势。

设有农产品交易中心的订单农业示意图

（2）建立农户和企业的信用档案。如果发现农户或者企业在履约时出现违约的现象，可以在它们的信用档案中加以记录。对有违约现象等不良记录的农户，从信用社或银行获取贷款时，将增加贷款的审核条件，在贷款利率、期限和贷款使用途径等方面有更严格的要求。通过这种方式，增加相关农户和企业违约的成本，提高履约率。

（3）通过设立农户自律组织来增加双方的违约成本。通过协会的形式来规范农户自身的行为，同时当农户面临农业企业的变相违约时，可以以协会为主体，采取集体性的措施，维护自身的权利。当然，对于农业生产中介组织这个领域，目前我国的发展还处于起步和探索阶段，要真正在实践中做好还是比较难的。

2.通过更为科学的合同定价来降低博弈双方的违约动机。通过分析，我们会发现导致种种利益矛盾的另外一个根本的症结是合同中所采用的固定价格机制，而这与市场中相关农产品价格的波动是有冲突的，这也导致了双方利益关系的不稳定甚至出现利益冲突。

（1）将合同中的固定价格转化为浮动价格。如果把合同中的固定价格转化为浮动价格，这样农民和企业之间就不会产生因为市场价格变化，而导致双方之间的利益冲突。主要是通过期货交易，来达到对该农产品的价格进行套期保值的效果，锁定该农产品的未来价格。

（2）在合同中设立附加条款，避免合同双方利益的过度不平衡，进而可以减少双方的违约动机。比如可以在合同中规定，当市场价格处于合同规定价格的10%（或者是其他比例数额）波动范围内时，双方交易的价格仍以合同规定的价格为基准；超过波动范围时，此时双方交易的价格就以另一种计价方式来计价。这样，避免了因为市场价格的大幅度变化，出现一方获得较大收益，而另一方则面临着相应的大幅度亏损的不利局面，有利于提高合同双方的履约率。

五、结束语

从上面的分析中可以看出，导致当前“农+企”关系面临困境的主要原因是其中的制度设计和执行方面存在着缺陷。所以，对于这种由于制度缺陷原因而导致的困局我们应主要从纠正制度缺陷方面入手来加以解决，即通过改变博弈双方不合理的收益分配格局，以此来降低双方的违约动机，实现最优纳什均衡。

参考文献：

[1]祝宏辉:新疆番茄产业实施订单农业生产方式的效果评析[J].农业技术经济.2007(3):89-95

[2](美)朱・弗登博格,(法)让・梯若尔.博弈论[M].北京:中国人民大学出版社,2002

[3]杨鹏飞:发展农业产业化之我见[J].内蒙古农业科技，2003(6)：153-154

篇（9）

引言

随着我国在全球经济一体化格局下的逐步深入，投资市场日益火爆起来，越来越多的投资人将手中的闲钱作为资本投资项目，这样，作为投资人主要的咨询对象投资公司之间的竞争更加激烈。

投资人经常把资金交给投资公司去投资，源于投资公司的道德风险就成了投资市场发展的一大问题。委托关系实质是在合同不完备和信息不对称的情况下的行为关系。从投资人与投资公司在投资项目中所扮演的角色看，二者的关系很明显为一种委托-关系。由于投资人作为委托人不能够直接地、有效地控制作为人的投资公司的行为，因而投资人只能够通过外部的激励机制间接地影响投资公司的行为。

投资市场道德风险是指投资人与投资公司签订合约后可能会采取隐蔽行为，在人（投资公司）与委托人（投资人）信息不对称的情况下，投资人难以准确地判断投资公司是否高努力工作，投资公司就是利用这种信息不对称采取“搭便车”的行为，从而损害投资人的利益。在投资市场中，投资公司承接项目后，一部分投资公司为获得丰厚的收益会高努力工作，这样就减少了项目失败的概率；而另一部分投资公司会不再高努力工作，反正损失会由投资人来承担，并且自己还会得到最基本的佣金，我们就将这种行为称为道德风险。目前，关于这方面的讨论一般限于定性分析，具体的数量模型分析较少。本文讨论的就是建立在这种道德风险下的博弈问题分析，以及均衡状态下双方的最优博弈策略，最后建立投资人的激励优化模型，使投资人的期望效用达到最大，并确定其最优决策。

一、投资人与投资经理的博弈模型及均衡分析

1.投资人与投资经理的博弈模型

假定投资市场是一个完全竞争的市场，于是投资人的期望利润为0。另设投资人的效用函数为；设投资经理的效用函数为。图为该博弈问题的博弈树。

由图可见此博弈为三阶段动态博弈，第一个节点表示投资经理，分支表示其选择（高努力与低努力）。第二个节点表示投资项目自然的选择，即项目是否投资成功。第三个节点表示投资人，分支表示投资项目失败后投资人是否对其进行审核。其中终端括号表示投资公司（投资经理）的最终效用与投资人的最终效用。

有关双方博弈顺序如下：

(1)合约双方（投资人与投资经理）签订项目合约，合约规定了：投资经理的基本佣金A（无论投资经理是否能投资成功，都会得到的报酬）、奖金B、罚金F。

(2)投资经理选择自己的风险状态，即可选择高努力，又可选择低努力，投资经理知道自己的选择，而投资人是不知道的，只知道其选择高努力与低努力的概率为1-t和t。并且在高努力情况下其花费的成本为 ,低努力情况下其花费的成本为eL，易见eH>eL。

(3)投资经理高努力情形下项目投资失败的概率为α，低努力情形下项目投资失败的概率为β，明显β＜α。若项目失败，投资人会损失S，且投资人只会给投资公司（投资经理）最基本的佣金A作为投资公司的报酬；若项目成功，投资人会盈利T,且投资人会给投资公司A‘作为投资公司的报酬,其中A‘=A+B,B为投资人给投资公司成功投资项目的奖金。

(4)若项目投资失败，投资人会以概率q对投资经理是否高努力进行审核（假定审核一定可以发现投资经理的努力状态），且审核的费用为D。若审核的结果为投资经理低努力，则投资人要对投资经理处以罚金F。

(5)支付最终分配。

2.博弈模型的均衡分析

按照博弈的行动顺序，当投资人发出信号时，他预计到投资公司会根据其信号修正自己类型的判别，因此选择一个最优的类型依存信号战略；同样，投资人也知道投资公司选择的是给定类型和考虑信息效应情况下的最优战略。因此，投资人使用贝叶斯法则修正对投资公司的类型进行判别，然后选择最优策略的行动。

令q为混合策略意义下使投资公司认为高努力与低努力之间是无差别的审核概率，此时，投资经理高努力与低努力的情形下的期望效用无差异。即

若投资经理是风险中性的，为计算方便，简化的设，则

因此，只要投资人将审核概率大于q，投资公司就会为追求更高的期望效用而选择高努力。

同理，当投资公司努力的比例达到一定值时，投资人对项目失败的投资公司的审核与不审核是无差异的。为此，我们引入一个条件概γ，表示投资项目失败的条件下投资人认为是由于投资公司努力程度不够造成损失的概率，由贝叶斯法则，得

这种情形下，审核与不审核的期望效用是相等的，则

若投资人是风险中性的，为计算方便，简化的设，则

从而

易见，当投资人认为投资公司低努力的概率低于此值时，考虑到审核费用等因素，投资人会选择不审核。t与F成反比，即罚金越高投资经理低努力的概率越小。由此，求得罚金的临界值为

对于投资人而言，应该采取激励机制将道德风险发生的概率控制在t值以内。因此根据求得的F这个临界值来确定罚金，当罚金大于此临界值时，投资公司会为追求更高的期望效用自然会选择高努力。

二、激励契约

投资人在设计合约时，应该全面的考虑到投资人与投资经理双方的博弈策略，从而设计激励契约，既要保证投资经理乐于资人投资，又能激励其高努力完成自己的投资项目，且使投资人的期望利润最大。

为计算方便，简化的设，建立如下激励模型：

通过这个结论，可以看出在最优博弈策略的基础上，投资人期望效用最大化时投资公司的奖金B和基本佣金A满足上面线性条件。由（3）式可知，当成功概率1-α、投资公司平均收入K、努力成本eH一定的情形下，奖金B与基本佣金A成反比，即给投资经理的基本佣金越低，投资经理就会更加努力投资项目从而获得更多的奖金。由（5）式可知：当成功概率1-β、努力成本eL、罚金F一定的情形下，B与A成反比。即佣金越低，投资经理就会更加努力投资项目从而获得更多奖金。因此为了保证投资经理高努力工作，要相应的控制基本佣金和奖金，投资人通过支付不同的基本佣金和奖金对投资经理起到激励作用。

三、结论

由于在投资市场内部存在着被称之为道德风险的市场失效行为，使得一部分投资公司承接项目后低努力工作，从而导致项目失败的概率更大。本文建立了双方的博弈模型，讨论了均衡状态下的最优策略，得到投资人将审核概率和罚金控制在一定值之上能有效地控制道德风险发生的结论。最后，建立了投资人的激励契约，得到奖金和基本佣金的最优线性关系。在实际中，投资人通过设置不同的佣金和奖金，激励投资经理努力工作，降低投资失败的概率，有利于投资工作的正常运行，具有一定的现实意义。

参考文献：

[1]张维迎:博弈论与信息经济学[M]. 上海：上海人民出版社，1996

[2]徐新邱苑华:道德风险与基于委托-理论的最优保险契约模型[J].系统工程理论与实践，2001，（3）:26～30

篇（10）

博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈思想起源于20世纪50年代，最先出现在冯•诺依曼和摩根斯坦恩1944年合著的《经济行为和博弈论》。1950～1954年，纳什发表了一系列论文提出了著名的“纳什均衡”概念，为非合作的一般理论和合作的讨价还价理论奠定了坚实基础。随后，泽尔腾对纳什均衡做出了发展，引入了动态分析方法。海萨尼在博弈论的研究中引入不完全信息下的分析方法。克莱普斯和威尔逊等分析了动态不完全信息条件下的博弈问题。博弈论已被应用于经济学、军事战略、计算机科学等当中，从90年代开始，被广泛应用于商业中。而涉及到投资和引资行为中的博弈研究尚处于初步阶段。用博弈论研究方法来分析投资和引资行为中的策略抉择，在当前具有十分重要的意义。

一、投资和引资行为策略的博弈论基础

招商引资行为中的“不求所有，但求所在”充分体现了引资策略的博弈特征，投资利益分配中的“非你既我”则充分体现了投资策略的博弈特征，从根本上决定了其可博弈性。各投资方和引资方不同的目标和利益追求必然导致对弈者出现利益冲突和行为不一致现象。但各对弈者理性地采取或选择自己的策略行为，使得在这种互相制约又互相影响的依存关系中，尽可能地提高自己的利益所得。

投资和引资行为中的博弈包括五个要素：(1)对弈者(player)：指博弈中独立决策、独立承担结果的个人或组织，这里可分三种情况：投资方之间，引资方之间，投资方与引资方之间。(2)策略集合(strategy set)：指对弈者在给定信息集的“相机行动方案”。在招商引资过程中，引资方竞相采取不同政策(如税收优惠、融资支持)进行抗衡。投资方通过各种策略排挤和压制竞争对手，争夺利益范围。而投资者与引资者存在既依存又斗争的利益共享与利益争夺关系，共同组成一个利益博弈互动系统。(3)规则(rule)：博弈规则本身是由演进力量决定的社会构造之物。为了进行博弈，对于有关的博弈规则人们必须具有共同的预期。博弈分析的目的是使博弈规则预期均衡。就投资和引资行为中的博弈而言，国家和当地的法律、法规、制度结构和博弈方制定的契约是博弈正常进行的保障。(4)报酬(payoff)：指对弈者从博弈中所得到的“收益”(确定“收益”或期望“收益”)，它是各博弈方追求的根本目标，也是他们行为和判断的根本依据。(5)均衡(equilibrium)：指所有参与人的最优策略的组合,博弈论中的均衡注重均衡本身的产生。在投资与引资行为博弈中由于多主体的参与可能存在多个均衡。

二、投资和引资行为博弈方法的解析

（一）目标函数的确定

确定各类行为主体的目标函数，必须把各类行为主体作为对立的利益主体，以局中人的角色互相博弈[5]。引资方所选择的策略目标函数是以壮大自己的经济实力、竞争力和可持续发展能力(因主体而异)为中心，力图增加资本存量，提高引资效率和增加就业机会，促使技术进步和经济的快速增长。资本是以追求剩余价值为目的，投资方要求把资本放在安全可靠、利润丰厚的地方和产业之上，以获得长期利益为目的，追求预期利益最大化为目标来确定自己的目标函数。在博弈当中，个人效用函数不仅依赖与自己的选择，而且也依赖于他人的选择，可以说，个人的最优选择是其他人选择的函数。在进行目标函数的选择时，不确定性和风险必然导致行为主体的收益与预期之间的偏差，但可通过目标的互相协调进行平衡。

（二）目标的协调

从发展变化的观点观察，投资和引资行为是存在时间动态变化的。在局中人无法限制对方通过自身努力争取目标的实现时，各局中人相对位置的变化不可避免。对弈中的投资方相对位置的变化可能源于投资何地、何时投资、投资量多少等等；而引资方相对位置的变化可能源于何种方式引资、何项目上引资、引资量的多少等等。他们追求的目标实际上是自己在社会决策过程中角色的改变(如主动权和获益权的控制)。在了解各自可能的获益、对手的习惯以及获益的期望等等(当然得充分考虑信息的可获得量和度)后作出自己的最佳决策。当局中人的目标之间发生冲突或矛盾时，能够通过协调相互之间的关系，保持目标上的协调，达到博弈的均衡状态。

（三）工具的选择

一般情况下，引资方采取的引资工具包括直接引资措施和间接引资措施。直接引资措施是通过直接与投资方接洽、商谈等既定的活动来实现目标，如由政府部门领导前头的引资团的直接招商引资活动。间接引资措施指通过影响、引导投资主体决策的变量来达到目标，如优惠政策的出台、投资程序的简化、办事效率的提高等。投资主体拥有的投资资金是他投资活动赖以进行和实现的前提条件。投资方采取的投资方式与工具包括项目投资方式(固定资产投资、流动资产投资和无形资产投资)和金融投资方式(固定收益投资工具、浮动收益投资工具等)。鉴于目前政府和企业以及其他投资者的投资目标仍是以项目投资为主体，本文的分析是以项目投资中的投资者为博弈中的一个对象。

三、投资方和引资方行为博弈分析

投资方和引资方作为不同的利益主体，以博弈局中人身份存在于这个利益博弈互动系统当中。引资方与引资方(投资方与投资方)的相互对弈有一个时间顺序，一方做出某项决策时必然会对另一方的决策有一个预期，并受他之前别人决策的影响；同时反过来又会影响他之后别人的行为，他们的相互博弈就构成一个完全信息博弈。投资方与引资方之间的博弈更为复杂，在目前情况下，招商引资中引资方常常处于被动或劣势地位，在实现自身目标驱动下对本身的具体战略、目标和政策倾向有明确的呈现，这样，投资方通过观察引资方行为可获得大量信息，并进而选择自身的策略，两者相互对弈就构成了一个不完全信息博弈。投资和引资行为中的对弈过程如图1所示。

为了分析的方便，假设存在两个投资者和两个引资者，投资者已决定把资金投入某地，引资者决定吸引资金。他们在每一时期都相互遇到，并且他们的策略只有投资于何地或吸引那方投资问题。在给定其他人策略的条件下，每个对弈者选择自己的最优策略，所有参与人选择的策略一起构成一个策略组合。考虑到互动系统的复杂性，本文可分情况进行分析。

（一）混合策略博弈

在图2所显示的元博弈中，设投资参与人集合N，标记为i＝1，2；引资参与人集合M，标记为j=1，2。每个投资参与人的策略集合为A=(a1，a2)，每个引资参与人的策略集合为B=(b1，b2)，收益函数Ui=(qk)由得益矩阵确定，其中qk=(ai，bj)，k=1，2。纳什均衡最优解为

Max∑∑Ui(ai ，bj)si 式中si∈Si ，ai∈A ， bj∈B si表示混合策略。

如果只进行一次博弈，博弈双方没有一个确定性的具体的策略，最优策略纳什均衡并不存在，一方的策略选择依赖另一方行动偏离的概率。

根据投资方和引资方的行为分析(最优达不到寻找次优甚至次次优)，可求得进行重复博弈的解(成为动态博弈问题)。假设投资方1首先采取触发策略，在重复博弈的开始选择投资到引资方1所在地，引资方1也只吸引有利益获取的投资方1的投资，投资方2只能选择投资于引资方2所在地。在这个阶段博弈中各自选择了合作伙伴，当期的总收益为U1(a1，b1)+U2(a2，b2)。同理，当投资方2首先发生偏离时，投资方与引资方都会将资金投入引资方2所在地，引资方没有吸引资金的优势，这时当期的总收益为U2(a2，b1)+U2(a2，b2)。这样就证明了在重复博弈条件下，投资方和引资方在“序贯理性”下存在许多策略抉择。由于受随机扰动冲击，演化动态总是处于变动之中，在存在博弈协调情况下，投资和引资行为会自发产生。

（二）竞争策略博弈

在最简单的情况下，改变上面元博弈的得益函数，会导致博弈结果的改变(如图3)。

在竞争策略博弈中的纳什均衡为(a1，b1)和(a2，b1),投资方1与引资方1合作，投资方2与引资方2合作，从而找到了目标利益的结合点。从中可分析出，引资方之间必然会发生竞相吸引、鼓励外商投资现象，这解释了为何发生招商引资过程中盲目竞争现象，也解释了投资方为了利益范围的争夺时有发生的原因。在竞争压力驱使下，引资方通过改善投资环境，投资方通过高效的管理手段和先进的技术投入等来不断加强自己的竞争优势，竞争不断升级有其必然性。

（三）子博弈精炼纳什均衡的复合

在图4中，各博弈方不存在改变自己策略的动力，这种均衡策略组合存在而且是唯一的，博弈存在“一致性”预测下的确定解。投资方1与引资方1合作的策略组合(a1，b1)，投资方2与引资方2的策略组合(a2，b2)构成占优策略均衡(dominant-strategy equilibrium)。在重复博弈中，纯策略组合µ1[a1/b1]，µ2[b1/a1]，µ3[a2/b2]，µ4[b2/a2]构成子博弈精炼纳什均衡。这样就证明引资方与投资方之间是相互依存、互惠互利的利益共同体，形成了博弈双赢系统。当然，在整体利益既定的情况下，引资方与投资方为了各自利益的最大化，又具有相互矛盾的利益争夺关系(如图1)。可以说，双方在对利益的争夺过程中实现利益的共享(双赢)。

四、长江三角洲引资大战的博弈分析

长江三角洲是我国城市发展水平比较高的地区，城市间合作水平和协调机制建设不断提高和进步，城市间合作程度也在不断加深。但是，本地区在吸引外资上存在着激烈的竞争，城市之间为外资获取权的博弈此起彼伏，其中，由于引资动机过度膨胀而出现的非理性竞争导致了非帕累托最优的时时出现，这带来的一个明显的后果是阻滞了本区域发展战略目标的实现。如上海为了降低商务运营成本，吸引外资的流入并阻滞内部资金向周边城市的外流，并想通过各种手段创造与周边城市更加有利的竞争条件，2003年4月以“嘉青松”地区为试点，划出了嘉定57平方公里、青浦56.2平方公里、松江59.89平方公里为“降低商务成本试点区”，因其总面积为173平方公里，被人们称为“173计划”。针对上海的“173计划”，江苏就出台来了“八市沿江开放战略”，同一期间，浙江也出台了“环杭州湾开放”方案，可以认为这个新的“经济特区”的划定是上海、江苏和浙江三地在引资上全新竞争形式的开始，这也是引资方与引资方之间为吸引外资而进行博弈的进行和结果。对此我们可以从以下四个方面进行分析：

（一）由目前长三角地区发展的情况可知，上海的“173计划”带来的一个明显效应是长三角地区各城市为招商引资而形成了“蜗角争利”的态势。由此可见，“173计划”已经失去了通过降低商务成本达到吸引外资的目的，使本来处于焦灼状态的长三角城市之间的竞争更加白热化，同时为未来的协作关系的深入发展埋下了许多隐患。如果上海市财政局、市外资委、市工商局等六部门在做出 “173计划”这个决定时，充分考虑到周边其它城市的强烈反应，他们之间的博弈进行就不会是现在“既不利己也不利人” 的结果。

（二）投资方（一般是外商）与引资方（长三角地区各城市）之间的博弈由于引资方强烈吸引外资的决心而处于被动和劣势地位。鉴于此，投资方可以在各个引资方提供的优惠政策程度上掌握博弈的主动权，他们完全有机会在引资方之间做出有利于自己的策略选择。因此，他们是这场博弈的最终得益者和最大收获者。从这个结果来分析，长三角各城市应该端正态度，具备博弈分析的一般知识和心态。

（三）投资方之间的博弈的进行则主要取决于他们所投资项目在优惠政策基础上的获利能力与地租成本的权衡，他们会为自己的投资项目找到一个最佳的投资地，通过对不同的策略选择的最优抉择来攫取大量的超额利润。

（四）在这个博弈的进行过程中，外商是拥有完全信息的一方，他们可以利用引资方的非理性竞争而选择最有利于自身的博弈策略。由此可知，从这个博弈的进行过程来分析，这场引资大战是一个典型的不完全信息博弈。

五、结论

从投资与引资行为的博弈分析中可得以下结论：

（一）投资方和引资方鉴于自己利益得失的考虑，相互利用对方优势条件和互相竞争最大化利益是交融在这个系统中，系统内利益的冲突并不必然只导致竞争，利益的重合也并不必然只导致合作。

（二）各主体对博弈行为的把握程度的深浅(取决于决策需要的信息和分析信息能力)、目标的差异、采取的路径手段的不同(归功于竞争力和决策权、对弈者的习惯等)，博弈的运行过程和结果存在多种可能性。双方力量的动态发展必使非均衡状态走向新的均衡状态。投资与引资行为博弈的复杂性决定了其主体决策不像平常简单的静态事物那样仅仅存在一个均衡点，多主体博弈往往存在多个均衡点。

（三）理性预期下主体做出的投资决策(引资决策)以及他们的经济活动在实际生活中并非一定遵从最有效原则，而是在“边做边学”中把握整个博弈局势。各博弈主体如果增强了彼此进行博弈分析的能力，充分认识到预期效果与未来实际效果、预期利益与未来实际利益之间存在偏差。在利益发生矛盾或冲突下通过信息反馈过程可达到协调的结果，虽然没有达到帕累托最优，但经济活动效果比对着干(悖理的)好一些。

（四）公平、公正和利益互惠原则是维系这个博弈互动系统的保障，也是争取利益最大化的基本准则。

[参考文献]

[1]张维迎．博弈论与信息经济学[M]．上海三联书店、上海人民出版社，1996．

[2]李雪松．博弈论与经济转型[M]．社会科学出版社，1998．

[3]付晓东，胡铁成．区域融资与投资环境评价[M]．商务印书馆，2004．

[4][美] H・培顿・扬．个人策略与社会结构[M]．上海三联书店、上海人民出版社，2004．

免责声明以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。