博弈最优策略范文
时间:2023-08-15 17:31:43
导语:如何才能写好一篇博弈最优策略,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
篇1
论文摘要:信贷市场中,企业获得贷款后基于自身利益的驱动会产生道德风险,从而加大了银行信贷风险。本文建立了银企博弈模型,得出银行可以将审核概率控制在一定阀值上,从而降低企业的道德风险。在此基础上,设计了银行对借款企业的激励契约,得出抵押物价值和贷款利率的最优线性关系。
随着我国金融业的不断开放,我国商业银行面临着日益激烈的竞争,借款企业的道德风险已经成为银行较高不良资产率的主要原因之一发放贷款后,由于信息不对称,银行往往无法对企业进行有效监控,企业可能做出损害银行利益的行为,这就是企业道德风险。
银企博弈模型
交易双方为银行和借款企业,假设两者均风险中立。博弈顺序如下:借贷双方针对某一项目签订借贷合同,贷款额度为B。合同规定抵押价值Q以及贷款利率i等,显然Q>B。企业可选择“不改变资金用途”或“改变资金用途”两种纯策略,对应的项目失败概率t1和t2,显然,t10,高风险意味着高收益)。银行收益始终为r,有r=iB。项目失败后,银行由于存在审核成本,故其策略有“审核”与“不审核”,对应概率分别为α和1-α,审核成本为C。如果审查出企业“改变资金用途”,则银行没收抵押后并给予企业惩罚π,其中可以是信用等级的降低等。
双方收益函数:企业不改变资金用途,如果项目成功,企业和银行收益分别为R-r 和r;如果项目失败并且银行选择审核,双方收益分别为B-Q和Q-B-C,如果银行选择不审,双方收益分别为B-Q和Q-B。企业改变资金用途,如果项目成功,企业和银行收益分别为R+Δ-r和r;如果项目失败并且银行选择审核,双方收益分别为B-Q-π和π+Q-B-C,如果银行选择不审,双方收益分别为B-Q和Q-B。
博弈的均衡分析
如果一个混合策略是企业的最优选择,那么意味着企业是否改变资金用途的期望收益无差异,即:(1-t1)(R-r)+t1[α(B-Q)+(1-α)(B-Q)]=(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)],得出:
同理,如果一个混合策略是银行的最优选择,那么意味着银行审核与不审核之间的期望收益是无差异的。引入一个条件概率λ(c/f),表示项目失败后银行认为企业改变资金用途的概率,由贝叶斯法则得: 这种情况下银行审核与不审核的期望收益相同,即:λ(c/f)(π+Q-B-C)+[1-λ(c/f )](Q-B-C)=Q-B,得出:
因此,所求的α和p即为所求纳什均衡点。这表明当银行审核概率低于α时,企业最优策略是改变资金用途;当银行认为企业改变资金用途的概率小于p时,考虑到审核成本,银行选择不去审核。所以,银行可以将审核概率控制在一定阀值之上,就能够有效控制道德风险。
激励契约设计
银行在设计契约时,应理性预期到双方的博弈策略选择及其各种局势的支付,进而设计激励契约。设计契约如下:
{(1-p)(1-t1)r+(1-p)t1[α(B-Q-C)+(1-α)(Q-B )]+p (1-t2)r+pt2[α(π+Q-B )+(1-α)(Q-B )]} (1)
s.t(1-t1)(R-r)+t1(B-Q)≥0(2)
(1-t1)(R-r)+t1(B-Q)≥(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)] (3)
r=iB (4)
银行的最优策略是使自身期望收益即(公式1)达到最大;同时应满足不改变资金用途的企业的参与约束(公式2);为激励企业不改变资金用途,还应满足激励约束(公式3),即不改变资金用途的企业获得的收益应大于改变资金用途的企业。(公式4)为r与B的关系。
添加参与约束因子β和激励约束因子γ构造拉格朗日函数,得出β=1,γ=1-p。
当γ≠0,即p≠1时,因此约束条件(2)和(3)取等号,解之得:;当γ=0,即p =1时,即银行认为企业一定会改变资金用途,则银行一定会审核,即α=1。
由结果可知,在最优博弈策略的基础上,银行利润最大时其最优抵押物价值和贷款利率存在以上线性关系。一般,当贷款额度和贷款利率一定时,抵押物价值与项目失败率成反比,因此,银行可以通过设计不同的抵押物价值要求的契约来对企业进行激励。
参考文献
篇2
关键词:博弈论;围标串标;治理
中图分类号:F22 文献标志码:A 文章编号:1673—291X(2012)28—0210—03
一、博弈论概述
博弈论是专门研究博弈如何出现均衡的规律的学科[1]。博弈论的思想最早出现于18世纪,20世纪20年代,由科学家冯·诺依曼和经济学家奥斯卡·摩根斯坦恩合著的《博弈与经济行为的理论》一书中将博弈论真正作为了一种理论研究。他们提出了策略型和广义型等基本博弈模型、解的概念和分析方法,构建了博弈论的理论框架。1951年纳什对静态博弈模型提出了纳什均衡的概念,明示了博弈论与经济均衡的内在联系。
博弈论又称对策论,是研究决策主体在决策主体各方相互作用情况下如何进行决策及有关决策均衡问题的理论。博弈论强调决策主体各方策略的相互依存性,即任何一个决策主体必须在考虑其他局中人可能的策略选择基础上来确定自己的最优行动策略。博弈论的精髓在于博弈中的理性决策者必须考虑在其他局中人反应的前提下来选择自己最理想的行动方案。所谓均衡即所有局中参与人的最优策略组合,各方博弈产生的结果是一个均衡结果,它可能不是局中各方及整体的利益最大化,但它是在已给信息与知识条件下的一种必然结果,因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。
博弈论假设人是理性的,即人人都会在给定的条件下想办法使自身利益最大化。另外,人们在合作交往中有冲突,行为决策会受到相互的影响,且信息通常不对称。在现实中,博弈的最终结果往往是博弈的各参与人的策略组合达到一个均衡的结果,我们称之为纳什均衡。一旦达到这种均衡,博弈的任何一方都不会有积极性偏离这种均衡。
在一个存在n个参与者的博弈中,假设所有参与者都是理性的,如果策略组合s*是一个均衡的话,那么给定n—1个参与者的策略,某个特定参与者所选择的策略一定是最优的
(否则与理性人的假设相矛盾);因为某特定参与者是任意选取的,因而上述特性对每个参与者都成立。换言之,对于一个策略组合s*,如果保持其他参与者的策略不变,而任意一个参与者的策略都是最优的,那么策略组合s*就是纳什均衡。归纳为一句话即为:“最优对任一参与者的任一策略成立。”简而言之,纳什均衡就是在给定其他参与人策略的条件下,每个人选择自己的最优策略。
用数学公式可这样表示:如果一个策略组合s*=(s*1,…,s*n)是博弈G={S,U}的一个纳什均衡,那么对任一参与者i=1,2,…,n,对其任意一个策略si∈Si,不等式ui(s*i,s—i)≥ui(si,s—i)成立。
纳什均衡的运用非常广泛,最为有名的一个例子就是由塔克给出的“囚徒困境”博弈模型。囚徒1和囚徒2共同作案,被抓住,警方将两名囚徒分开在两间审讯室同时审问,他们都只有两个选择,招供和沉默。警方提出这样的条件:若两人都招供,则证据确凿,两人均被判六年;若一人招供,一人沉默,则招供的囚徒可立即释放,而沉默的人则加刑二年;若两名囚徒均不招供,则因证据不足只能判他们一年。由此分析如下:
1.参与者集合:N={1,2}。
2.策略空间:囚徒1的策略空间S1={沉默,招供},囚徒 2的策略空间S2={沉默,招供}。
3.偏好和收益函数:囚徒1的偏好为,(招供,沉默),(沉默,沉默),(招供,招供),(沉默,招供)。前一项为囚徒1的策略,后一项为囚徒2的策略。囚徒2的偏好类似。定义u1(s1j,s2k)和u2(s1j,s2k)分别为囚徒1和囚徒2的收益函数。所有收益如下:
u1(s11,s21)=—1 u1(s11,s22)=—8
u1(s12,s21)=0 u1(s12,s22)=—6
u2(s11,s21)=—1 u2(s11,s22)=0
u2(s12,s21)=—8 u2(s12,s22)=—6
显然有:
u1(s12,s21)=0>u1(s11,s21)=—1>u1(s12,s22)=—6>u1(s11,s22)=—8
u2(s11,s22)=0>u2(s11,s21)=—1>u2(s12,s22)=—6>u2(s12,s21)=—8
囚徒困境博弈模型(见下页图1)。
图1 囚徒博弈矩阵
由图1可清楚的看出,在完全不清楚对方如何决策的条件下,对于囚徒1,不论囚徒2选定的是招供还是沉默,他都应该选择招供,因为招供是他的严格占优策略;同样的,对于囚徒2,不论囚徒1如何选择,招供是他的严格占优策略。于是(招供,招供)是该博弈模型的严格优策略。同时,(招供,招供)是该模型的一个纳什均衡。如果给定囚徒2选择招供,则囚徒1的最优策略只可为招供;反之,给定囚徒1选择招供,囚徒2的最优策略也只能是招供。
二、围标串标的危害
所谓“围标”,是指某个投标人通过一定的途径,秘密伙同其他投标人共同商量投标策略,串通投标报价,排斥其他投标人的公平竞争,以非法手段赢取中标的一种违法行为。围标行为的发起者称为围标人,参与围标行为的投标人称为陪标人。所谓“串标”,是指在工程招投标过程中,几家投标单位通过事先商定,联合对招标项目的一个或几个招标标段用一致性报价、压价或抬价等手段串通报价,以达到排斥其他投标人,控制中标价格和中标结果,让他们其中的投标者中标的目的。
篇3
关键词:水资源;政府管制;产权;博弈
[中图分类号]F272.92;F224.32 [文献标识码]A [文章编号]1009-9646(2012)4-0078-02
一、水资源环境污染的博弈分析
水资源环境污染问题,即水质博弈,厂商之间的“囚徒困境”问题。首先假定市场自由竞争,政府不进行管制,在环境污染博弈中参与人是两个相同的排污者A与B,两方的策略是排污与不排污,假设两个人都不排污,有一个好的环境,大家收益都为20;如果大家都排污,这时环境恶化,每个人的收益都降低到9;如果一人不排污,另一人排污,由于治理污染要付出成本,不排污者的收益为为4,而排污者的收益为15。该博弈的支付矩阵见图1:
图1 无管制情况下排污者之间博弈
该博弈有两个纳什均衡,即(9,9)和(20,20)也就是两方同时排污或者同时不排污。但是纳什均衡(20,20)是不稳定的,因为A与B两方合谋不排污是不可信的,一旦一个选择不排污,另一个可能排污,那么排污者的收益为15,不排污者的收益为4。最后的纳什均衡是(9,9),社会的总效益为18,而不是40,此实际是两人博弈的囚徒困境。在现实经济中排污者有很多个,假定有n个排污者,这实际上就是有n个局中人的博弈模型。在没有政府监管的情况下,这n个局中人进行博弈,他们会根据利益最大化选择自己的策略,要么排污要么不排污,如果大家都不排污,环境不会被污染,整个社会福利最大。但是合谋不排污是不可信的,因为如果你不排污就要进行污染治理,治理要成本,结果你和别人共享同样的环境,你的效用相对他人较低,因此你不排污你吃亏,结果大家都排污,这就是n人博弈的囚徒困境。
二、政府与用水单位之间的博弈
政府代表供水单位,此为水量博弈。我国长期以来对耗水大的单位,供水无限量且价格低廉,导致大家缺乏节水动力。为了达到水资源的最优配置,对供水与用水单位之间进行博弈分析。该博弈的三要素是:博弈参与人集合:{政府,用水单位};政府的策略集是:供水多,供水少,用水单位的策略集是:节约水,不节水;设参与人的收益如图2所示:
图2 供水与节水之间博弈
当政府的策略是供水多时,用水单位采取的最优策略是不节水,由图2可知由于15>12;当给定用水单位不节水时,政府的最优策略是供水少,收益为6;当给定政府供水少时,用水单位的最优策略是节水,收益选择为10;当给定用水单位节水时,政府的最优策略是供水多因为15>3,此博弈不存在纳什均衡。在这种情况下,政府如采用水权交易能收效甚大,与用水单位交易,用量多的需花大成本购买大的用水权,这就促使用水多的单位节约用水以节约成本。为此生产用水价位要高,而生活用水要低;将用水量分若干档次水价,按不同档次由低到高递增计价;夏天与冬天应按不同水价计费,目的也是促进节约用水;洗用水做到达标排放,这样可循环用水,也可避免污染水环境,其治理费用要计入水厂成本中,通过上述措施达到水资源的最优配置。
三、政府与厂商之间博弈分析
1.府与厂商之间的不完全信息动态博弈
厂商一般比较清楚政府各次制定的环保法规等,但政府很难了解厂商的执行情况,即信息不对称。此外,短期内环境改善或污染的损益不易表现并很难计量。因此,厂商与政府就形成了一个不完全信息动态博弈。将有关厂商看作厂商A,而政府为B,就构成了两个博弈方的动态博弈。图3表示政府与厂商之间的子博弈,p1、p2、p1 、p2′、q1、q2指博弈方选择对应策略的概率,对方很难准确把握,(u、v)指A、B博弈方得益。在此博弈中,如果p1=1,p2=0,那么博弈提前结束,等到人们对环境质量有更高要求时,政府又开始制定新环保法规,博弈又开始,环境质量将得到不断改善。但政府管制对于厂商来说是一种威胁,如果q1>q2,则它是可信的威胁,那么厂商在上阶段很可能选择不违规,即p1>p2;反之q2>q1,博弈继续向下进行,环
境向着恶性发展。目前我国的环保法规不够严厉,即使上交罚金,仍有高额暴利,因此政府的法规只是一种不可信“威胁”。
图3 政府与厂商之间的动态子博弈
2.政府与厂商之间的静态博弈
此博弈中,政府的选择是打击与不打击,厂商的选择为合理与不合理排污。这是一个静态博弈,其支付矩阵如图4:其中a,b分别为厂商合理排污的概率、政府打击厂商违法排污行为的概率,A为厂商合理排污的成本,C为政府打击违法排污行为的成本,F是厂商不合理排污时被政府发现后的罚款。给定a,政府选择打击与不打击的期望收益分别为(G为政府,Q为厂商):
图4 政府与厂商之间的静态博弈
G(1,a)=C*a+(F-C)*(1a); G(0,a)=0,解 G(1,a)= G(0,a)= 0,得a*=(FC)/F。即:若厂商合理排污的概率大于(FC)/F,政府最优选择是不打击;否则反之。给定b,厂商选择合理与不合理排污的期望收益分别为: Q(b,1)=A*b+(-A)*(1b); Q(b,0)=(FA)*b,解 Q(b,1)= Q(b,0)=0,得b*=A/(A+F)。若政府打击违法排污行为的概率小于A/(A+F),厂商最优选择是不合理排污;否则反之。因此政府应严厉打击违法排污行为,使政府的打击行为成为对厂商不可置疑的威胁,这样厂商才会合理排污,而且水质和水量之间也是相互影响的,污水资源化,既可减少环境污染,又能提高水的利用率,增加新的水资源。
四、小结
厂商共同排污、代表政府的自来水公司进行城市供水、政府与厂商之间的博弈等都是公共水资源问题的表现。若使水资源可持续开发利用,第一,制定合理的排污收费制度或实行排污许可证交易促使用水单位合理排污,同时调整产业结构及集中治理治污,解决用水紧张以及污染严重等问题。第二,政府制定统一合理的水价或实行水权交易使水资源在各用水单位的配置合理,指导自来水公司之间重组,扩大规模,减少公司数量,提高效益,同时节约水资源。第三,在厂商与政府的动态博弈中,尽量减少政府失灵,制定高额罚款标准,严厉的法律制裁及执行程序,同时减少水资源管理中的寻租行为,使之成为该博弈中的可信威胁,使博弈提前结束。第四,设计水资源保护机制,怎样规则最有效,底价、投标费、保证金等定在多少较合理,以使得拍卖方达到盈利极大化就是拍卖形式的机制设计等。总之要做到水资源开发、利用和保护协调发展,政府、社会和公民必须在水资源保护和利用过程中,更加开阔思路,减少错误决策,提高行动效率,使得博弈各方利益都得到最好的保护,以实现人与水资源开发利用的和谐发展。
[1]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.
[2]Roger Perman. Natural resource and environment economics [M].second edition , December 1998.
[3]张焕林.探析规划水资源论证的政策框架构成[J].水利发展研究,2010(4).
[4]王金南.排污收费理论学[M].北京:中国环境科学出版社,1997.
篇4
关键词:项目绩效考核;囚徒困境;博弈分析;项目管控模式
Abstract: The existing problems of performance evaluation system in construction enterprises and its improvement methods are analyzed in the perspective of game theory. The modeling of game theory is described by prisoner's dilemma case and is applied in the project performance evaluation of construction enterprises, and the game model of project performance evaluation is proposed. The profit and loss by cooperation and non-cooperation with its strategy adopted is demonstrated both from the side of head office and project team. Improvement strategies such as enhancing the project management and control and increasing the proportion of performance awards of the project team are proposed for the management of project performance evaluation, by analyzing of the model, to maximize the project profits by cooperation of the two sides.
Key words: project performance evaluation;prisoner's dilemma;game theory;project management and control model;
中图分类号: C29 文献标识码: A 文章编号:
传统的建筑企业采用粗放式项目管控模式,承接到项目后,由建筑公司总部(以下简称公司)与项目部签订目标责任书,项目实施的所有权力移交给项目经理,公司作为管理层,一般不参与项目的材料采购、分包选择等工作,工程结束后,公司根据目标责任书对项目进行指标考核,收取约定的项目管理费用。这种传统项目管控模式存在的问题有:公司缺少对项目的深度控制权,却要承担成本、质量和安全等风险,责权利不匹配;公司没有对项目部管理团队进行有效的激励和约束,容易形成管理漏洞滋生腐败,无法实现项目利润的最大化。本文从博弈论的角度对项目绩效考核的管理进行了分析,为建筑企业完善和落实项目绩效考核体系提供了理论支持和依据。
1博弈论模型分析
博弈论是双方在平等的对局中各自利用对方的策略变换自身的对抗策略,从而达到取胜或者自身利益最大化的目的。假设有N个博弈主体参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡[1]的数学定义如下:在博弈G=S1,…,Sn:u1,…,un中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任意博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…si-1*,si+1*,…,sn*)的最佳对策,也即ui(s1*,…si-1*,si*,si+1*,…,sn*)≥ui(s1*,…si-1*,sij*,si+1*,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。纳什均衡并不意味着博弈双方达到了一个整体的最优状态,囚徒困境就是一个著名的例子。
在囚徒困境模型中,假设有两个小偷A和B被警察抓获,被分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,则各被判刑8年;如果一个犯罪嫌疑人坦白而另一个人选择抵赖,则抵赖者判刑10年,而坦白者立即释放。如果两人都抵赖,则警方只能以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。
表1 囚徒困境博弈
对A来说,无论B作何选择,他选择“坦白”总是对自己最优的。而同理B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。表1中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。
2模型在项目绩效考核中的应用
公司和项目部是两个相对对立的博弈主体,公司具有行政和资源优势,可以向项目部下达行政和管理指令,同时掌控项目部的部分资源,而项目部也拥有一定的自,具备现场管理优势。双方主要博弈的目标是项目的潜在收益,公司希望获得更大的项目总收益,而项目部则有可能通过转移或牺牲潜在收益来增加个人收入[2]。
假设实施某项目的过程中公司的基准收益是A,项目部收益为B(固定工资收入),项目潜在收益为C(其中公司通过加强管控可得到的潜在收益为C1,项目部可操控的潜在收益为C2,C=C1+C2),公司与项目部签订的管理费指标为D,奖励的指标为κ(C-D),若公司实现绩效考核则奖励给项目部的比例系数为η(0
篇5
关键词:组织冲突;博弈论;最优冲突管理;Morgan模式
一、前言
全球化和战略联盟使得行政管理过程中的压力和资源重新配置问题剧增。技术压力在组织内外产生了诸如丧失隐私、信息泛滥、缺乏面对面沟通、技能窘迫或知识匮乏得不到晋升等等方面的问题。企业庞大的集中控制的组织随之与分散的、变幻莫测的市场之间的冲突愈加频繁。这些发生在组织结构内部和战略层面之间的冲突,极大地影响组织的决策。
(一)国内外理论进展
现代管理科学对冲突的研究源于20世纪60年代,巴纳德和西蒙都认为组织冲突长存企业内部。“在一个大型组织里要所有人为其自身的个人利益工作而采取合作的方式不大可能。”J•klly,H•Assael都认为,组织中存在冲突对促进目标显露有积极作用。之后对组织冲突产生原因及处理研究开始获得进展,学者们开始发现压制冲突的传统管理思维和方法的不合理性。LouisR•Pondy认为,压制冲突的组织剥夺了自我调节和稳定成长的功能。60年代后,在组织管理和行为理论的研究中,都把冲突管理作为一项重要内容加以关注。如RossA•Mebber于70年代完成的《组织理论管理》、GaryJohns的《组织行为学》、Derslergary的《组织管理》和JohnM.Ivancevich和MechaelT.Martteson的《组织行为与管理》等著作,都对冲突的性质和形成原因、影响解决冲突问题的因素和解决冲突问题的途径等进行了较系统的研究。
相比西方管理学者的研究,国内管理学界对企业或其他组织冲突的研究尚处于起步阶段,80年代后期港台学者开始相关研究,从创新角度得出了一些具有时代特征的观点。如“缺乏冲突的团体容易陷入群体思考模式的陷阱。”“企业领导应该刻意维持良性冲突的产生,利用冲突激励组织进步。”等等。赖明正对组织变革中利益冲突和组织学习之间的关系进行了实证研究,提出在追求竞争力提升的同时,原先企业内利益均衡的态势也随着组织的变革而有所不同。胡文琦、范庆玉从分销渠道的角度对冲突关系进行了分析;张继征对企业转包过程中的冲突行为进行了评价并提出解决方法;张勇、张玉中分析了企业组织间冲突策略选择的影响因素;李霄、徐中和则利用博弈论对冲突管理的策略方法进行了推演等等。
(二)对冲突理论演进的简要评述
冲突(conflict)是指两个或更多相关联的主体,因互动行为所导致不和谐的状态。是个体对外部环境做出的过激反应,体现了决策意愿的个人化。
按照西方冲突理论,冲突过程一般分为五个阶段,即潜在的对立或不一致、认知和个性、行为意向、行为和结果。第一阶段也称为冲突的成因,一般概括为三类:沟通、结构和个人因素。认知和个性化阶段是指个体对冲突有知觉存在,并且个体有了情感上的投入。行为意向介于一个人的认知、情感和外显行为之间,它指的是从事某种特定行为的决策。行为阶段则是冲突双方公开地试图实现各自的愿望。结果阶段就是冲突对组织绩效影响的最后结果,即是功能正常还是功能失调的结果。激发功能正常的冲突是冲突管理的一项重要内容,当冲突出现的时候谈判是解决冲突比较好的办法。
组织内部成员之间面对一定的环境条件,在一定的规则下,同时或先后,依次或多次,从各自允许的行为或策略中进行选择并加以实施,并从中各自取得相应成果的过程构成了博弈论决策个体的特征。发生在组织内部的冲突则是由对立的目标、态度、行动所导致的组织内部或组织间的非合作博弈行为。本文试图引入博弈论观点,对给定理性局中人即组织成员在冲突中通过其最优选择追求个人效用最大化,最终达到博弈均衡的现象加以文本解释,寻找冲突管理各方合理策略下博弈的解,从而建立最优冲突管理方案。
二、织内冲突的博弈特征
使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论称博弈论。如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。冲突之所以发生可能是利益相关者(stakeholder)对若干议题的认知、看法不同,需要、利益不同,或是基本道德观、不同等因素所致。
冲突发生在复杂的组织内部,存在组织战略行为中的冲突加剧了博弈频次。Libby认为,组织是成员之间存在心理上相互依存关系的非简单个人集聚。组织具有相互依存、协作、分工和权威阶层的特征。[1,2]博弈论中的决策个体与微观经济学中的个体决策相比,博弈中的决策是相互依存的,即考虑了各个决策个体之间的相互影响。
基于事物矛盾性的认识,组织冲突假设辨证表现在:(1)冲突是不可避免的;(2)冲突对变化而言是不可或缺的要素;(3)只要对冲突进行很好的管理,其对全局效用的促进是正相关的;(4)充分利用冲突为对于集团组织结构和战略目标实现是有利的。冲突使组织内部产生了问题,但也为组织兴奋提供了必要的激励条件。在组织冲突中,决策个体不仅依赖于自己的选择,而且依赖于其他决策个体的选择,各个决策个体之间的相互影响在博弈决策中被充分考虑,个体的效用函数不仅依赖于自己的选择,而且依赖于其他决策个体的选择,个体最优决策μi(S),是他人效用函数的函数μ3i(S)=μ(μ1(S),μ2(S),…,μi-1(S)μ,μi+1(S)μ,…,μn(S))(设i为博弈中的局中人,i=1,2,…,n;si表示局中人i的策略,S=(s1,s2,…,sn)表示n个局中人的决策向量,μi(S)记为局中人i的效用函数。从一定意义上讲,博弈论研究的是存在相互外部性条件下的个体决策问题,组织冲突同样是一次或多次相同外部条件下个体与个体、个体与组织、组织与外部环境间博弈的最优策略选择。[3]
三、一般性组织内冲突的原因及影响
Creighton,Moore,Amy,Bisno分别探讨冲突的根本原因,并归纳为:(1)程序冲突(proceduralconflict)。流程上发生问题,在责任权限模糊时可能发生角色冲突。[4](2)资料或资讯冲突(dataorinformationconflict)。争夺稀缺资源引发冲突。(3)价值判断冲突(valueconflict)。随着组织不断扩大,交流机会和次数减少,成员对所在组织的归属意识得以增强,组织内竞争和文化相斥成为冲突的原因。(4)利益冲突(interestconflict)。报酬体系公平性导致的冲突。感觉到报酬体系中存在着不公平或发生偏离的情况,小集团间或人际关系上可能出现冲突。(5)关系冲突(relationshipconflict)。工作中的依赖关系导致的冲突。(6)情绪冲突(emotionconflict)。源于心理承受力、能力差异导致的冲突。研究和掌握容易导致冲突的原因的考虑方法,比防止非生产性冲突发生或者把非生产性冲突限制在最小化范围内更重要。
冲突结果是长程的,回避冲突和掩盖冲突同样能导致消极和懈怠的状态产生。Kast和Rosenzweig即强调不应忽视冲突在促进改革的积极的角色与功能。而冲突管理则是以系统、科学的方式来消除认知与价值差异等障碍,以达成协议的过程。其目的在冲突过程中减少可能的或是不必要的伤害,以促进有利冲突双方的结果。[5]冲突管理的目的也是在均衡博弈不利于解决冲突困局情况下,采取合作态度寻求最优解。
四、组织内冲突管理——对Morgan模式的一个博弈理解
运用博弈观点阐释组织冲突管理的难点就在于局中人所参与的每次博弈或多次博弈的得益。理人往往从自身最优策略选择出发以实现自身利益为目标参与博弈。
(一)Morgan的五种选择
GarethMorgan在其《组织印象》(ImagesofOrganization)中,说明在组织管理者在面临冲突时,可进行的五种模式选择(见图1)。冲突的消除从自我主张与协调性两维度考虑。自我主张性是指当事人使自身利益关系得到满足的意图;而协调性则是使他人的利害关系得到满足。据此可以把解决冲突的方法分为五类:(1)强制型:为利益坚持竞争,并以自身最优策略完全实现为目的,显示威力和强制力;(2)和解型:放弃自身利益做出让步,重视双方关系维持而不是竞争,也许不得已唯命是从;(3)回避型:双方都不轻易将其真实意愿外露的对策,没有信息交换;(4)姑息型:相互妥协处理冲突,即与其唯命是从,不如择机达成共识;(5)合作型:完全理性行动,基于充分合作双方共同决定寻找最优策略并采取行动。合作通常被视为解决冲突的最佳方案。
Morgan解决模式构成了非合作博弈的条件。博弈的过程就是各个理性的博弈方(当事人)选择自己决策的过程,当各博弈方都不愿或不会单独改变自己策略的策略组合存在时,或者说为了极大化自己的盈利(或效用),每一个局中人所采取的策略一定应该是关于其他局中人所取策略的最佳反应。[6]纳什均衡说明冲突管理也必须符合这样的规律:按照你愿意别人对待你的方式来对待别人,但只有基于他们也必须按同样方式行事。
(二)冲突博弈的困境解释
现实组织内冲突发生时由于缺乏互释的沟通,当事人双方处于对立面时必然表现为一种“囚徒的两难选择”。困境中每一方在选择策略时都没有“共谋”,他们只是选择对自己最有利的策略,而不考虑组织福利或任何其他对手的利益。也就是说,这种策略组合由所有参与人的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。[7]双方在合作与抵制策略上首先想到自己,这样他们必然要陷入回避。只有当他们都首先替对方着想,或者相互合谋时,才可以得到最完美的和解。
组织内集团利益冲突中,局中人心态构成博弈困境。前者希望冲突解决以部门利益最大化为终极目标,后者想打破这样的均势,博弈的结果可能出现Morgan模式,诸如强制推行,单方和解,双方逃避或相互妥协几种解决方案。那么通过怎样的渠道才能在冲突人之间建立合作的基础,使局中人一定程度上能够站在对方的视角考虑问题,从而走出囚徒困境,最大化实现双方利益。而客观上,正当的逐利心态构成了人们正常与主要的行为动机。当冲突管理试图通过法律或者道德维系良好的社会秩序时,必须正视这种心态在各种博弈过程的深刻影响与具体作用。
(三)最优冲突管理——强制下民主配合制度创新
组织冲突多是个人目标实现与组织强调经济决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致。根据有关冲突的研究,无论是业绩优异的公司管理者,还是业绩差的公司管理者,解决冲突的考虑首先均为合作型。然而次优方案的选择就差异很大,前者多采取强制姿态,而后者多采取姑息对策,由此可以导出最为有效地解决冲突的方法是强制的并以合作型为支持。由于合作型是采取基于民主解决问题的开放交流形式,可以说强制力下并给予民主的行动是解决冲突的最为有效的方法。[8]这也说明经济的博弈均衡并不一定是帕雷托最优的,个人理性和集体理性可能存在着矛盾和冲突,对于这种矛盾和冲突,不在于否定个人理性,关键是通过设计一种制度的创新,建立起一种新的使得在满足个人理性的基础上能够达到集体理性的机制。
Rummel认为冲突过程从平衡与不平衡中间移动,达成一种平衡。同时冲突关联利益人的关系也未必是全然相互竞争的,在运用冲突管理的原则与方法时,反而通常存在竞争与合作的混合关系,贯穿如:(1)对事(或问题)不对人;(2)重视利益而非坚守立场;(3)寻求互利的方案;(4)兼顾主、客观评估标准等态度,追求整合协商谈判(integrativebargaining),所谓的双赢(win-win)才有机会。[4]但纳什均衡博弈论由于仅关注个体行为的合理性。不可避免的是它在解决组织冲突中的局限性,博弈论描绘出困境,却难以解决困境。纳什均衡博弈论也不能从根本上保护博弈各方的利益,博弈不能带来共赢,却可能造成共输(simultaneity-loss)。[9]
参考文献:
[1]DEBORAHM.KOLB,JUDITHWILLIAMS.Breakthroughbargaining[M].HarvardBussinessReview,2001:89~97.
[2]STEPENIEOVERMAN.Makefamily-friendlyinitiativesfly[M].HRFocus,1999:14.
[3]莫燕,周建中.基于博弈论的企业技术创新对策研究[J].技术经济2002(7):10-12.
[4]弗雷德•鲁森斯.组织行为学[M].王垒,译.北京:人民邮电出版社,2004.
[5]汪明生,朱斌妤.冲突管理[M].北京:九州出版社,2001.
[6]刘仁军.组织冲突的结构因素研究[J].南开管理评论,2001(4):30-33.
[7]张维迎.博弈论和信息经济学[M].上海:上海三联书社,上海人民出版社,2002.
篇6
1基站自优化系统模型研究
1.1博弈理论博弈论又称为对策论,包括参与者(player)、策略(strategies)、收益(payoff)等要素,目标是找到各参与者间最优的策略选择以及选择策略时的博弈结果、分析这些结果的数学理论和方法。本文采用了协作博弈的思想,博弈的要素包括:博弈参与者是各小区,策略是子信道上的发射功率集合,收益是吞吐量。首先引用了净函数的概念,净函数包括效用函数和代价函数。其中,效用函数代表一个小区的容量,代价函数代表需要基站付出的“代价”。然后模拟最大化多小区OFDMA系统的总容量,最优化基站能耗的博弈过程。在该博弈过程中,每个小区的基站独立控制本小区的子信道分配,独立地进行功率分配,从而最大化本小区的容量。
1.2效用函数效用函数是一个微观经济学的概念,用来表示消费者所获得的收益与消费的商品之间数量关系。效用函数应用在无线通信的功率控制问题中,通常选取用户的信干比γ和发射功率P作为参数。当发射功率P固定时,效用函数Ui是信干比γ的单调增函数;当信干比γ固定时,效用函数Ui是发射功率P的单调减函数;当发射功率趋于无穷大时,效用函数值为零;当发射功率趋于零时,效用函数值为零。因此,能耗博弈的效用函数表达式如。
1.3代价函数小区簇内每个小区都试图最大化自己的效用函数,从而会对小区簇内其他小区造成影响,因此在博弈过程中引入了代价函数。代价函数是指博弈过程中每个小区在提高自身发射功率的同时,需要付出相应的“代价”。引入代价函数可对发射功率进行限制,以达到降低系统干扰、增加系统整体收益的目的。代价函数定义如下。
1.4能耗博弈算法(1)初始化小区簇内各小区各子信道的发射功率,即把各小区的发射功率平均发给各个子信道,此时的子信道发射功率为P(0)。定义一个计算精度t,设置为0.1,设置一个更新次数n。(2)各个小区的子信道更新自身的发射功率。对于第n次功率更新的功率为P(n),第(n-1)次更新为(3)当|P(n)-P(n-1)|<t,即功率收敛,找出U(n)中最大的净函数Umax(n),认为此时的功率为最优功率,否则返回步骤(2)继续执行。(4)累加每个小区各信道的发射功率,得出每个小区的发射功率。算法流程图如图1所示。
2节能模块实现方案
基于上文提出的LTE网络基站自优化的节能方法,可在基站增加节能模块装置,实现基站的自优化节能。节能模块原理图如图2所示。在基站的主控板上增加能耗博弈模块,该模块包括定时器、信息采集模块、SNR处理模块、功率处理模块等。模块的工作流程如下:(1)通过定时器在设置时间周期内对网管下达指令,要求发送本小区和小区簇内邻小区的检测数据包。(2)信息采集模块根据检测数据包采集本小区和相邻小区的发射功率以及路径损耗等数据信息。(3)SNR处理模块根据数据信息计算小区的信干比。(4)功率处理模块根据信干比、数据信息等数据代入净函数,循环进行能耗博弈运算,最终得到函数收敛时的最优发射功率,并根据结果实时调整该基站小区的发射功率。
3实验室仿真测试
针对基于博弈论的LTE基站自优化节能方法,笔者在实验室开展了详细的测试研究工作,主要验证技术可行性及节能效果。本文采用的仿真模型:系统带宽为10MHz,子载波带宽为15kHz,则子载波数为600个,假设每25个子载波组成1个子信道,则系统共有24个子信道,小区簇内每基站3小区,每小区均匀分布5个用户。仿真参数具体如表1所示。图3为系统模型在不同定价因子下获得的系统总吞吐量仿真结果。由图3可知,当定价因子为0时,则代价函数为0,此时系统的净函数即为效用函数,系统的吞吐量为满功率发射时的吞吐量;定价因子越小,系统干扰就越大,系统吞吐量也越低;反之亦然。综合测试数据,该算法与传统的系统最大功率发射相比,系统总体容量可提高1.23%。在不同定价因子的情况下,系统的能耗也有差别。图4为在不同定价因子下的小区平均功率仿真结果。当定价因子取值较小时,系统收敛到一个较大的功率值;当定价因子取值较大时,则功率较小;当定价因子为0时,小区平均功率最大。综合以上结果可得到最佳的定价因子,使得系统的吞吐量和发射功率达到博弈的最优配置。从以上仿真可知,在最高功耗与最优功耗对比中,最优功耗的功率比最高功耗低30%,系统吞吐量提升1.23%,该方法能在降低功耗的同时保证系统的吞吐量,具体如图5和图6所示。
4结束语
篇7
关键词:博弈、纳什均衡、帕累托效应、垂直营销系统、“囚徒悖论”
最近几年,随着企业之间的竞争日益加剧,终端的竞争越演越烈,渠道的竞争逐渐从最初的诸侯纷争走向大型集团之间的直接对抗,企业在这种情况下的渠道战略必须在充分掌握竞争对手信息和策略的情况下进行,渠道成员在冲突与合作的反复演练中,纷纷结成一体化的营销系统。这类问题实质上都可归结为博弈问题。企业运用博弈论重塑渠道策略将使渠道决策过程更加合理化。
传统渠道策略与纳什均衡
传统渠道往往由一群独立的厂商、批发商与零售商所组成,每一成员都是一个分离的企业个体,各自追求自身利润的极大化,渠道中没有一个成员对其他的成员有绝对或足够的控制力,也没有一个正式的机构来指派角色和解决冲突。在传统的渠道中,正如美国的一位学者曾指出:“在支离破碎的网络中松散地排列着生产商、批发商和零售商,他们在保持距离的情况下相互讨价还价,谈判销售条件,并且在其它方面自主行事。”
从博弈论角度看,渠道成员机会主义行事,对个人收益最大化的追求导致了纳什均衡。所谓纳什均衡是指博弈论中当事人的一组策略,当其他参与人的策略既定时,没有任何一个参与人还能改善他或她的支付。也就是说,给定参与人A的策略,参与人B无法做得更好;而给定参与人B的策略,A也不能做得更好。纳什均衡有时也称为非合作均衡。
博弈论(gametheory),是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。即当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。简言之,冲突中公共关系所表现的组织与公众之间行为的影响和作用,人们之间的利益冲突与一致,竞争与合作的平衡,恰恰是博弈论“在给定的约束条件下追求效用最大化”研究模式的充分表达。
1994年诺贝尔经济学奖授予普林斯顿大学数学家约翰,纳什(JohnNash),匈牙利裔美籍经济学家斯坦福大学的豪尔绍尼(Harsanyi,J.),德国经济学家泽尔滕(Selten,R.),他们三人对博弈论的发展作出了决定性的贡献。
博弈论最有名的“囚徒悖论”说的是两个囚犯的故事。两个囚徒一起做坏事,结果被警察抓获,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者坦白,或者抵赖。
无论A犯B犯都会马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,最终结果是两人都选择坦白,各判5年。其实。如果两个人都抵赖,各判2年,当然比都坦白各判5年要好,但这个帕累托改进办不到。在静态的博弈过程中,由于理性经济人的机会主义倾向,必然是一个“纳什均衡解”。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
在传统的渠道策略中,渠道成员为相互独立的追求个人利益最大化的个体,在这里每个渠道成员都是机会主义者。这种个人收益的最大化必然引起渠道成员的冲突,结果由于冲突反而导致交易费用增加,收益受损。
改善渠道价值链,创造市场的帕累托最优
分销渠道作为产品的所有权和实体从生产领域流转到消费领域所经过的通道,由所有参与使产品从生产领域向消费领域运动的组织和个人所组成,主要包括生产者、批发商、零售商、商和储运企业等,甚至还包括消费者,它们都是渠道成员。每个参与者就如同是搏弈论中的局中人,渠道成员的每一营销决策都会对其他参与者产生影响,参与者的反应反过来又会影响公司的下一步决策,如何决策才能使大家的利益达到最优均衡呢,这正是博弈论所研究的问题。要达到最优均衡,渠道成员间必须走向合作,渠道成员间的合作优于不合作的解。因为具有合作希望的博弈规则,允许商讨策略,带有或是不带有允诺转让的支付。通过局中人协商,所达成的合作优于不合作的解,一般不会出现最差的结果。协商有利于调整各局中人的利益,而不必将矛盾引发。
生产者、批发商和零售商为了相互的利益而进行合作,它们通过一系列的业务活动相互满足对方的需要。同单个企业的单独活动相比,渠道成员合作能为各方带来更大的经济效益。老于世故的公司努力与它们的分销商建立长久的关系,它们清楚地知道它们在市场份额、库存水平、市场开发、寻找客户、技术建议与支持、市场信息等诸多方面都需要分销商的合作。
过去,大多数厂商认为取得中间商的合作问题,要采用胡萝卜加大棒的政策,一方面,提供较高的折扣率、某些优惠条件,另一方面,采用制裁措施,威胁减少中间商的利润、推迟交货、中止关系等。这种政策的短处是厂商根本不关心中间商的需要、问题、长处和短处,仅仅依据单一的刺激一反应模式,将众多的激励因素拼凑在一起。现在,渠道成员间的合作开始向纵深发展。如联想为了避免渠道成员不稳固、松散型的联盟关系,提出了渠道的大联想计划,把厂商和经销商的关系提升为一体化的联盟关系。为了保证大联想机制的健全和这一计划的不断推进,联想还建立了一系列的监督、保障机制,成立了专门的大联想顾问委员会,大联想渠道中的一些重大问题、前瞻性问题和亟待解决的问题都会在顾问委员会中讨论,厂家和商一起来商量和决定。
一体化的垂直营销系统:利益关系重新洗牌
从中国最近几年渠道的发展趋势看,垂直营销系统是渠道博弈演化的一个必然方向。垂直营销系统(简称VMS)的厂商、批发商和零售商结为一体,渠道的成员有的同属一个公司,有的具有特许权关系,有的有足够的力量使其他的成负与之合作。垂直营销系统的支配者可以是厂商,也可以是批发商或零售商。垂直营销系统可以有效地控制成员的行动,管理渠道成员各自追求其目标所发生的冲突。它可以实现规模经济,增加谈判力量,避免提供重复的服务。
以温州的企业为例,最近几年,无论是低压电器、服装还是皮鞋,基本上都采用了厂商主导型的垂直营销系统。如皮鞋业“奥康”,从1997年开始,就在全国各省设立自己的分公司,由总部直接下派人员进行供货与管理,从而建立起强有力的由厂家控制的垂直营销系统。此举虽然在刚开始时加大营销成本,但能更有效地控制渠道与控制资源,使得奥康几年来平稳发展。1998年,奥康在温州开了第一家连锁专卖店,尔后在短短的三年中,连锁专卖店达1800多家。这一有效的博弈演化,对于奥康的获利与发展起到了至关重要的作用。
在药品行业,这一演化趋势同样明显,最新的入世谈判资料显示,截止2003年1月1日开始,中国将开放药品分销服务体系,允许国外商业参与中国的医药商业经营,从事采购、批发、仓贮、派送、售后服务等一系列经营活动,中国医药零售商与外资合作来发展自己的方向已成定局。在东阿阿胶品牌发展中,商业企业以“东阿阿胶顾问团”的形式和企业组成战略联盟,共同促进品牌的大发展;这也是垂直营销系统的一种方式,商业与企业之间结成战略联盟的关系,互相促进,互相维护对方的经济利益。
目前,垂直营销系统分为厂商主导型与中间商主导型二种,厂商主导型以汽车、软饮料、专利药品、牙膏、电视机与照相机居多。对这类产品来说,厂商因财力上优势从而在渠道路线中具有支配力量。为了推销这些产品,单是全国性的广告,就花费数百万元。极少有中间商能作如此大的投资。中间商主导型多为家庭用品与时尚物品,这些产品面对当地市场上迅速转变的需求,厂商无法轻易地预测了解当地的需求情势,结果领导权就落在中间商手中。大的零售商在近年来也逐渐开始使用这一积极进取的营销系统。
参考资料:
《博弈论与信息经济学》作者:张维迎上海三联书店《营销管理》作者:菲利普.科特勒上海人民出版社
《营销学原理》作者:科特勒、阿姆斯特朗
《博弈竞争与营销决策》作者:严浩、吕晶《销售与市场》1997年第十二期
篇8
Abstract: This paper introduces the influence factors such as the electricity suppliers and the transmission and distribution of electricity market, and constructs the marketing evolution game model of A and B, which is a strong selling electricity suppliers and the weak electricity suppliers. Through the use of a variety of different data, the results show that in the transmission and sale of electric power, we must consider the dynamic transmission and distribution in the form of mixed transmission and distribution price to achieve the optimal balance of power market.
P键词: 双寡头市场;演化博弈;输配电价;均衡最优
Key words: duopoly market;evolutionary game;transmission and distribution;optimal equilibrium
中图分类号:F270.7 文献标识码:A 文章编号:1006-4311(2017)17-0001-04
0 引言
随着国家经济增长放缓,电力需求进入换挡期,售电侧向社会放开,各大电力产业关联公司都纷纷成立售电公司来应对电力改革形势。在打破售电市场垄断的大前提下,各方如何在利益上达到最优平衡点,采取最优营销策略是需要研究的重点。目前研究者大多从发电侧、区域电能交易、发电厂竞价策略做出深入研究。例如:叶佳明引入的有限理性古诺博弈,提出电力市场有限理性古诺博弈的时滞后混沌控制方法;张程应用演化博弈理论中的多群体复制动态博弈模型,对电力公司与发电厂商竞价策略的演化过程进行模拟并研究其演化稳定策略。
本文在众多学者研究的基础上,吸取其精华,提出基于古诺-霍特林双寡头售电市场竞争模型,构建强势与弱势售电商及发电商的演化博弈模型,分析相关参数对演化博弈结果的影响,为实现多方共赢提供理论依据。
1 古诺-霍特林模型与空间区位竞争理论
古诺模型是由法国经济学家安东尼・奥古斯丁・库尔诺于1838年提出的,通常被作为寡头理论分析的出发点。古诺模型是一个只有两个寡头厂商的简单模型。该模型假定一种产品市场只有两个卖者,并且相互间没有任何勾结行为,但相互间都知道对方将怎样行动,从而各自怎样确定最优的产量来实现利润最大化。该模型阐述了相互竞争而没有相互协调的厂商的产量决策是如何相互作用从而产生一个位于竞争均衡和垄断均衡之间的结果。古诺模型的结论可以很容易地推广到三个及以上的寡头厂商的情况中去。
自古诺模型创建以来,经济学界更加关注寡头市场竞争问题。法国学者伯川德以价格作为决策变量,建立了不同于古诺以产量作为决策变量的寡头市场竞争模型,他认为如果同业中两家厂商经营生产成本相同的同种产品,则价格竞争的结果是每家厂商都按价格等于边际成本来经营,厂商只能获取正常利润,这就是“伯川德均衡”。但这一结论与现实并不相符,现实市场价格竞争的事实是均衡价格高于边际成本,厂商会获取超额利润。然而寡头竞争市场无法达到“伯川德均衡”。这种现实市场竞争与理论相背离的现象被称为“伯川德悖论”。在对“伯川德悖论”的理论解释中,最有代表性的一种是由霍特林开创的。他从厂商空间地理区位以及消费者到厂商交通成本差异的角度来研究“伯川德悖论”,通过引入厂商在空间区位上的差异来将“伯川德悖论”一般化。霍特林从厂商不同空间位置出发,首次建立了一个线性(直线段)市场上的双寡头厂商定位模型。在没有价格竞争(每一个厂商都以边际成本定价)的情况下,厂商追求利润最大化的结果就是每一个厂商都倾向聚集在市场中心,即最小差异原理。因为在一条长度给定的直线上均匀地分布着消费者,在这个市场上两个厂商都向消费者出售相同的产品,消费者到厂商的交通成本是厂商与消费者之距离的线性函数,在厂商出售产品价格相同的条件下,每一个消费者都会到离自己距离最近的厂商去购买产品。厂商之间的竞争就变成了如何在既定线段上选择一个点,使自己所占据的线段达到最大化。
霍特林模型的基本假设:
①产品同质;
②决策变量是价格;
③消费者分布在一条线性的市场上,市场总距离为S公里,每公里有一个消费者,每个消费者购买一件商品;
④消费者购买商品的交通成本与离商店的距离成比例,单位距离的交通成本为t。如图1所示,寡头1的位置位于地点A,寡头2的位置位于地点B,AB为寡头1和寡头2需竞争的地盘,若最终寡头1争夺到的地盘为AE=x;寡头2的争夺到的地盘为BE=y,则一定有:
S=a+x+y+b (1)
2 基于古诺-霍特林双寡头售电市场的竞争分析
目前电网电力供销盈利模式是采用销售电价和上网电价的差值部分作为主要盈利点,随着大用户直购电的推广和售电侧放开等相关政策的出台,未来电网企业的收入将主要依靠外部售电公司和发电企业交易产生的输配电价过网费以及从自身售电业务中赚取利润。而电网企业下属的售电公司在各大电力企业成立的售电公司中必将在一定时期内的电力市场中处于强势地位(简称其公司A),而新兴成立的售电商由于售电业务以及人才的欠缺等因素相对比较弱势(简称其公司B)。发电商通过售电商A和售电商B向消费者供电。发电商给予售电商A的上网电价为P1,而给予售电商B的上网电价P1+Δp,其中Δp为发电商的决策变量。
古诺-霍特林模型是假设存在一个“线性城市”,城市线性长度标准化为1,用户均匀分布在线性城市[0,1]之间,假设售电商A在线性城市0端点处,售电商B在线性城市1端点处,两个售电商A、B的产品是同质的,且两家企业同时决定各自产量。
但考虑实际购售电行为中,售电商A、B要选择合适的输配电价方式,即固定输配电价方式M和动态输配电价方式F,其中固定输配电价方式价格记为m,其价格不随线性城市输电距离变化而变化,动态输配电价方式F为变动值,且随着距离x的变长而增长。售电商A、B都是在已知对方市场份额的情况下,各自确定能够给自己带来最大利润的份额。
讨论以下几种博弈模型:
情形1:售电商A、B均采取动态输配电价方式F。
设售电商A和B的不含输配电价费用的售电价格为PA和PB,x表示用户距端点0即零售商A的标准化长度,则用户向A或B购买电力商品的用电价格分别为PA+tx和PB+(1-x)t。
设x1点为用户在A和B购买电力无差异位置,则x1点满足以下条件:
PA+tx1=PB+(1-x1)t (2)
解得:x1=
由(2)式可得强势售电商A和弱势售电商B的市场份额占比。分布在[0,x1]之间的消费者选择强势售电商A,分布在[x1,1]之间的消费者选择向售电商B购买产品。因此,售电商A的市场份额为,售电商B的市场份额为1-则售电商A和B的利润函数分别为:
I=(PA-P1)()(3)
I=(PB-P1-?驻P)(1-)(4)
由最优一阶条件可知,对(3)、(4)式中I、I分别求解关于PA、PB的偏导,当=0和=0时,得到售电商A和B的最优售电价格分别为
P=t+P1+1/3Δp (5)
P=t+P1+2/3Δp(6)
不失一般性,假设发电商的生产成本为0,得到生产上的利润函数为:
I=P1()+(P1+ΔP)()(7)
对(7)中的I求解关于Δp的偏导,由最优一阶条件=0,得此时发电商加价Δp=t,有两售电商最优利润为I=t,I=t
情形2:若售电商A采取固定输配电价方式M。售电商B采取动态输配电价方式F。
设x2点为用户在A和B购买电力无差异位置,则x2点满足以下条件:
PA+m=PB+(1-x2)t(8)
解得:x2=
同理,基于(8)式可得售电商A的市场份额为,售电商B的市场份额为1-,则售电商A和B的利润函数分别为:
I=(PA-P1)()(9)
I=(PB-P1-ΔP)(1-)(10)
由最优一阶条件可知,对于(9)、(10)式中I、I分别求解关于PA、PB的偏导,当=0和=0时,得到售电商A和B的最优售电价格为:
P=t-m/3+P1+1/3Δp (11)
P=t+m/3+P1+2/3Δp(12)
不失一般性,假设发电商的制造成本为0,发电商的利润函数为
I=P1()+(P1+ΔP)(1-)(13)
对(13)中的I求解关于Δp的偏导,当最优一阶条件=0,得出Δp=。I= I=
情形3:若售商B采取固定输配电价方式M。售电商A采取动态输配电价方式F。
设x3点为用户在A和B购买电力无差异位置,则x3点满足以下条件
PA+tx3=PB+m(14)
x3=
同理,可得售电商A的市场份额为,售电商B的市场份额占比为1-。
则售电商A和B的利润函数分别为:
I=(PA-P1)()(15)
I=(PB-P1-?驻P)(1-)(16)
由最优一阶条件可知,对于(15)、(16)式中I、I分别求解关于PA、PB的偏导,当=0和=0时,得到售电商A和B的最优售电价格为
P3A=(m+t)/3+P1+1/3Δp(17)
P3B=(2t-m)/3+P1+2/3Δp(18)
不失一般性,假设发电商的制造成本为0,发电商的利润函数为
I=P1()+(P1+ΔP)(1-)(19)
对(19)式中的I求解关于Δp的偏导,最优一阶条件=0,得出
Δp=
I= I=
情形4:若售电商A和B均采用固定输配电价方式M。
则售电商A和B的利润函数分别为:
I=(PA-P1)()(20)
I=(PA-P1-ΔP)(1-)(21)
不失一般性,假设发电商的制造成本为0,发电商的利润函数为
I=P1+ΔP(22)
可以发现,售电商A和B的最优价格都是随着对方的价格的升高而升高,因此不能形成三方均衡均衡博弈,且依赖于双方初始收益,这里记初始收益为IrA、IrB。
3 线性电力市场演化竞争分析
由于售电商A和B博弈主体具有有限理性,最开始选择的并不一定是最优,但售电商随时间不断的学习和选择,最终会确定最优的均衡策略。
售电商A和B随机独立地选取固定输配电价和动态输配电价,并在电力市场中同时重复博弈,因此会在不同的线性城市空间区域选择不同的输配电价方式,假设售电商A选择动态输配电价方式F和固定输配电价方式M的比例分别为x和1-x,售电商B选择动态输配电价F和固定输配电价M的比例为y和1-y,计算出售电商A策略M和策略F的收益,这里计收益函数为I1、I2,最终售电商A和售电商B在自身占有市场内选择输配电价的稳定博弈状态有以下几种可能状态:
①A全部选择固定输配电价方式M,B全部选择动态输配电价方式F,记该状态为(0,1);
②A全部选择动态输配电价方式F,B全部选择固定输配电价方式M,记该状态为(1,0);
③AB都选择固定输配电价方式M,记该状态为(0,0);
④AB都选择动态输配电价方式F,记该状态为(1,1)。
售电商A和B对应的最终状态战略式如表1所示。
可以得到售电商A的收益为:
I1=txy+x(1-y)+(1-x)y+(1-x)(1-y)IrA(23)
售电商B的收益为:
I2=txy+x(1-y)+(1-x)y+(1-x)(1-y)IrB(24)
两者动态博弈方程为:
1=x(x-1)[-ty+y-+(1-y)IrA](25)
2=y(y-1)[-tx+x-+(1-x)IrB](26)
对两动态方程为0的点进行分析,得出:
y=,
x=
我们首先对售电商A的收益动态博弈方程进行分析。
通过分析,只有在m>>t时,才有y1,所以y
同样的,对于售电商B,若x>1,即m>t时,y1=0和y2=1是两个稳定状态,其中,y2=1是演化稳定的。
若x
令x″=,
当x>x″时,y1=0和y2=1是两个稳定状态,其中y2=0是演化稳定的。当x=x″时,所有的y都是稳定状态。当x
把上述售电商A和售电商B竞争的复制动态关系如图2和3所示。
从上面图中可以看出,当x>1时,AB售电商仅有(1,1)唯一演化稳定状态,当x
若AB售电商两者初状态落在初始区域S’内,则最终演化稳定状态为(1,0),即售电商A采用动态输配电价、售电商B采用比最大动态输配电价便宜很多的固定输配电价(m
4 总结与展望
本文通过建立霍特林模型,模拟双寡头手电市场,应用演化博弈理论,考虑了动态输配电价和固定输配电价两种情况下,电力市场中发电商、售电商和输电费用的三者博弈的最优演化结果,通过分析可以发现以下结论:在售电市场放开的情况下,存在强势售电商、弱势售电商和发电商三者博弈,若对售电商都采用固定输配电价模式,必然不能达成最优纳什均衡,因此要培养成型的电力市场(发电、输电、售电)竞争中必须要考虑灵活输配电价形式或者对于弱势售电商采取相对固定保护的输配电价,从而达到电力市场的均衡最优。
因此电网企业在竞争中需要审时度势,因地制宜的采取售电营销措施,将自身利益和市场利益的有序结合,为多方共赢提供理论依据。在后续的研究中,将从输电、发电、售电三方角度以及应用更加实际的市场模型进行分析博弈最优理论分析。
参考文献:
[1]叶佳明,吴刚.电力市场有限理性古诺动态博弈的经济评价及其混沌控制[J].陕西电力,2009,4(37):4-6.
[2]金,杜建国,盛昭瀚.区域环境保护行动的演化博弈分析[J].系统工程理论与实践,2015,12(35):3107-3118.
[3]张程,杜松怀,苏娟.基于演化博弈的区域电力市场报价策略研究[J]现代电力,2010,2(27:87-90.
[4]张新华,赖明勇.随机需求下电力竞价市场演化均衡分析[J].系统工程,2007,25(1):78-82.
[5]吴宁,祖博,吴军基.演化博弈论在发电侧电力市场竞价中的应用[J].2006,华东电力,2006,34(3):35-38.
[6]黄伟,李玟萱,李宁坤,等.基于Bertrand模型的2类售电企业定价策略[J].电力建设,2016,37(3):76-81.
[7]谢识予.经济博弈论[M].上海:复旦大学出版社,2002:233-273.
[8]杨洪明,赖明勇.考虑输电压约束的电力市场有限理性古诺博弈的动态演化研究[J].中国电机工程学报,2005,12(23):71-79.
篇9
[关键词]公职人员败德行为监管博弈
一、博弈论的引入
博弈论研究的是决策主体的行为发生直接相互作用时的决策以及这种决策均衡问题,应用最普遍的是纳什均衡。而纳什均衡,是指一组满足给定对手的行为,各博弈方所做的是它所能做的最好的策略,为一种非合作博弈。博弈论的基本假设有两个:一是强调个体行为理性,假设当事人在进行“决策”时,能够充分考虑到他所面临的局面,即他必须并且能够充分考虑到人们之间行为的相互作用及其可能影响,并能够做出合乎理性的选择;二是假设博弈各方最大化自己的目标函数,能够选择使自身效益最大化的策略。博弈论分析的实质是,在经济主体理性的条件下,行为主体根据给定的条件及对方的行为(策略)等,来决定自己的行为(策略),从而使自己的利益最大化。
公职人员败德行为及其监管的主体是公职人员及其监管方,他们一般是行为理性的,显然能清楚地认识到拥有某种重要社会地位、薪金收入等的自身价值。但面临纷繁复杂的外部环境诱惑,局中人还是会作出不同的决策,即选择严监管与否、选择败德行为与否取决于行为人对自身价值的认识及与预期收益的比较,这几点正好符合博弈论分析的基本特征,因此我们可以将博弈论引入公职人员败德行为的研究中,来分析公职人员败德行为及其监管,并在此基础上提出治理建议。
二、公职人员败德行为及其监管的博弈分析
(一)博弈模型的选择
根据上述假设及分析建立公职人员败德行为及其监管的博弈模型。监管方的纯策略选择是严监管或松监管(不监管是松监管的极限状态),公职人员的纯策略选择是实施败德行为或不实施败德行为。表1概括了对应不同纯策略组合的支付矩阵。矩阵中第一个数字为监管收益,第二个数字为公职人员收益。其中:Cs是监管方实施松监管的成本(不监管时Cs=0),Cy为监管方实行严监管多支付的成本,Mg指公职人员实施败德行为未被查出预期所得收益(包括政治利益、经济利益和其它不当得利等),Lj表示监管人员工作失职可能受到的惩罚(包括刑事责任、行政处分、经济处罚等),Lg代表公职人员实施败德行为被查出可能受到的惩罚(亦包括刑事责任、行政处分、经济处罚等)。
假设各利益相关者的策略如下:
Pj:监管方严监管的概率,则(1-Pj)为松监管概率;
Pg:公职人员实施败德行为的概率,则(1-Pg)为不实施败德行为的概率。
矩阵中的四种策略组合表示的意义:当监管方严监管时公职人员公然实施败德行为,此时公职人员败德行为被查出将蒙受Lg的损失,而工作出色的监管人员将获得奖励Mj,Mj扣除严监管的成本(Cs+Cy)为监管方的净收益;当监管方严监管时,公职人员选择遵纪守法不实施败德行为,则监管方损失严监管的成本(Cs+Cy),而公职人员既无损失也无收益(收益为0);当监管方松监管甚至不监管时,公职人员若选择败德行为,此时监管方因监管人员失职而受惩处导致损失(Cs+Lj),而公职人员则因败德行为得逞获得不当得利Mg;当监管方松监管时,公职人员如没有败德行为,此时监管方会损失松监管成本Cs,而公职人员当然既无损失也无收益(得益为0)。
表1:公职人员败德行为及其监管得益矩阵
得益矩阵
公职人员
实施败德行为Pg
不实施败德行为1-Pg
监管方
严监管
Pj
Mj-(Cs+Cy),-Lg
-(Cs+Cy),0
松监管
1-Pj
-(Cs+Lj),Mg
-Cs,0
通过以上分析可知,如果监管方实施松监管,公职人员的最佳策略是实施败德行为,以获取额外非法得益;而当公职人员实施败德行为时,监管方的最佳策略是进行严监管,以打击作奸犯科者,保障国家或企业不受损失。既然监管方实施严监管,公职人员的最佳策略是不实施败德行为,以免受惩罚;而当公职人员不实施败德行为时,监管方的最佳策略是进行松监管甚至不监管,使监管成本最小化……如此重复的结果,不可能产生一个使博弈双方愿意单独改变自己策略的纯策略组合,而只能以上面假设的某种概率,如Pg、Pj等随机地选择不同的策略组合构成混合策略博弈的纳计均衡。根据纳什定理,在这种均衡条件下,监管方和公职人员都无法通过改变自己的混合策略来改善自己的得益。
如果设监管方和公职人员的期望收益分别为Ej和Eg,则:
Ej=Pj·{[Mj-(Cs+Cy)]·Pg+[-(Cs+Cy)](1-Pg)}
+(1-Pj)[-(Cs+Lj)·Pg+(-Cs)(1,-Pg)]
=MjPjPg+LjPjPg-CyPj-LjPg-Cs
Eg=Pg·[-Lg·Pj+Mg·(1-Pj)]+(1-Pg)[0·Pj+0·(1-Pj)]
=MgPg-LgPjPg-MgPjPg
若使公职人员败德行为及其监管的混合策略博弈达到纳什均衡,
则:
MjPg+LjPg-Cy=0(1·1)
Mg-LgPj-MgPj=0(1·2)
解(1·1)、(1·2)组成的方程组,求得该混合策略的纳什均衡解为:
=Mg/(Mg+Lg)和=Cy/(Mj+Lj)
(二)数据分析
在监管人员查出败德行为所得奖励Mj和因工作失职而受到的惩处Lj既定的情况下,即对监管人员工作业绩的奖惩力度一定时,公职人员实施败德行为的最优概率取决于监管方实行严监管多支付的成本Cy,且与其成正比。这预示着发现败德行为需要支付很高的监管成本,没有付出高企的额外成本就不能发现败德行为,意味着发现败德行为的概率降低了,因而实施败德行为变得相对的容易,故败德行为的发生概率随着监管成本的增加反而提高了。反过来说,在一定条件下,设法降低严监管多支付的成本就可以降低败德行为的发生概率;同理,Cy一定时加大对监管人员工作业绩的奖惩力度能达到同样的监管效果。但是,降低监管方的监管成本,加大对监管人员工作业绩的奖惩力度,在短期内可提高监管人员实施严监管的积极性,但长期效果如何呢?
当Pg>时,监管方的最佳策略是选择严监管。而根据=Cy/(Mj+Lj),公职人员选择实施败德行为的最优概率只与Cy、Mj、Lj有关,即与Cy成正比,与Mj、Lj两者之和成反比。因而,降低Cy、提高Mj和Lj,都能降低发生败德行为的最优概率,从而达到Pg>,促使监管人员履行职责。但长此以往,在监管方实施严监管后,公职人员又会趋于选择职务合法合规行为,而使败德行为概率Pg降低,低至一定幅度就会导致监管方严监管与松监管两者的期望收益等值,监管方又会重新选择混合策略,出现重复博弈。而=Mg/(Mg+Lg)表明混合策略中监管方选择严监管的概率主要与Mg、Lg有关,而与监管人员松监管所受惩处Lj无关。因此,单纯降低监管方的监管成本、加大对监管人员的惩罚力度,而不改变公职人员期望得益,虽短期有作用,但长期来看却并未改变监管人员的博弈策略选择,对败德行为效果不大。
同样地,当Pj>时,公职人员最优选择是遵纪守法。故要使监管有效,必须降低值。而由推导知,=Mg/(Mg+Lg)。在现实经济生活中,公职人员未被查出预期所得收益Mg是外生变量,虽然在不同的败德行为行为中由案件的严重性决定可大可小,但在某一固定事件中通常为一常量,即可确定监管者的最优概率主要取决于败德行为被查出受到的惩罚Lg,且成非严格意义上的反比关系。因而加大惩处力度,使Lg值变大,将降低监管方的最优概率,从而形成Pj>的局面,促使公职人员选择不实施败德行为。但久而久之,在没有败德行为的情况下,监管方必然会理性地放松警惕,降低监管力度至一定程度时,败德行为实施与否的期望收益相等,公职人员又会重新选择混合策略,导致重复博弈。结果呢?根据=Cy/(Mj+Lj),与Lg无关,即实施败德行为的最优概率与被查出的损失无关。此时即使被查出的损失Lg足够大,根据博弈理论,如果监管乏力,对公职人员而言也只是不可置信的威胁,必然继续延续前科。因此,单纯加强对公职人员败德行为的惩处力度,加大其损失,而不改变监管人员的期望得益,虽然短期内使公职人员败德行为有所收敛,但长期也将导致监管人员降低监管力度,难以真正发挥控制败德行为的作用。
三、启示及建议
(一)公职人员是否实施败德行为及监管人员能否履行职责是问题的两个方面,单纯采取对一方的奖惩来诱导其行为也许短期有效,但从长期看,并不能改善任何一方的理性和道德风险行为。为了达到(松监管,不败德行为)的目标,我们过去总是片面强调加大惩罚力度,因为在一定范围内惩罚得越严厉就越接近这一目标;与此同时,也提倡配合一定的激励措施,希望达到监管方和公职人员的双赢。但惩罚和激励措施必须适度,而实际很难把握:对惩罚而言,力度过大会使部分公职人员产生逆反心理,形成拼死一搏的倾向,反而达不到约束的作用;对于激励而言,其效果受多种因素影响,激励程度不够,会使监管人员在收益增加的情况下仍然松于监管,而过分激励、收益过多会使监管人员产生当前的收益已经足够了的想法,丧失进取动力,同样达不到目的。笔者认为,由检查力度、处罚力度和处罚执行力度三者合一所决定的监管环境是制约败德行为的关键因素。治理败德行为,应由目前的加强对败德行为公职人员的惩处力度为主,逐渐过渡到提高对违法者的检查力度和处罚执行力度与加强对败德行为的惩处力度并重,加大对监管人员失职行为的处罚力度与降低监管成本并重,建立健全教育、制度、监督并重。
(二)博弈论的研究表明,一个人作出的选择,取决于其对该选择成本收益的预期以及对他人选择的预期。给定必需的权力和信息不完全这两个条件,败德行为及其监管的内在逻辑沿着成本和收益变动的路径展开。因此,权力配置结构问题是监管败德行为机制设计及战略选择的根本问题。亦即监管败德行为不能局限于在权力既定这一约束条件下只是通过加强对权力的外部制约来监督控制公职人员败德行为而不改变现有的权力结构。如扩大公众的监督权,把某些不必要集中的权力下放到市场中,是监管败德行为的釜底抽薪之计。其次,改善权力配置的信息结构、提高透明度,包括完善政务公开、重大问题决策公开、选拔干部公开等制度,细化公职人员职务权力义务的规定等是监管败德行为的另一项重要措施。另外,给定监管败德行为的必要条件(如制度、信息不完备),监管人员与公职人员的期望得益、价值取向和道德约束主宰着实施败德行为的动机,从另一侧面说明了建立健全教育、制度、监督并重的惩治和预防腐败体系的特殊意义。
(三)博弈过程是一个长期复杂的过程。松监管,不败德行为作为我们追求的最终目标,是均衡点而不是一次博弈的结果。它是博弈双方经过长期磨合和斗争、反复修订各自的策略、经过多次博弈最终形成的结论。随着内外部环境的变化,隔一段时间各方还要进行修订,以逐步接近最佳点。而且,达到最佳点涉及到政府政策、社会风尚、道德水准等许多方面,并不是只论及本文中提到的两方,也就是说,这在实际中应该是一个多方博弈,甚至牵涉监管人员和公职人员的合谋问题,达到均衡点不是一朝一夕的事,由于本人水平的限制,很多问题由待大家共同研究。
[参考文献]
[1].张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.
篇10
张1.6
假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i的价格高于另一企业,则企业i的需求量为0,反之,其它企业的需求量为0。因此,企业i的需求函数由下式给出:
从上述需求函数的可以看出,企业i绝不会将其价格定得高于其它企业;由于对称性,其它企业也不会将价格定的高于企业i,因此,博弈的均衡结果只可能是每家企业的价格都相同,即pi=pj。但是如果pi=pj>c那么每家企业的利润,因此,企业i只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至,。同样,其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是pi=pj=c。此时,企业i的需求函数为。
张1.8
张2.3
张2.4
张2.9
(1)由于古诺博弈的阶段均衡是,此时的利润为;若各家企业合作垄断市场,则此时的最优产量是,可求得,此时的利润为,此时若有企业i背叛,其产量就是,其收益为。下面我们来看重复博弈下的古诺博弈。在这个博弈中,有两个博弈路径,我们分别进行讨论。
首先,在惩罚路径上,由于每个阶段参与企业选择的都是最优的产量,因此能够获得最优的收益,因此是均衡的。
其次,在合作路径上,只要合作的收益大于背叛的收益,则均衡也是可以实现的,这要求:,解得。
(2)伯川德博弈的阶段均衡是,此时参与者的利润均为0。若各企业合作,则此时的最优价格是:,此时,则,利润为。而若有企业i背叛,则其选择价格,其产量为Q,利润为。下面我们来看重复博弈下的伯川德博弈,在这个博弈中,也有两个博弈路径,我们分别讨论如下:
首先在惩罚路径上,由于每个阶段的企业选择都是眼前最优,因此,它能够实现均衡。
其次,在合作路径上,只要合作的收益大于背叛的收益,则均衡也是可以实现的,这就要求:,求得。
(3)伯川德博弈中的最低贴现因子小于古诺博弈中的贴现因子的原因在于其惩罚要严重的多,因此其对于耐心的要求也就要相对较小。
张3.4
类似的题:
张3.8
张4.2