博弈论及其应用范文

时间:2023-08-17 18:12:51

导语:如何才能写好一篇博弈论及其应用,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。

博弈论及其应用

篇1

内容摘要:本文在梳理经典博弈论理论体系及其应用领域的基础上,对其发展趋势进行了展望。分析显示:经典博弈理论按其发展的脉络来划分,主要包括静态博弈、动态博弈、完全信息博弈和不对称信息博弈等几大理论体系;其应用领域主要涉及管理学中的激励问题,信息经济学中的信息甄别、信号传递和社会学中“合作与冲突”这一古老而又永恒的主题;其发展方向表现为扬弃“理性假设”条件下的行为博弈。

关键词:纳什均衡 信息经济学 激励理论 行为博弈

经典博弈理论体系

博弈论又称对策论,英文名称是Game Theory,是研究一些个人,一些团队或组织面对特定的环境条件,在一定的规则制约下,依靠所拥有的信息,同时或先后,一次或多次,从各自允许选择的策略进行选择并加以行动,并从中各自取得相应结果或支付的过程的理论。博弈论的主要研究目的是研究博弈各方的行为特征,即各决策主体行为发生直接的相互作用时的决策特征;以及何种情况下采取哪种策略,会达到什么样的结果即决策主体决策后的均衡问题。

博弈思想可以追溯到我国古代“田忌赛马”的故事,但一般认为,1944年冯•诺依曼和奥斯卡•摩根斯坦恩合著的《博弈论和经济行为》形成了现代博弈论的基本分析框架,标志着系统的博弈论初步形成。上世纪50年代,数学天才纳什明确提出“纳什均衡”这一概念,使经济学中的均衡问题发生了质变(从“瓦尔拉斯均衡”突破到“纳什均衡”)。“纳什均衡”的提出抓住了问题研究的关键,为博弈论的应用和发展奠定了坚实基础。“纳什均衡”描述的是行动双方的均衡问题,即“如果一个博弈存在一个战略组合,任何参与人要改变这一战略组合都可能导致降低自身的效用水平(或只能保持原有的效用水平),因而任何参与人都没有积极性去改变这一战略组合,这一战略组合称为该博弈的纳什均衡。

“纳什均衡”实现了合作博弈向非合作博弈的转化,但纳什均衡是“基于一个时期的模式”而非“动态模式”,纳什均衡没有考虑自己的选择行为如何影响博弈对手的战略,且允许不可置信威胁战略的存在,经常遇到一个博弈中存在多个纳什均衡,难于预见哪个均衡会发生等问题。为了弥补纳什均衡的上述缺陷,泽尔腾发展了动态的博弈。泽尔腾动态博弈模型思想集中体现在他1965年发表的著名论文《一个具有需求惯性的寡头博弈模型》一文之中,在该文中泽尔腾对“子博弈精练纳什均衡”给出了正式的定义。其基本思想是:“在扩展型博弈中的任一决策点,现行局中人利用其先行优势及后行者必然做出理性的反应这一事实,来进行选择以达到最优的纳什均衡,有限完美信息动态博弈求解可采取倒推归纳法”。泽尔滕定义“子博弈精炼纳什均衡”的中心意义是将纳什均衡中包含的不可置信威胁战略剔出出去,使均衡战略不再包含不可置信的威胁战略。它要求参与人的决策在任何时点上都是最优的,决策者要随机应变,向前看而不是固守旧略。由于剔出了不可置信的威胁战略,在多数情况下,精炼纳什均衡也缩小了纳什均衡的个数,这也是子博弈精炼纳什均衡的优点所在。

纳什均衡严格依赖于现实博弈环境难于满足的“完全信息”假设,即“所有博弈参与人均知道博弈的结构、博弈的规则和支付函数”,针对纳什均衡中“完全信息”假设的缺点,哈萨尼建立了不完全信息博弈模型,拓展了纳什分析的应用范围。哈萨尼的不完全信息博弈是在纳什均衡的基础上吸收了贝叶斯研究成果,以贝叶斯定理为出发点,对纳什均衡作了广泛拓展。哈萨尼在其论文《贝叶斯参与人完成的不完全信息博弈》中提出了不完全信息博弈模型,还证明如何把不完全信息博弈模型转化为完全但非完美信息博弈模型,使得博弈模型易于处理,为信息经济学的发展奠定了理论基础。哈萨尼提出的“贝叶斯-纳什均衡”是指在静态不完全信息博弈中,参与人同时行动,没有机会观察到别人的选择;由于每个参与人按照贝叶斯原则仅知道其他参与人类型的概率分布而不知道其真实类型,且不可能准确地知道其他参与人实际上会选择什么战略;但是能准确地预测到其他参与人的选择是如何依赖于其各自的类型;因此参与人决策的目标就是在给定自己的类型和别人的类型依从战略的情况下,最大化自己的期望效用。即“给定自己类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性去选择其他战略组合”。而应用于不完全信息动态博弈的均衡的概念是“精炼贝叶斯均衡”,这个概念是完全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合,泽尔腾、克瑞普斯和威尔逊及弗登伯格和泰勒等学者为此做出了重要贡献。精炼贝叶斯纳什均衡的要点在于当事人要根据所观察到的他人的行为按照贝叶斯原则来修正自己有关后者类型的主观概率,并由此选择自己的行动。也就是说精炼贝叶斯纳什均衡是一个数学上的“不动点”。即满足:给定每个关于其他参与人类型的主观概率的情况下,参与人的战略选择是最优的;每个参与人有关其他参与人类型的主观概率均是按照贝叶斯法则从所观察到的行动中获得的。不完全信息博弈运用现代随机分析方法解决信息不完全或不对称下的决策问题,由此发展起来的不完全信息动态博弈模型使博弈论的理论研究与实际应用更加紧密。

博弈论的主要应用

就博弈论发展而衍生的信息经济学而言,除哈萨尼所做的开创性工作之外,维克里和莫里斯也对不对称信息条件下的激励理论做出了重要性贡献。维克里上世纪40年代关于个人所得税税制问题的思考:“收入均等化并不能解决理想税赋结构难题”,因为这一方案没有给个人努力工作提供激励,因而不会产生社会效率最大化。莫里斯通过设计递减税率回答了维克里的税制难题,并致力于信息不对称条件下隐藏行动理论方面的研究。莫里斯上世纪70年代的系列研究成果奠定了委托-理论模型框架,并确立了激励相融契约必需满足的两个约束前提。其一是参与约束:委托人所选的效用函数必须使人因接受合约而获得的效用不小于因拒绝合约而获得的效用;其二是激励相融约束:合约缔结后人在所选行动上的边际收益等于边际成本。

1970年,著名经济学家阿克洛夫在《经济学季刊》上刊发了具有划时代意义论文《柠檬市场:质量不确定性和市场机制》,该文研究了一种商品市场,其中出售者对商品质量的了解比购买者要多,并以二手车市场为例进行说明。由于文章阐述了一个简单而又深奥的普遍化思想,并因得到应用广泛而产生重大影响。阿克洛夫在该文中对具有逆向选择这一信息问题的市场进行开创性分析,指出信息不对称问题可能导致该市场崩溃,或者只有劣等产品充斥其中。“柠檬论文”解释了信息不对称导致的市场低效率,同时该文的另一个独到见解是经济主体有强烈的激励去抵消信息不对称问题对市场效率的不利影响。

继阿克洛夫之后,斯彭斯着重研究如何改善信息不对称以提高市场效率问题,即信号传递模型。信号传递模型描述的是信息富有的一方如何可靠地将信息传递给信息缺乏的一方,以减少双方之间信息不对称、促进交易的达成、提高市场效率。斯彭斯以劳动力市场为例,研究得出只有当信息富有者的传递路径产生的费用绝对高于其它传递途径产生的费用时,该信息富有者的信息传递才具有效率。该模型很好地解释了商标、广告、教育文凭等信息传递问题。为减少信息不对称,提高市场效率,提供操作上的理论依据。

在斯彭斯之后,运用博弈论来研究信息不对称市场的另一位集大成者乃诺贝尔经济学奖得主,信息经济学的集大成者斯蒂格利茨。斯蒂格利茨在1974年之后发表的一系列论文中,构建了以不完全信息和不完备市场为前提的新模型,描述了信息不对称条件下市场运行机制的变化。他通过对保险市场、农业土地租赁市场、信贷市场和劳动力市场的考察,证明了信息不完全和信息不对称的普遍性,说明在这样的市场中,传统的价格机制实现帕累托效率的有效性值得怀疑,从而对以彻底的私有化和市场化为导向的改革模式(即“华盛顿共识”)提出了质疑。其中,1981年斯蒂格利茨和温斯合作发表的文章《信息不对称市场的信贷配给》堪称当代信贷文献的典范,该文详细论述了信贷过程中不同阶段银行面临的各种风险。该文创立的逆向选择模型与道德风险模型对分析金融问题具有划时代意义。

继博弈论在经济学领域取得巨大成功之后,以以色列博弈论专家奥曼与美国国防经济学者谢林为代表的博弈论推崇者则努力运用博弈论来解决“合作与冲突”这一古老而又永恒的社会问题,使博弈论由经济领域拓展到社会领域。奥曼与谢林分别从数学和经济学的角度重塑了关于人类交互作用的博弈分析范式。谢林从非合作博弈的角度加深了人们对社会交互作用机理的理解,而奥曼则发现一些长期的社会交互作用可以运用正式的非合作博弈理论来进行深入分析。

博弈论发展趋势

博弈论以决策者之间的相互影响为主要决策因变量导致经济学从“瓦尔拉斯均衡”突破到“纳什均衡”的质变,经典博弈论从静态博弈到动态博弈,信息完全到信息不对称博弈均是在放松理论假设的前提下使博弈理论分析与经济社会现实更加接近,以增强其实用性和对经济社会现象的解释能力。经典博弈理论作为经典经济学的分析工具,其共同秉承的“理性人”假设、不可观测的效用函数假设和主观概率假设是经典博弈论的主要局限,上述假设的存在使经典博弈被戏称为“研究‘天才’决策的理论”,现实经济社会中也出现过很多经典博弈理论无法解释的异象。随着行为经济学的兴起并得到社会的认同,基于理性人假设的经典博弈理论自然而然遭受到行为学派的挑战,考虑参与者“有限理性”、“情感”、“环境”、“经验”、“制度文化”等现实因素的行为博弈论成为近年来博弈论的发展方向。

与经典博弈理论比较,行为博弈论的最大特点是考虑了人类的非理性因素,其研究目的是研究博弈参与人实际做出了什么行动,可以说行为博弈论是实验经济学与行为经济学的一个分支。行为博弈论近年来在“囚徒困境”模型重释、投资博弈模型、可置信威慑的议价博弈模型、大陆分水岭协调博弈模型及选美比赛博弈模型等方面取得了重要进展,很好地解释了经典博弈论无法解释的一些现象。但行为博弈同样面临“有限理性”中“有限”度的量化,“经验”因素中参与者的“学习”问题以及“学习”如何及何时影响博弈均衡结果等问题。上述问题的存在形成了行为博弈未来的主要研究方向:一是学习过程中的自利行为和利他行为怎样导致社会偏好的变化;二是在重复博弈中,随机最优反应函数的地位如何,参与者关于博弈对手和环境的信息信念如何变化;三是组织、团队乃至企业的博弈行为将在何等程度上与个体博弈存在差异,引发该差异的机制是什么,社会认知空间的变化对博弈行为有何影响等等。

结论

值得一提的是经济领域的至高荣誉诺贝尔经济学奖特别偏爱博弈论领域的集大成者。瑞典皇家科学院诺贝尔奖委员会分别于1994年、1996年、2001年和2005年将诺贝尔经济学奖授予经典博弈论的杰出贡献者纳什、泽尔腾与哈萨尼,博弈理论的实践人、激励理论创立者维克里和莫里斯,博弈论衍生的信息经济学的奠基人及集大成者阿克罗夫、斯彭斯与斯蒂格利茨,博弈论应用领域的拓展者以色列数学家奥曼和美国国防经济专家谢林;以表彰他们在博弈论领域的卓越贡献。博弈论领域的多次获奖彰显博弈论对现代经济理论特别是市场交易理论的突出贡献。

参考文献:

1.张维迎.博弈论与信息经济学[M].上海人民出版社,2004

2.斯蒂格利茨,沃因,韦坎德.契约经济学.经济科学出版社,1999

3.John Chahes Harsanyi. Games with Incomplete Information Played by Bayesian Players Parts I, II and III. Management Science, 1967

4.John von Neumann and Oskar Morgenstern. The Theory of Games and Economic Behavior. Princeton: Princeton Universty Press.1944

篇2

关键词 波纹管;水轮机;排水管

中图分类号[TM622] 文献标识码A 文章编号 1674-6708(2013)102-0164-02

0 引言

黑河龙首二级(西流水)水电站位于甘肃省张掖市肃南裕固族自治县境内、黑河大峡谷西流水至榆木沟河段,是黑河流域规划的第七座水电站。该电站是一座压力隧洞引水式电站,装机容量157MW,坝高146.5m,设计库容8620万m3,设计年发电量为5.28亿Kwh,工程总投资9.1亿元。该工程于2002年6月30日正式开工建设,2004年8月17日,首台机组投产发电,同年9月28日全部机组投入运行。电站由甘肃电投河西水电开发公司负责开发和运营,大坝工程由中水十五局承建,中水十五局承担机组安装,甘肃陇丰电力建筑安装公司承担厂房工程建设,北京安能监理公司担任工程监理。

电站大坝型式为混凝土面板堆石坝,最大坝高146.5m,枢纽由拦河大坝、岸边式发电系统、引水隧洞以及发电厂房等组成。水库正常蓄水位1920.0m,库容8620m3,河道右岸布置排沙洞和表孔溢洪道,左岸布置全长1760m的压力引水隧洞,具有日调节功能,厂房位于大坝下游左岸约3km处,型式为岸边地面厂房。电站安装3台45MW和1台22MW混流式水轮发电机组,年设计发电量5.28亿千瓦时。电站通过两回110kV线路并入张掖市黑河110kV开关站。电站主要承担发电任务,在张掖电网中承担调峰任务。

电站四台水轮发电机组由GE亚洲水电设备有限公司制造。电站机组投运后,由于顶盖排水系统根部焊接因疲劳损伤经常出现裂缝的问题,严重影响电站的安全稳定运行。为此业主单位多次组织专业技术人员对电站机组顶盖排水系统出现裂缝原因进行分析寻求解决办法,最后选择抗疲劳强度较好的波纹管对原来的排水管路进行改造。本文对电站机组顶盖排水改造后的效果情况进行了分析和总结。

1 机组主要技术参数

1)发电机主要技术参数:发电机型号为SF-J45-16/4400;局长额定容量为52.941MVA;额定功率为45MW;机组额定电压和电流分别为10.5kV和2911A额定转速375r/min;额定功率因数0.85;

2)水轮机主要技术参数:水轮机型号为HL(L237100)-LJ-220 ;最大水头150m;额定功率和额定水头为46.88MW、164.36m;引用额定流量33.29m3/s;额定转速375r/min;最小水头:137.70m;飞逸转速665r/min;额定点吸出高度为-2.2m。

2 运行特征与现象

龙首二级(西流水)水电站水轮机导水机构的顶盖下侧面与转轮上冠间设有顶盖排水机构,顶盖排水机构将转轮后的漏水通过排水管排出,以减轻转轮的轴向水推力,以防止导叶关闭太快引起管内压力上升过高造成破坏。该结构采用法兰连接并置悬挂方式,而上部连接采用橡胶软管,对该管因温度及因机组运行产生的振动无法进行有效的保护。自电站机组投运后,机组运行过程中顶盖部位排水管连接处出现焊缝开裂,造成水车室被淹,机组无法运行被迫停运。自电站机组投运后,因多次发生顶盖排水开裂问题造成机组非计划停机,对电站自身的安全稳定运行和电网安全造成了一定影响。

3 原因分析

水轮发电机组的振动原因非常复杂,主要有水力、机械、电气等三大方面的原因。水轮发电机组的振动问题与一般动力机械的振动有一定差异,除了机器本身转动或固定部分引起的振动外,尚需考虑发电机的电磁力以及作用于水轮机过流部件的流动压力对系统及其部件振动的影响。水的能量是水轮发电机组振动的最根本的能量来源,直接或间接导致水轮发电机机组产生振动。从振动的发生的现象分析,部分原因是由水轮机本身的水力特性所导致的,部分原因则是由一些偶然因素作用所产生的。从结构上分析,水轮发电机组可以分为转动部分和固定、支持两大部分,任何一个组成部件存在机械缺陷都可能引起机组的振动,而这些缺陷在设计、制造、安装等任何一个环节都可能产生。水轮发电机组作为旋转设备,包括上机架、下机架、顶盖、转动部分这些振动部件,机组的振动只能通过设计、制造和安装减小,但无法做到彻底消除。

由于电站机组在原制造和安装期间,顶盖和排水管之间的焊接采用钢性连接,焊接完毕后未进行相应的热处理,造成应力集中。因此,即便机组各部位振动数值均在行业规范允许的范围以内,在运行过程中由于顶盖振动和顶盖排水管振动造成疲劳损伤,最终致使机组顶盖排水连接在运行过程中出现焊缝开裂现象。

4 改造方案

4.1方案选择

分析查明顶盖排水管裂缝缺陷产生的原因后,决定对机组顶盖排水管进行全面改造。为满足现场使用条件,改造方案决定选择波纹管位移补偿器替换原来的刚性连接,选择波纹管位移补偿器的主要原因是它由制造、安装和运行管理等多个环节组成,它的可靠性应根据顶盖排水的环境、温度、泥沙等多方面因素综合考虑,即除了要考虑波纹管的工作效率外,还应考虑它的介质、工作温度和外部环境,要综合考虑使用的材料。为满足上述要求,材料应当符合下列条件:

1)具有高弹性极限,抗拉强度和疲劳强度性能良好,以确保波纹管工作;

2)具有良好的可塑性,以满足波纹管方便成型加工,具有足够的硬度和强度;

3)具有良好的耐腐蚀性能,以满足能在潮湿等恶劣环境中工作的要求;

4)具有良好的焊接性能,以满足焊接工艺的要求。

4.2设备选择

经过多方考察和论证,采用中国华电工程(集团)有限公司生产的DN80(小机)、DN100(大机)、PN1.6波纹管位移补偿器取代橡胶软管,从而对该管线段因温度变化或因设备振动产生的管段位移有效吸收控制,每套波纹管位移补偿器各增加三根限位拉杆,该拉杆的作用是当管路中的固定支架产生异常失效时,管路中的盲板力可由限位栏杆来承担,不会导致短时间内把波纹管补偿器破坏,起到保护补偿器的作用。等管路修复后,该补偿器仍能使用。该波纹管位移补偿器能吸收轴向位移±5㎜(循环次数>105次);吸收横向位移±4㎜(循环次数>3000次)。DN100(大机)波纹管位移补偿器见图1。

波纹管位移补偿器制造技术要求为:1)按GB/T 1277-1999、DL5017-1933进行制造及验收;2)纹管采用氩弧焊,焊接时两端法兰螺孔应对齐;3)进行2.4MPa,保压10min,不得泄漏;4)部分喷吐银粉漆。

4.3设备安装

波纹管位移补偿器在管线中是柔性元件,因此管线布置时应防止管线内介质压力引起的盲板力、管线位移产生的摩擦力、管线重力和其它外力对波纹管位移补偿器造成的损坏。在本电站中采用固定支架,即在顶盖下支板上焊接固定架来支撑波纹补偿器,另外在安装时要波纹管和机组本身排水管、机坑予埋排水管中心线严格对正,以减少水阻力。

补偿器安装完成后,进行了限位螺杆调整,先拆除内侧螺母,同时将外侧双螺母向外调一个位移量,然后锁紧。运行中应定期检查管线和波纹管位移补偿器变形情况,检查是否有阻碍或限制波纹管补偿器正常位移的异物或卡涩等现象。安装后由安装单位自检、监理单位终检,最后由运行单位进行验收。安装示意图见图2。

波纹管位移补偿器安装过程中的注意事项:

1)波纹管位移补偿器在安装前首先应检查其型号、规格及配管等,各参数必须设计一致;

2)安装过程中应注意其内套筒的方向必须与介质流动方向一致;

3)严禁使用以波纹管补偿器变形达到调整管道的安装误差的方法,防止影响补偿器的正常功能、增加管道、支承构件的载荷及降低波纹管的使用寿命;

4)安装过程中,严禁焊渣飞溅到波壳表面及波壳受到其它机械损伤;

5)应保证波纹管补偿器所有的活动元件在各部位的正常动作;

6)安装完毕后,应及时拆除波纹管补偿器上安装运输所用的紧固件及辅助定位构件,并按照设计要求调整限位装置,使管系具有充分的补偿能力;

7)进行打压试验之前,必须加固装有补偿器的管路端部,使管路不发生移动或转动。

篇3

关键词: 囚徒困境 规则 主体间性 理性

一、关于理性人和囚徒困境的介绍

囚徒困境这个事例常常在有关博弈论的讨论中出现,它最主要贡献是突出反映了个体理性与群体理性的冲突,并且在目前学界的讨论下,这一冲突似乎尚未能得到完美的解决。造成这一冲突的原因,并不是由于该博弈的前提――理性人假设出现了问题,而是基于囚徒困境中或者博弈论中理性人的假定在不同条件(规则)下的作用。正是由于没有分清这一前提在不同背景知识下的运用,一方面保证了囚徒困境这个博弈能够用逻辑的或者说是理性的方式解决(找到这个博弈的纳什均衡点),另一方面也导致了事件的解决结果并不是那么的令人满意(因为我们面临的是不同的条件与知识背景)。“‘博弈参与人是理性的’是博弈论的公设,然而理性人的假定存在许多博弈困境。囚徒困境与公地悲剧反映的是个体理性与集体理性之间的冲突”(潘天群《博弈论中理性人的假设困境》,《经济学家》2003.4,)。

起初,博弈论专家假定博弈中的参与人是理性的――具有使自己效用最大化的推理能力,然而,奥曼等人发现,这样的假定是不够的,我们必须假定,“一个博弈中的每个参与人都是理性的”是该博弈所有参与人组成的“群体”所知道的,即每个人都是理性的是群体中的“公共知识”(或翻译成共同知识)。(潘天群《群体推理的逻辑与群体理性》,《东南大学学报(哲学社会科学版)》,2007年7月第9卷第4期)。

有关囚徒困境我们可以这样表述。

假设有A、B二人,因为偷盗被警察抓捕归案。为了防止两人串供,因此将两人分开审问。这时A、B二人均面对了两种选择,一是招认,二是不招认。例如,对于A来说,A面临着招认与不招认的选择。我们可以假设,如果A招认,B可以选择招认,也可以选择不招认。当A招认B不招认时,A当场释放B判刑8年;当A招认B也招认时,各判刑5年。如果A不招认,B也可以选择招认或者不招认。当A不招认B招认时,B当场释放,A判刑8年;当A不招认B也不招认时,两人各判刑1年。

同理,当审问B的时候,只需要参考上面的过程就可以很容易地得到答案。

我们可以简单地列一个表,用来表示上述的过程:

以A为例,对该博弈进行分析。

由于参与博弈的双方均为理性人,且为公共知识,那么A会有如下的思考:

当B招认时,A可以选择招认或者不招认。

当B招认而A不招认的时候,B被当场释放,A被判刑8年;当B招认A也招认时,B与A各判刑5年。判刑5年远远好于判刑8年,因此,当B招认时,基于理性人的假设要使自己的收益最大并且损失最小,A会毫不犹豫地选择招认。

当B不招认时,A也可以选择招认或者不招认。

当B不招认并且A也不招认时,两人各判刑1年。当B不招认而A招认时,B被判刑8年,A被当场释放。A基于理性人假设作出了以上的推理,显而易见的是,当场释放要好于判刑1年。为了使自己收益最大并且损失最小,A会毫不犹豫地选择招认。

因此,不管B是否招认,A都会毫不犹豫地选择招认。

同理,作为一个理性人,B也会按照A的思维模式那样作出选择,答案是――毫不犹豫地招认。

两人均招认就是囚徒困境这个博弈的纳什均衡点。很明显也很抱歉,通过理性手段进行推理,想使自己的收益最大而损失最小,但是结果却不是那么的令人满意。在我们看来,两者均不招认各判刑1年的损失要远远小于两人各判刑5年,或者单就A或B一个人来说,当场释放的收益要明显地大于个人的判刑5年,因此,在某些人看来,理性的参与人在这个博弈中并不能使自己的收益最大损失最小,相反的,个人理性在这个囚徒困境的博弈中成为了获得最大利益的障碍,在这样的情况下,就出现了“两难”决策。

二、“囚徒困境”博弈的潜在规则,以及阿克塞尔罗德的实验及其规则变动

应该得出的一个认识就是,上文所提到的那个“囚徒困境”博弈属于一次性的完全信息静态博弈,它本身所具备的规则与阿克塞尔罗德所做的实验有着显著的区别――一次性的囚徒困境博弈与重复性的囚徒困境博弈的规则区别。为了便于分辨,我们依次将上文的两个囚徒困境博弈分别简称为Game1与Game2。

G1应该具备以下的这些规则。

(1)对策者(谋求合作的双方)没有什么手段可以用来实施威胁或作出许诺。由于对策者不会许诺他们自己采取某种特定的策略,因此每个人都得考虑对方可能采取的所有策略。此外,每一个对策者都可以使用所有可能的策略。(2)没有什么办法能够确定对方在某个特定的对局中将如何选择,这就消除了使用元对策”分析的可能。“元对策”允许诸如“选择与对方相同的策略”的选择,同时也消除了通过观察对方与第三者局而形成某种信誉的可能。因此对策者唯一可利用的信息(积累的知识)是他们相互作用的历史。(3)不能消灭对方,也不能放弃对局,因此对策者在每次对局时只能选择合作或背叛。(4)不能改变对方的收益值。这个收益值已经包括了每个对策者关于对方利益的考虑之中。(周海林《“合作”的条件与机理――从囚徒困境谈谈可持续发展的制度基础》,《软科学》2001年第15卷第3期)

我们可以试着列出一个表格,以更清晰地对几个步骤中的规则的区别作出清晰的划分。

博弈前(step1)博弈中(step2)博弈后(step3)

[?摇?摇?摇?摇?摇?摇一次博弈的完成?摇?摇?摇?摇]

对于G1的第一条规则,G2由于是重复多次的囚徒,将会出现一些不同的情况。阿克塞尔罗德所提出的例如宽容性和可激怒性就可以在step3之后体现出来。可激怒性可以简单地看成是规则1中所说的实施威胁。当参与博弈的双方A和B进行一次博弈时,A作出不合作的决定时(第一次博弈),B在step3得知了这个消息之后,也就是下一次博弈时(第二次博弈),可以选择不合作,对A进行威胁,表示自己是可激怒的。这里的威胁,是分属于两次博弈的,而这在一次性博弈中明显无法做到。宽容性也同样如此,当A表示悔过(在第三次博弈选择合作时),B可以立即在step3中得知,并在第四次博弈时原谅A,作出合作的选择。当然,如果仅从理性人的角度出发,在有限次的囚徒困境博弈中,次次不合作才应该是这个博弈的纳什均衡,但是在阿克塞尔罗德的试验中,次次不合作这个策略的得分明显低于某些策略,并且选择这个策略的人并不是绝大多数,理论和现实有着明显的差异。

对于G1的第二条规则,同样也是如此。一次性的囚徒困境G1作为某个特定的对局(特地被警察隔离开而无法串供),博弈双方都无法确定对方将采取何种策略,从而致使使用“元策略”的可能性变为0。G2作为多次重复的囚徒困境,由于能够清楚地知道对方在每一轮的选择(指已经选择过的步骤),因此可以对接下的自我的选择和他人的选择做出推断。甚至像“一报还一报”策略直接选择与对方上一步策略相同的策略。还有的参与者对博弈对手的合作与不合作的次数进行概率计算,并由此作出自己的选择,如道宁策略,这在G1中是无法出现的。阿克塞尔罗德甚至做了两次重复多次的囚徒困境实验,这样对于G2的参与者来说,他们的选择不仅仅可以基于与自己的博弈对手相互作用的历史,更可以基于博弈对手与参与这次试验的每一个人的相互作用的历史。道德博弈中所说的个人信誉问题在这里凸显出来。

总的看来,在step1中,作为囚徒困境的博弈参与者A可以了解到B以往的策略选择以及信誉问题,并可在一定程度上影响到自身策略的选择。例如贪婪的策略在面对比较仁慈的策略时,总是比较占优势。并且在step2中,A与B可以看到对方是如何选择,并进一步影响到step3之后,选择宽容还是惩罚――合作还是不合作。

从step1到step3就显示出主体交互性在博弈中的重要作用,因为G1中,G1(step1)到G1(step3),A与B做为博弈参与者并没有真正的形成交互(双方被隔离了),即主体间性。而在阿克塞尔罗德的试验中G2(step1)到G2(step3)中,博弈的双方A和B不但互有信息交流,而且在一定程度上影响到自我决策的选择。

三、主体间性对囚徒困境的影响

主体间性从定义上来说是主体与主体之间的统一性,但在不同的领域中,主体间性的意义是有差异的。

在主体间性概念的形成历史过程中,事实上涉及了三个领域,从而也形成了三种涵义不同的主体间性概念,这就是:社会学的主体间性、认识论的主体间性和本体论(存在论、解释学)的主体间性。这里就不一一详细叙述。

博弈论是交互的决策论。2005年诺贝尔经济学奖的获得者奥曼曾经给博弈论下过一个非常描述性的定义:博弈论是“交互的决策论”,其定义十分简洁凝练。展开来说,博弈论是研究发生直接相互作用的行为者采取的决策以及这种决策的均衡问题。换言之,一个经济主体(行为者)在决策时必须考虑到对方的反应,所以用“交互的决策论”来描述博弈论可谓言简意赅。(张践明《“囚徒困境”・理性悖论・交互认知论》,《湘潭大学学报(哲学社会科学版)》,2007年11月第34卷第6期)

而交互认知是主体间性的具体化例证。在重复囚徒困境这个博弈中,就充分地体现出交互认知的重要性。

如step1的中,博弈的双方可以对彼此过去的决策选择进行详尽的考察,基于生存博弈的道德博弈也可因此而建立起来。双方的私有信息(在这里可以简单地看做自己和对方的博弈历史选择)是否可以交换,交换的方式与程度,均可在一定程度上影响到后来的决策。阿克塞尔罗德进行第二次重复囚徒困境博弈的一部分原因也在此――建立在双方知己知彼的基础上的合作应该如何产生,知己知彼是源于上一轮的博弈参与者参与博弈并决策的历史。这样就把双方的私有信息公开化,变成了公共知识。

在step2中,G1博弈双方从完全不知道对方做出什么决策发展到G2可以看到对方的决策,这又是一次交互的行为,由于是多次重复博弈,step2的交互致使博弈双方A和B不仅仅看重眼前的利益,更会看中将来的利益,从而使合作有可能发生,当然其中也包括从不合作决策与报复性决策等。

在G2(step3)中,A或者B完全可以借由这个环节来告诉对方自己对于对方的选择是满意还是不满意,并在以后的多次博弈中体会到对方的感受,对方同样可以表达出来并由此形成第三次交互。

还是拿一报还一报策略进行说明。A使用策略未知,而B使用的是一报还一报策略。设在第200次博弈中(我们称为N1、N2、N3……),A选择不合作,B选择合作,G2(N200(step3))中,B发现A不合作,并想表达自身的不满,因此立即在G2(N201(step2))中选择不合作以此来警告A。A在G2(N201(step3))中感受到了B的不满,如果双方进行了重复多次的博弈,A通过G2(N202(step1))回顾双方合作的历史发现,B对于犯错的人具有宽容性,于是立即在G2(N202(step2))中选择合作表示自己悔过,B在接下来的步骤中感受到A的悔意,在下一次的博弈中选择合作表示自己知道并安慰A……从而形成了重复性的三次交互、信息交换。当然,以上的只是基于交互理论的假想,但是在阿克塞尔罗德的实验中,我们不应该仅仅把双方固有的策略选择看作是电脑程序的自动化,而应该看作是在理性人基础上的信息交互,从而修正自己的策略。

四、结语

可否像人工智能体Agert那样在博弈中具备自主交互的学习参与博弈的理性能力,并由此改变自己的策略?

有关新型智能体Agent的设定,有这么几条可以作为囚徒困境这个博弈的参考:

①能够面向陌生状态与不确定性,积极主动地进行认知与行动。②每个智能体都有自己不同的知识背景、心智品质、能力与个性,甚至具备诸如友善性、真诚性等人类特征。它的这些能力与特征都不是被设定为一成不变的,它可以随着情况的变化而不断地进行能动的自我更新。它不是在一个一步到位的、静态的模式中模拟智能,而是在一系列过程性的、动态连续的进程中发展智能。

如果在多次重复的囚徒困境的理性人设定中附加如上的设定,是否可以使G2更加地清楚明白,更容易地走向合作?

当然,以上的附加只是基于多次重复囚徒困境的假设。面对G1的一次性的完全信息静态博弈,我们只能持以悲观的态度。

宾默说,理性参与人的独立选择行为又会产生非帕累托效率的结果,这并不存在任何自相矛盾的地方。囚徒困境的规则不利于实现理性合作,就像把一个人双手反绑之后要他表演手技一样。因此,不要希望在囚徒困境规则约束下理性参与人会成功地达成合作。

参考文献:

[1]罗伯特・阿克塞尔罗德.合作的进化.合作的复杂性――基于参与者竞争与合作的模型.

[2]宾默.博弈论与社会契约.

[3]格若赫姆・罗铂.博弈论导引及其应用.

[4]张践明.“囚徒困境”・理性悖论・交互认识论.湘潭大学学报(哲学社会科学版),2007.11.

篇4

关键词: 博弈实验 教学软件 实验经济学

一、引言

诺贝尔经济学奖得主爱德华・哈斯丁・张伯伦(E.H.Chamberlin)教授1948年在哈佛大学博士生课堂上进行的描述市场需求和供应经济关系的纸牌实验正式拉开了实验经济学的序幕[1]。20世纪50年代,美国休斯敦大学约翰・福布斯・纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,并将博弈论引入议价行为模型,进行了纯议价博弈实验,1994年因为他在博弈论领域的卓越贡献获得了诺贝尔经济学奖[2]。1952年,美尔文・爵烁和莫莱尔・弗莱尔(MelvinDresher and Merrill Flood)进行了著名的“囚徒困境”实验。20世纪60年代,有着“实验经济学之父”之称的弗农・洛马克斯・史密斯(Vernon Lomax Smith)教授在亚利桑那大学十一个班级进行了长达六年的实验验证竞争均衡理论,1962年,以此实验为基础撰写的论文《竞争市场行为的实验研究》在《政治经济学杂志》上的发表,标志了实验经济学的诞生。其也因为在实验经济学领域开创性的贡献于2002年获得了诺贝尔经济学奖[3]。

近年来,博弈实验及以其为代表之一的实验经济学以其实现方式的可复制性和实验过程的可控制性受到越来越多经济学家的青睐,该实验还是研究不同经济政策建议有效性的经济、可行办法之一。我国自上世纪80年代以来,不少学者已经逐渐意识到实验经济学的发展,目前正有组织地对其开展研究和应用工作。因此,以实验经济学为主要研究方法,进行研究性、设计性的本科生实验教学已经成为经济管理类实验的发展趋势。目前,国内诸多知名高校如中国人民大学、浙江大学、厦门大学等已经相继建立了自己的经济学实验室,开始了在实验经济学领域的专业研究和教学应用[4]。

然而在博弈实验的推广过程中却出现了教学效率低、教学工作量大、数据不易收集、多为验证性实验等诸多难点,极大影响了博弈实验在高校别是在普通高校本科教学中的推广。笔者所在的中国药科大学医药经济管理综合实验教学中心自行编写了基于Browse/Server(简称B/S)结构的博弈实验教学软件。该软件使用JSP(Java Server Pages)与My-SQL相结合,构建了功能强、使用简便、管理方便、运行速度快、安全可靠性强的网页数据库。基于该数据库,将Java和JDBC结合起来极大降低了程序编写难度,提高了软件在不同平台运行的兼容性和稳定性[5]。

二、传统博弈实验模式在教学应用中的缺点

1.教学效率低。

国内实验经济学教学大多沿袭国外教学模式,嵌入于经济学、管理学等理论课程中进行,用于加深对基础理论知识的理解和掌握,多为演示型、验证性实验。实验中沿袭国外常规教学手段使用纸质教学文件为实验用具(见图1),学生在格式化的纸质文件中记录每轮博弈决策,每轮博弈后,将决策纸交予教师进行记录、评判后再行发回进行下一轮博弈。每轮博弈均涉及决策、收决策纸、记录、评判、发回决策纸、下轮决策的循环,因其极大地占用了课堂教学时间,在实际教学过程中的运用受到课时等诸多因素的限制,难以开展。

以本中心的实验教学为例,在使用博弈软件之前每次进行重复囚徒困境博弈模型的实验教学时,60人的博弈实验,需要4位实验教师同时工作(2位教师计算和统计实验结果,1位教师按时收集、发放博弈决策纸,1位教师维持教学现场秩序)才能保证博弈实验的正常进行,1课时(45分钟)只能进行7-10轮博弈,平均5-7分钟完成一次博弈,实验效率较低。而在7-10轮博弈轮数中绝大部分学生还未能体会均衡、零和等博弈的核心理念,实验就已经匆匆结束。

2.教学难度大。

常见的用于本科教学的博弈实验模型如囚徒困境博弈模型、选美实验博弈模型、智猪博弈实验模型、重复博弈实验模型的课程化构建中多要求构建博弈方信息完全不对称的实验环境。但是由于多种原因如重复囚徒困境博弈实验中相对规则的博弈对手配对、微信等现代化的信息沟通途径甚至是同学间的手势和眼神极易导致博弈对手间的信息沟通,从而极大地影响实验的结果。有时甚至需要教师使用分割博弈对手所处实验环境、强制信息沟通工具管制等方式保障实验教学的正常进行,增加了实验教学工作量,加大了实验教学的难度。

3.教学计算量大、工作量大。

多数博弈实验均需要一定的运算和统计工作,尤其是在贿赂博弈、领导者博弈等带有研究性的博弈行为实验中。在重复囚徒困境博弈实验中每轮实验都需要统计并标示博弈对手的博弈决策,计算本轮博弈双方得分。虽然单个运算强度不大,但是由于参与实验者众多和往复博弈次数而导致运算量较大,且较为容易出现计算失误。

4.教学数据收集困难,工作量大。

为了强化博弈实验的教学效果,需要及时统计参与博弈学生的博弈决策及其产生的效果,作为学生优化决策的依据。在重复囚徒困境博弈实验中需要归纳典型博弈思路,如一报还一报策略(TIT FOR TAT)、弗里德曼策略(FRIEDMAN)、道宁策略(DOWN ING)、乔斯策略(JOSS)等经典博弈策略的产生概率及其平均收益,用以引导学生的决策思路[6]。但是对纸质材料的收集和整理需要花费大量时间,在一个教学单元(如2课时)内,难以完成数据的收集和整理工作。

5.教学、科研效果分析困难,缺乏必要依据。

北京大学董智勇教授在《实验经济学》一书中写道:实验经济学(Experiments with Economic Principles)是经济学家在挑选的受试对象参与下,按照一定的实际规则并给以一定的物质报酬,以仿真方法创造与实际经济相似的一种实验室环境,不断改变实验参数,对得到的实验数据分析整理加工,用以检验已有的经济理论及其前提假设,或者发现新的理论,或者为一些决策提供理论分析。高校能够提供大量可供选择的高度理性受试对象,实验课程能够以分数等激励手段代替的物质激励极大地降低了实验成本,因而成为实验经济学的重要实践场所。以博弈实验为代表的实验经济学更是成为优化决策体系、提升决策水平的重要方法,其是在贿赂模型等研究性博弈实验模型中。这一切的实现不但需要基础数据,而且需要强大的以博弈数据库为基础的数据挖掘工具。纸质实验道具因其在收集速度上的缺陷显然不能满足要求[7]。

三、计算机网络技术在博弈实验教学应用中的优势

1.提高实验教学效率。

本中心采用博弈实验软件后,极大地提高了教学效率:在重复囚徒困境博弈实验中,以每次实验20轮计算,传统纸质道具的博弈学实验,至少需要90分钟,使用计算机实验教学软件后,只需要20分钟,在1个课时内就可以完成实验,保证了教师讲解时间,提高了学生的博弈水平。对比具体如下图(图2):

通过上图,我们可以很直观地发现,应用计算机的实验方法具有明显的技术优势和显著的进步性。

2.降低实验教学难度。

博弈实验中通过电脑自动分组等功能可以做到真正的“双盲”实验。在重复囚徒困境博弈实验中,自制教学软件能够实现自动配对、随机分组功能(见图3),使学生在完全不知道博弈对手的情况下完成博弈实验,真正做到了信息的完全不对称。

3.免去实验教学的信息收集、整理、运算工作。

采用了计算机的实验方法后,在重复囚徒困境博弈实验时,学生只需要单击“合作”或“背叛”后即可看到(或等待后看到)博弈对手本轮决策,由电脑依据评分原则直接给出单轮分数并累计入学生总得分。学生决策提交后,收集、整理、运算、统计的工作都由电脑后成并展示在学生眼前,极大地降低了实验教学过程中教师的工作量。

4.教学数据自动转存,方便实验效果深入挖掘。

使用教学软件后,重复囚徒困境博弈实验中的学生的操作将被自动保存,实验结束后以EXCEL的形式导出。导出后的数据经过EXCEL的简单加工可以进入SPSS等统计软件深入挖掘掩藏于基础实验数据背后的经济学现象和规律。

四、结语

为了满足实际教学需要,越来越多的高校自行编辑博弈实验教学软件以推广博弈实验在经济学、管理学等相关课程中的运用,提高教学效率,深化教学改革。笔者所在实验中心的软件化博弈教学实践表明,博弈教学软件的使用不但能够极大提高教学效率,而且能够降低教学难度,实现实验数据的自动收集、主动分类及自动基础分析等,这样不但满足了本科教学需要,而且为经济博弈行为的科研提供了强大依据,具有较高的推广意义和价值。

参考文献:

[1]刘晓丽.博弈实验对博弈论的方法论意义[J].学术探索,2013.

[2]杜丽群.经济学的两种研究范式:实验经济学与行为经济学评析[J].经济思想史评论,2007.

[3]邓钊.经济学实验方法及在我国的应用前景分析[J].现代商贸工业,2010.

[4]方小教.经济学实验课程构建方法的改革路径[J].淮北煤炭师范学院学报(哲学社会科学版),2008.

[5]谢玉诚,茅宁莹,陈露,施皓韵.经济学实验教学方法改革[J].新西部,2013.

[6]周骏宇.艾克斯罗德重复博弈实验及其应用[J].自然辩证法研究,2005.

篇5

关键词:职业体育赛事;电视转播权;联盟博弈;利益分配

中图分类号:G80-052 文献标识码:A 文章编号:1006-2076(2013)02-0016-04

作者简介:张诚(1981- ),男,硕士,讲师,研究方向学校体育。

作者单位:重庆科技学院,重庆 401331

电视转播在职业体育赛事中的创收能力越来越影响着体育赛事的影响力,近20年来,职业赛事电视收视率节节攀高,电视转播合约金额也不断暴涨,巨额电视转播收入成为职业体育赛事的重要基石[1]。与此同时电视转播权所带来的高额收益的分配矛盾也开始困扰着职业联盟的发展,如何在这种利益分配的博弈中找到平衡,既能保证各个俱乐部在收益分配上的公平性又能促使联盟的平衡发展,是摆在体育赛事职业联盟面前的重要课题。我国学者王平远曾在《大型体育赛事电视转播权有效开发探讨——基于福利经济学和博弈论的视角》一文中,通过建立福利经济学的经济学模型,并对同一个模型利用Stahl的有限回合水平讨价还价博弈模型以及Shaked和Sutton的无限回合讨价还价博弈模型作了进一步分析。虽未对电视转播费的分配进行分析研究,但采用博弈论的视角在电视转播权的有效开发上的理论应用为电视转播权的出售提出了一种新的研究方法。本研究拟通过采用联盟博弈的方法,对职业体育赛事联盟电视转播费的分配进行研究,并对我国职业体育赛事的电视转播权市场萎靡做进一步的分析。在收益分配方面,分别从合作博弈与非合作博弈的角度讨论了联盟的收益分配问题,使分配更为合理、公平。

1 电视转播权出售的非合作博弈分析

1.1 完全信息静态博弈分析

模型假设:假设1:某个职业联赛中有三个俱乐部,分别为甲、乙、丙,其俱乐部的竞技水平依次递减,假设某媒体将对甲、乙和甲、丙两场比赛进行转播,根据竞技体育的观赏性和平衡性可知,甲、乙的比赛悬念较大,对观众的吸引力也更大,而甲、丙的比赛的激烈程度明显不如甲、乙,观赏性和对观众的吸引力也比甲、乙的比赛弱。现在就这两场比赛电视转播价格与媒体进行洽谈。

假设2:这三个俱乐部不通过相互结盟的方式出售电视转播权,显然在乙、丙之间存在丧失转播费风险的问题,在与媒体进行谈判过程中乙、丙展开竞价,力争将自己的竞技表演服务产品出售的同时获得可观的经济收益。

假设3:在这次博弈中,乙、丙两俱乐部之间不存在信息沟通和合作,且媒体在与乙、丙俱乐部的赛事组织者进行谈判时分别被告知,如果一方以低价出售而另一方以正常价销售则只对低价者进行转播而放弃以正常价出售的赛事转播权,其得益矩阵如图1。

1.2 完全信息动态博弈分析

显然,在现实生活中,职业体育联盟中各体育俱乐部之间进行的并不是一场比赛,赛事电视转播权的出售所产生的博弈问题将一直存在,正如我们所知,在多次重复博弈后,各个俱乐部都发现如果采取合作博弈的方式将有利于自身的利益的增加。如图1所示,在赛事组织者理性假设下,(低价,低价)是最终的博弈均衡,但如果两个俱乐部采取合作的方式与媒体谈判,显然(正常价,正常价)能够达到两者的最大效益,增加各个俱乐部的个体效益,从(低价,低价)到(正常价,正常价)是一个帕累托改进,但很明显,在有限次的重复博弈中,(正常价,正常价)是不可能出现的,因为每个俱乐部都会认为其他的俱乐部将会在下一回合中选择背叛而获得超额的电视转播费,这使我们洞察到各个俱乐部重复相互作用时的行为结构,要想维持共同想要的结果就必须要有一个团体规范来“惩罚”背叛者,并且这种惩罚威胁必须是可信的,这就需要赛事联盟对每个俱乐部制定强制性的合作协议,保证合作博弈的重复进行,以保证联盟福利的最大化,这不仅保证了联盟和各个俱乐部利益的最大化,同时也增强了联盟对整个赛事电视转播权的议价能力,在实践中,英格兰足球超级联赛、德甲、法甲以及NBA等许多职业联盟都是采取统一议价的方式,实现俱乐部的合作博弈,从而最大程度地实现联盟和各个俱乐部的经济利益。

2 赛事电视转播费的分配研究

通过以上分析,我们知道为了达到联盟赛事转播效益的最大化的最好方式是实行合作博弈,合作博弈使参与者能够联合达成一个具有约束力且可强制执行博弈类型,但合作博弈强调的是效率、公平、公正,显然如果一个俱乐部在参与联盟所带来的收益还没有单独出售转播权时的收益大,那么它就没有参与联盟的必要和动力,这就是合作博弈强调的效率性,正是由于合作博弈的效率性促使理性人采取合作的方式,也就是说因为有效率才能促使各个俱乐部之间形成联盟以增加自身由于结盟而带来的额外收益。联盟收益分配的公平、公正则是维持联盟存在的关键制度,如果某俱乐部在利益分配上感觉受到了不公正的待遇,那么它维持在这个联盟的动力就将消失,由此及彼,已经形成的联盟也将因此而面临解散的威胁,因此联盟电视转播费如何分配是能否保持联盟存在的关键,联盟博弈的核心问题是各个俱乐部应以什么方式结盟以及如何分配结盟所带来的收益。

2.1 联盟利益分配的特殊性分析

由于职业体育联盟在其发展过程中存在自身的特殊性,联盟各个俱乐部之间存在着既竞争又合作的相互依存相互依赖的关系,比如联盟内部的平衡机制。联盟俱乐部竞技能力强弱过于悬殊将使联盟难以维持,因为强队不断的通过大投入和联盟利益的超分配必然将在赛场上战胜弱队,这将使比赛初始即失去悬念,失去竞技体育的魅力,从而挫伤了观众观看比赛的积极性,降低收视率,进而在与媒体进行电视转播权的议价中失去优势,损害了联盟的整体利益。同时在利益分配过程中,如果存在不公平、不公正时,又将会失去提高竞技能力和观赏性的动力,为避免联盟中“马太效应”的出现,通过以上分析笔者认为电视转播费的分配应该分为三部分:对于电视转播费的总利润一部分用于平均分配,保证联盟中各成员的平衡性和有效性,一部分应该根据各俱乐部的比赛成绩进行分配,这部分是为了保证联盟分配的公平性,提高联盟的竞技水平和赛事的观赏性,还有一部分是根据赛事转播的次数进行分配,保证利益分配的公正性,提高各俱乐部管理运作的积极性。

2.2 基于Shapley值法的联盟利益分配

通过分析发现,对于第一部分分配显然应该是由联盟制度规定的,目前各大职业联盟电视转播费及平均分配比重见表1。

观察表1中的统计数字我们发现,英超的电视转播费几乎是3个西甲、5个意甲、10个德甲,这首先是源于联盟对赛事电视转播权的整体出售,其次英超转播费的分配制度非常公平、公正,为了提高联赛的观赏水平和整体竞争力,英超一直致力于转播费的公平分配。在欧洲各国的联赛体系中,英超的转播费分配是最公平的,冠军与排名最后球队之间的转播费收益差距最小,大约只有1.6倍。而在西甲,皇马、巴萨的转播费分成,就是西甲最弱球队的19倍。在我国中超联赛电视转播费分配制度中,转播费本身的收入不高,分配制度不完善,几乎是典型的“一刀切”的分配方式,影响了联赛的竞技水平,同时滋生了诸如“黑哨”、“假球”、“”等腐败现象。

对于第二部分采用Shapley值法进行分配,Shapley值法是基于合作博弈中局中人的效用和边际贡献率的一种分配方式[2],对于联盟电视转播权出售的议价能力主要是赛事的影响力,而赛事的影响力主要是因为各个俱乐部的竞技体育水平和赛事的观赏性,反映在各俱乐部的比赛成绩上,Shapley值法是合作博弈求解法之一,它通过公理化方法描述解的性状,进而得到唯一的解,即博弈中各局中人的效用分配。Shapley值法的出发点是根据联盟中每个成员对联盟的边际贡献分配联盟的总收益,更能体现合作各方对联盟的贡献,保证了分配的公平性,因而更合理、更科学。对每个博弈,存在唯一的Shapley值φi(v),且

其中φi(v)表示博弈方i应得的效用分配,n表示博弈中局中人的数量,|S|表示联盟中所含局中人的个数,v(S∪{i})表示i加盟S后,新联盟的合作剩余,因此i的贡献是v(SY{i}-v(S)。下面以表2中的数据矩阵为例, 运用Shapley值法对三个俱乐部的利益分配进行定量化的计算:

由表2的数据分析发现,两家俱乐部合作比单独与媒体进行谈判所带来的收益高,三家合作要比两家合作或单独行动带来的收益高,利用Shapley值法对甲乙丙三个俱乐部的电视转播收益分配计算结果如下:

则φi(v)=(533m,383m,293m)就是一个根据俱乐部比赛成绩进行分配的一个方案,运用Shapley值法的好处是既避免了完全平均分配中由于联盟中各俱乐部竞技水平高低的差异所带来的不公平性,同时又可以通过各个俱乐部在电视转播权的出售议价能力上的贡献有定量化的衡量标准。

为保证联盟转播费分配的公正,必须要将赛事转播的次数考虑在内,通常职业体育比赛的激烈程度和观赏性决定着赛事转播的次数,而赛事的激烈程度和高观赏性需要有高水平的运动员作保证,以NBA为例,见表3。

通过表3可以看出,卫冕冠军湖人队的比赛直播次数独占鳖头,另外姚明所在的火箭队因为浓厚的中国元素和巨大的球迷市场也遥遥领先其他球队,2010年夏天球员转会市场上最轰动的“新三巨头”的热火队为球迷带来欣喜和期待也不容小视。这些都体现在媒体对他们的关注度和转播次数上,从表3中我们可以发现,凡是转播次数较多的比赛,球队中明星球员的年薪明显要高出一筹,湖人当家球星科比平均年薪达到2 785万美元,因此在具有高薪运动员的俱乐部分配中就必须考虑利益分配的公正性,高水平的比赛需要有高水平的运动员参与,高水平、高观赏性的比赛需要运动员付出艰辛的训练强度和高超的技术水平,这些均不同程度地体现在媒体对赛事的转播次数上,这就需要在利益分配上给予支持,如果付出与收入不成正比例关系,那么球员将失去竞争的动力,球队也将失去引进高水平运动员的动力,长此以往,失去的将是联赛的整体竞争力和观赏性。

3 我国职业体育联赛电视转播市场存在的问题

3.1 大众喜爱的职业联赛水平不高,水平较高的又缺乏观赏性,跟国外的职业体育联赛相比缺乏竞争力,比如CBA和NBA以及中超和英超等联赛水平相比都有着天壤之别,这样导致电视转播收视率不高,造成联盟在与媒体进行议价过程中底气不足。

3.2 我国电视转播媒体存在严重的垄断现象,由于其他电视台电视覆盖面远不及中央电视台,导致中央电视台一枝独秀问题严重,缺乏媒体竞争机制,最典型的例子就是上海文广集团买断了中超联赛近三年的电视转播权,但由于文厂集团的电视覆盖面不及中央电视台,加之央视受利益驱使等甚至连中超联赛的新闻报道都几乎没有,因此中超联赛的商业开发受到很大影响,许多观众也看不到中超比赛。

3.3 联赛缺乏必要的平衡机制,比赛缺乏悬念,目前我国的职业联赛强者恒强弱者恒弱现象严重,以CBA联赛来说,近几年广东队和新疆队一直是联赛的顶尖强队,早几年八一队六连冠,近六年广东队五次夺冠,这些现象的出现导致联赛竞争实力的严重不平衡,导致联盟比赛缺乏悬念性,失去了竞技体育的魅力。

4 对我国CBA联赛电视转播的几点建议

4.1 通过对职业体育赛事电视转播权的非合作博弈分析,得出各个俱乐部在追求个体利益最大化的过程中容易陷入“囚徒困境”损失了联盟利益的同时也无形中放弃了联赛电视转播权整体出售带来的效益。因此基于联盟博弈的角度,CBA联赛的电视转播权应选择整体出售的方式来保证联盟的整体利益最大化,篮管中心应改变对电视转播收益定额分配的方式,为提高各俱乐部参与联赛经营的积极性,实现可持续发展。笔者认为CBA联赛可借鉴NBA等成熟联赛的经验,采用约定比例或影响力比例的方式对CBA联赛的收入进行分配。这一方面可最大限度地调动球队与球员参与联赛经营的积极性,另一方面也可减少篮管中心与球队的冲突与磨擦。

4.2 基于职业体育赛事电视转播费分配的特殊性分析,认为CBA联赛的电视转播费的分配可以由三部分组成,第一部分基于职业体育联盟分配的平衡性和有效性,用于平均分配的部分;第二部分是根据Shapley值法计算出的根据各俱乐部竞技成绩排序的部分,依据是每个成员对联盟的边际贡献分配的部分,更能体现合作各方对联盟的贡献,保证了分配的公平性,有利于赛事观赏性和激烈程度的提高;第三部分是根据球队比赛转播的次数进行分配,这样能够保证分配的合理性和公正性,保证联盟成员管理运作的积极性,提高俱乐部的影响力,从而提高联盟的形象。

4.3 目前CBA联赛在电视转播权出售上存在媒体购买垄断的现状,根据福利经济学和博弈论的分析可以得出:垄断不利于整个社会福利的增加,赛事承办方与电视媒体的博弈产生的交易成本越多,赛事承办方利益损害越大,电视媒体利益损害越少。而竞争是导致福利增加的有效手段,因此增加对CBA联赛电视转播权开发的竞争性是提高整个联赛乃至社会福利增加的有效方法,即如何在实现社会福利最大化过程的同时减少反垄断成本,根据当前的情况,体育与媒体的有机融合同时采取反垄断的措施是当前CBA联赛赛事转播权开发的参考途径之一。

参考文献:

[1]王晓东.美国职业体育赛事电视转播权开发研究[J] .体育文化导刊,2007(2).

[2]李帮义,王玉燕.博弈论及其应用[M] .北京:机械工业出版社,2010.

[3]李章龙.博弈论在我国竞赛表演业中的研究[D] .中国学位论文全文数据库,2007.

[4]张洪振,陈文新,赵聪.体育赛事中体育产品有效提供的机制研究[J].山东体育科技,2010(4).

篇6

内容摘要:随着房地产开发用经营性土地使用权出让行为越来越规范,房地产开发企业之间为获取土地使用权的竞争也日趋激烈,在土地使用权挂牌和拍卖出让中,房地产开发企业需要确定一个合理的并综合考虑竞争因素的出价,房地产开发企业之间土地使用权出让博弈就显得更为重要。本文针对房地产开发企业在获得经营性土地使用权中存在的问题,针对土地使用权招拍挂方式,构建了房地产开发企业获取土地使用权的竞价博弈模型,并进行了相关分析,提出了一种考虑竞争因素的博弈竞价法。

关键词:土地使用权 挂牌 拍卖 博弈模型 博弈竞价法

研究背景

房地产开发用经营性土地使用权出让的行为越来越规范,土地使用权的招拍挂(特别是拍卖和挂牌)正成为房地产开发企业获得土地使用权及政府部门出让土地使用权的主要方式。同时由于房地产开发市场的日趋成熟,政府宏观调控政策的影响,房地产开发企业之间为获取土地使用权的竞争也更加日趋激烈。房地产开发企业对土地使用权出让,特别是对土地使用权招拍挂形式出让的研究就迫切地摆上了房地产开发企业的主要研究日程。

房地产开发企业研究土地使用权出让行为是在我国进行房地产项目开发前期不可缺少的环节。由于历史原因,我国土地使用权招拍挂出让活动起步较晚,初期房地产市场不正规,有些房地产开发企业对土地的决策靠“拍脑门”、也有许多房地产开发企业以前靠“投机”行为获取暴利,而没有对土地使用权招拍挂引起重视,结果损失惨重。进入20世纪,房地产开发的投资环境逐渐趋于成熟,房地产法规的完善和市场行为的规范,对未来的房地产开发企业来讲,即将面临的是一个完备的房地产市场体系和一个公平、公正、公开的土地使用权出让的竞争环境,房地产开发企业研究土地使用权出让的博弈就显得更为重要。

从房地产开发企业的角度来看,能否获得土地取决于其出价的高低。如果出价过高,虽然能获得土地,但由于土地成本过高,最终会使其利润过低甚至亏损。如果出价过低,则难以获得土地。因此,在土地使用权挂牌和拍卖出让中,房地产开发企业需要确定一个合理的并综合考虑竞争因素的出价。本文针对房地产开发企业在获得经营性土地使用权中存在的问题,针对土地使用权招拍挂方式,构建了房地产开发企业获取土地使用权的竞价博弈模型,并进行了相关分析,提出了一种考虑竞争因素的博弈竞价法。

土地使用权竞价博弈模型实例分析

假定某土地使用权拍卖出让或者挂牌出让的底价为b0,有n家房地产开发企业有意获得该块土地,并参加竞拍。第i家房地产开发企业的超出底价的报价为bi≥0,即第i家房地产开发企业的报价为b0+bi;第i家房地产开发企业认同的该块房地产开发用地的土地使用权的认同的超过底价b0之外的价值为vi≥0,即房地产开发企业认同的该块房地产开发用地的土地使用权的价值为b0+vi。

(一)两家企业土地使用权竞价博弈

设只有2家房地产开发企业决定参加此次土地使用权拍卖或挂牌,i=1,2。

显然,每个房地产开发企业对地块土地使用权的认同价值vi是不公开的,vi只有第i家房地产开发企业自己知晓,即相互独立。但每房地产开发企业都知道vi独立地取自定义在区间[0,1]上的均匀分布函数。若第i家房地产开发企业以价格b0+bi中标,则第i家房地产开发企业的净收益为(b0+vi)-(b0+bi)=vi+bi,若第i家房地产开发企业未能中标,则净收益为0。

因此,第i家房地产开发企业的收益函数为:

(1)

假定,第i家房地产开发企业的出价bi(vi)是其对该地块土地使用权的认同价值vi的严格递增函数,显然,bi(vi)≤vi,因为没有哪家房地产开发企业愿意付出比其认同的土地使用权价值更高的价格(那样,房地产开发企业的效用将为负值)。

由于博弈是对称的,只需要考虑对称的均衡出价策略b=b*(v)。

给定v和b,第i家房地产开发企业的期望支付为ui=(v-b)Prob{bj

由于v是连续分布,则有Prob{bj

根据对称性有bj=b*(vj),得到

(2)

式(2)中,Φ(b)=b*-1(b)是b*的反函数(即当房地产开发企业选择出价为b时,出价b对房地产开发企业的价值为Φ(b)),则获得第i家房地产开发企业的博弈论模型(期望支付函数)如下:

(3)

最优化问题的一阶条件为

(4)

这是边际收益等于边际成本的条件,增加b的边际成本为确保中标的情况下支出增加Φ(b),边际收益为中标的概率乘以确保中标的情况下的净收益(v-b)

Φ′(b)。

在均衡条件下,如果b*是第i家房地产开发企业的最优策略,那么Φ(b)=v,故最优化的问题的一阶条件为,可转化为。

解得最优解,即第i家房地产开发企业在该博弈中的贝叶斯均衡是,则第i家房地产开发企业最优的出价策略为 (5)

(二)n家企业土地使用权竞价博弈

设有n个房地产开发企业决定参加此次土地使用权拍卖或挂牌,则得到博弈论模型(期望支付函数)如下:

(6)

最优化问题的一阶条件为

或者 (7)

在均衡条件下Φ(b)=v

故最优化的问题的一阶条件为 (8)

解上述微分公式,得最优解(9)

则第i家房地产开发企业在该博弈中的贝叶斯均衡是。

即第i家房地产开发企业最优的出价策略为。

考虑竞争因素的博弈竞价法

显然,b*(v)随n的增大而增大,当n∞时,b*v,即参加土地使用权拍卖或挂牌出让的房地产开发企业越多,企业支付的土地使用权出让金也就越高,当参加土地使用权拍卖或挂牌出让的房地产开发企业趋于无穷多时,企业几乎支付出全部土地使用权的价值。

从式(9)最优解中可以看到:

当n=1时,b*(v)=0,即只需要支付底价即可获得该块地块的土地使用权。

当n∞时,b*v,

即房地产开发企业需要支付全部的b0+v才可获得该块地块的土地使用权,企业几乎支付出全部土地使用权的价值。

房地产开发企业最优的出价策略为,即博弈竞价法确定的房地产开发企业最优的出价策略为。

土地使用权出让竞价策略在于社会平均的建筑技术水平下制定的,房地产开发企业只有提高自己的技术水平、管理水平,通过提高生产率,缩短建设期等手段,达到减少项目成本的目的,从而提高利润率,这样才能获得更高的土地使用权的估值vi,使自身在土地使用权竞价过程中处于有利位置。

房地产开发企业应对土地使用权出让的地块进行深入的调查,同时选择自己针对性的土地地块,通过参加土地管理部门组织的现场勘查及了解提报竞价申请的房地产开发企业的数量,选择参加竞拍的房地产开发企业数量n较少的地块进行竞拍,避免恶性竞争,以期获得更多的期望效用。

房地产开发企业在确定报价时,既不能盲目地压价,也不盲目乐观地报高价,应当在确定自身成本的基础上,认真地研究分析竞争对手情况,采用最优报价策略,以期获得最大的收益。而从经营战略上,成本优势是房地产开发企业在突击使用权竞标中获胜的关键。

博弈竞价法在某地块竞拍中的应用

(一)案例概况

经某市人民政府批准,某市国土资源和房屋管理局决定以拍卖方式出让一幅储备地块的国有土地使用权,土地拍卖起叫价(楼面地价)3180元/。

(二)案例分析

1.问题分析。

博弈的参与者人:某公司和其他参加该块土地使用权拍卖的房地产开发企业。

某公司参加拍卖的情况了解:由于该地块为某市某区不多的大幅地块之一,引来众多的企业关注,并有包括某公司在内的7家房地产开发企业参加竞拍,可谓竞争激烈。某公司参加多次某市土地竞拍,多以失利告终,其原因主要有二:其一采用的确定竞价的方法产生的竞价过低,造成失败;其二不考虑自身开发水平,盲目竞高价,虽然中标,但中标成本过高,造成开发收益不理想,甚至造成为了减少损失,不签订正式土地使用权出让合同,造成流标,形成竞拍保证金损失。本案例要求为该公司出具竞拍策略,可应用博弈竞价法求最优竞价。博弈竞价法的竞价公式为最优竞价。

2.求解。

确定b0,由公告可确定设定的土地使用权拍卖出让的底价b0=3180元/平方米。

确定vi,确定该公司认同的该块房地产开发用地的土地使用权的价值b0+vi。应用直线趋势法测算完成开发后(预测整个开发周期为4年)的房价。根据对某市该区域近7年来商品房价格情况的调查,得出某市某地块周边商品房价格如表1所示。从表1中可以看出,近7年来,某市该地块周边商品房的价格总体呈明显上升趋势,其趋势如图1。从图1看出,某市该地块周边商品房的销售平均价格基本上呈直线形式,在此,采用直线趋势法对该地块建成房产后的销售价格进行预测。

以y表示商品房价格,t表示年份序号,选用y=a+bt作为商品房销售价格直线趋势方程,其中a、b为参数,则由最小平方法可得标准方程组:

(10)

根据某市某地块周边商品房的销售平均价格,得到直线趋势法预测计算表2。

将表2计算结果代入最小平方法标准方程组得:

(11)

解此联立方程组,得a=4382.7,b=674.36。

由此可得商品房价格直线趋势方程为:y=4382.70+674.36t。

利用y=4382.70+674.36t直线趋势方程,可以预测到某市某地块在2009年的销售价格为:

y2010=4382.70+674.36×11=11800.66

元/平方米

则该地块的销售总价值=11800.66元/ m2×58134.3 m2×3.28=225015.58万元

利用假设开发法求开发后该块房地产开发用地的土地使用权的价值。计算见表3假设开发法计算表。折合成楼面地价为6534.76元/m2。

求该块房地产开发用地的土地使用权的价值的现值,即该公司认同的该块房地产开发用地的土地使用权的价值b0+vi。以银行贷款利率5.85%作为折现率,则可将该块房地产开发用地的土地使用权的最高价值折算为现值,即

b0+vi=6534.76×(1+7.47%)-4=4898.70元/m2。

确定该公司认同的该块土地使用权超过底价b0之外的价值vi,vi=(b0+vi)-b0=

4898.70-3180=1718.70元/m2

确定n。经调查,共有7家房地产开发企业确定参加该地块土地使用权拍卖,则可确定决定参加此次土地使用权拍卖的房地产开发企业的数量n=7。

求该公司的最优出价策略b0+b*。根据最优解公式可以推出,如果某公司对该地块的认可价值最高,则政府拍卖的成交价格为,可得出表4。则n=7时,该公司的最优出价策略b0+b*=4653.17元/平方米。

3.通过博弈竞价法获得的对策。某公司的最优报价策略为:出价b0+b*=4653.17元/平方米。

(三)竞价结果分析

最终,某公司以4600元/平方米的价格竞拍成功,获得该块地块的土地使用权。

可见,最终的成交价格4600元/平方米的价格与推算价格4653.17元/平方米比较相符,误差仅为1.16%。

结论

房地产开发企业研究土地使用权出让行为是在我国进行房地产项目开发前期不可缺少的环节。由于历史原因,我国土地使用权招拍挂出让活动起步较晚,初期房地产市场不正规,有些房地产开发企业对土地的决策靠“拍脑门”、也有许多房地产开发企业以前靠“投机”行为获取暴利,而没有对土地使用权招拍挂引起重视,结果损失惨重。随着房地产开发用经营性土地使用权出让行为越来越规范,房地产开发企业之间为获取土地使用权的竞争也日趋激烈,在土地使用权挂牌和拍卖出让中,房地产开发企业需要确定一个合理的并综合考虑竞争因素的出价,房地产开发企业之间土地使用权出让博弈就显得更为重要。

房地产开发企业在获得土地使用权的过程中面临的是一个完备的房地产市场体系和一个公平、公正、公开的土地使用权出让的竞争环境,从房地产开发企业的角度来看,能否获得土地取决于其在竞争的环境下出价的高低。本文针对房地产开发企业在获得经营性土地使用权中存在的问题,构建了两家企业和多家房地产开发企业获取土地使用权时的竞价博弈模型,提出了考虑竞争因素的博弈竞价法并给出实例。该法为房地产开发企业提供了在多家企业竞争情况下的最优出价策略的参考,可以帮助房地产开发企业在具体的房地产开发项目管理中规避土地风险。

参考文献:

1.张维迎.博弈论与信息经济学.上海人民出版社,1996

2.肖条军.博弈论及其应用.上海三联书店,2004

3.黄小彪.住宅领域的市场失灵.中外房地产导报,2002(8)

4.汪利娜.房地产泡沫的生成机理与防范措施.中华工商时报,2002(12)

5.曹震.房地产市场的博弈问题研究:学位论文.河海大学国际工商学院,2003

6.罗建荣.房地产的风险与困惑.省略,2002

7.董英兰.房地产市场博弈:学位论文.首都经济贸易大学,2006

8.罗贞礼.基于土地资源可持续利用的竞价拍卖政策博弈.国土资源导刊,2004(3)

9.刘晓君,刘云.拍卖出让土地使用权的博弈分析.统计与决策,2005(1)

10.方豪斌,唐根年.基于博奕理论的土地拍卖出让竞价策略研究.经济师,2003(1)

11.张淑娟,刘艳芳.城市土地使用权招标出让的博弈分析.武汉大学学报,2005(11)

作者简介:

侯乐君,男,1976.3―,硕士,经济师,总经理,江西南昌人。在企业中从事各类项目的管理工作。

篇7

关键词:黑哨;经济;博弈

中图分类号:F224.32 文献标识码:A doi:10.3969/j.issn.1672-3309(x).2011.11.45 文章编号:1672-3309(2011)11-99-03

一、引言

随着生活水平的提高,体育竞技逐步成为全球性产业,吸引了众多消费者(观众)花费金钱和时间观看比赛,购买的不是物质上的利益,而是精神上的愉悦,这种愉悦来自比赛过程和比赛结果的不确定性。但“黑哨”的出现让比赛失去了不确定性,使消费者得不到所需的优质产品,导致消费者流失,进而危机到这些产业的根基。

关于黑哨的概念,普遍认为是指竞技体育中的裁判员为了追求个人或集团利益而违背原则、采取不正当手段,损害竞赛参与者以及观众等的合法权益,破坏竞赛秩序等行为。本文假设在一场竞技比赛中有3个参与者:A队、B队和G裁判,即博弈的局中人为N={A队,B队,G裁判}。3个局中人可以形成以下6个博弈:A队和B队的博弈、A队和G裁判的博弈、B队和G裁判的博弈、AB联盟和G裁判的博弈、AG联盟和B队的博弈、BG联盟和A的博弈。由于AG之间的博弈和BG之间的博弈都属球队和裁判的博弈,因此作球队和裁判之间的博弈处理;AB联盟和G裁判的博弈属于假球,不在本文的讨论范围之内;AG联盟和B队的博弈与BG联盟和A的博弈同属黑哨的受益方与受害方的博弈,所以只需分析一个即可。综上所述,仅分析A队和B队的博弈、A队和G裁判的博弈以及AG联盟和B队的博弈就能将黑哨当事人之间的关系表述完全。

二、裁判为什么吹黑哨

首先,裁判有吹黑哨的权力。虽然比赛和执法都是在众目睽睽之下进行,并且观众能对大多数的犯规行为做出正确的判定,如篮球中的走步、足球中的越位等,但球场上不可避免存在一些需要裁判主观断定的情况,如篮球中的进攻犯规、足球中的无意手球等,还有因裁判所站角度不同而造成的误判等,并且裁判规则给了裁判最终裁决权,这个权力在保障了比赛流畅性的同时也给了裁判主观裁决的机会,主观性的判决让裁判有了在关键时刻决定比赛的能力。也就是说裁判有“在某种程度上控制比赛”这一资源。

其次,裁判有吹黑哨的激励。制度经济学中假设人们有机会主义倾向,在经济活动中总是尽最大的能力保护和增加自己的利益,自私并且不惜损人。因此,作为理性人的裁判将利用自己的权利来寻租,或威胁对球队采取不利的执法行为,或许诺在比赛中偏袒球队来获得贿赂,以增加自己的物质利益。

最后,缺乏有效的监督机制。从裁判的专业性来看,许多竞技比赛的裁判都来自相应项目的协会,在生活和工作中与竞技双方存在诸多交集,便于在私下达成交易而不被发现。从裁判供给的来看,裁判都来自相应协会的下级组织,如果出现黑哨,一般只作内部处理,处罚的力度不强。从法律法规来讲,有政府的法律和协会的条例来禁止黑哨,但许多国家并没有对竞技比赛中的裁判行为专门立法,只是在事态特别严重时援引其他法律,威慑力有限。

三、参赛者为什么收买裁判

首先,球队有收买裁判的冲动。大部分的竞技比赛是一种商业活动,竞技双方的目的都是为了获取收益,而能带来最大收益的是比赛的胜利。胜利可以增加参与者的知名度,提高品牌价值,提高观众的忠诚度以及吸引更多的观众,进而提高上座率、门票价格、转播赛事的价格和分成等。在商业利益的驱使下,球队有不择手段获取胜利的冲动。

其次,比赛双方都面临着行贿的“囚徒困境”。从上面的分析可知,球队有收买裁判的内在冲动,并且这是A队和B队的公共信息,也就是说,A队和B队都知道对方想收买裁判。由此,存在如下博弈:局中人N={A队,B队},SA={收买,不收买},SB={收买,不收买},各自的支付如下表:

这里假设收买裁判要付出1单位的成本;裁判偏袒的一方可得到2单位收益,同时损害对方2个单位的利益;两队策略一样时裁判公正执法。

划线法可知:这个博弈的纳什均衡是(收买,收买)。对A、B来说,不管对方采取什么样的措施,收买裁判都是最优的选择,博弈后两队的收益都为-1。从表中可知,(-1,-1)是博弈中最差的结果,总体要损失两单位的利益。对追求私利最大化的A队和B队来说,虽然最终收益都为负,但“理性”导致他们只能选择收买裁判,忍受利益的损失。

最后,即使球队没有收买裁判的冲动,作为人的裁判也可能导致比赛双方进入“囚徒困境”。这是因为,作为业内人士的裁判,对参赛双方或者各队队员有着自己的好恶,这种好恶或是直接交往形成的或者是道听途说形成的。裁判的好恶将导致对喜欢的一方放松尺度,对厌恶的一方严格执法。对于比赛双方来说,由于不知道自己在裁判心中的地位比对方高还是低,就会去做能增强裁判对自己好感的事情,如请客、送礼等,这将形成如下困境:

这里将“做能增强裁判对自己好感的事情”称为“作为”,否则,称“不作为”,其他与上面的“囚徒困境”类似,不在累述。

因此,球队对自身利益最大化追求的理性也是黑哨形成的重要原因。

四、黑哨协议的达成

“黑哨”的形成,需要双方事先约定未来收益的分配协议。由于黑哨是有风险的,如果被查处,将导致行贿一方品牌价值降低以及由此带来的利益损失;受贿一方面临被清除出本行业及有关的法律惩罚等风险。在协议达成前,双方都将衡量自己面临的风险与收益,力争在最小的风险下获取最大的收益。由于双方对自己的收益和风险估计是私人信息,可以作为一个双向拍卖来分析。

假设A队为行贿者,G裁判为受贿者。A队确定一个行贿量QA,G裁判给出一个索贿量QG,如果QA≥QG,则黑哨协议以: Q= 达成,如果QA<QG,则不达成协议。A队经过风险和收益分析,对行贿量有一个估计(estimate),设为EA,为A队愿意为黑哨付出的最高价;G裁判对比自己的风险收益后也有个对索贿量的估计,设为EG,为裁判愿意执行黑哨的最低价。这两个估计都是私人信息,假设都服从[0,1]区间的均匀分布。如果双方以Q达成协议,A队获得EA-Q的收益,G裁判获得Q-EG的收益;若达不成协议,双方效用都为0。

在这一贝叶斯静态博弈中,双方的出价策略都为自己估价的函数,设为线形函数:

由贝叶斯纳什均衡的条件可知,双方的策略组合(QA,QG)应满足:

式(3)中,花括号中第二项表示协议达成时的交易价格,最后一项 表示A队出价QA时协议达成的概率, 表示A队出价高于G裁判出价,协议达成时G裁判索贿量的期望值;式(4)中,花括号中第一项表示协议达成时的交易价格,最后一个因子 表示G裁判出价QG时协议达成的概率, 表示G裁判出价低于A队出价,协议达成时A队行贿量的期望值。

将(1)(2)两式带入(3)(4)两式,并考虑双方的估计量都服从[0,1]上的均匀分布,计算可得:

对比(1)式与(5)式,有 对比(2)式和(6)式,有 即有:

由于双方达成协议的条件是QA≥QG,结合(7)(8)两式,等价情况是:EA≥EG+,因此,协议可能达成的区域是下图中的ABC,而不是所有≥的ODC区域,这是由于双方以自己利益最大化原则博弈时丧失了一部分交易(即下图中的四边形OABD)。可以发现,在双方的博弈过程中,黑哨达成的机会只有完全信息下的56.25%。

五、黑哨的查处

从黑哨的定义可知,A队与G裁判协议中所分享的利益来自B队,并不是新创造的,因此,AG联盟与B队形成了一个零和游戏,如果B队无所作为,将导致AG联盟对自己的掠夺,假设B队面临这一困境时的策略为{举报,不举报},AG联盟与B队的支付矩阵如下:

这里假设:如果存在黑哨,举报后一定能被查处;黑哨被查处后处罚两个单位用来补偿受害者的损失;举报要花费一个单位的成本。因此,在策略组合(黑哨协议达成,举报)时,AG联盟的支付为-2,B队的支付为2+(-1)=1。用划线法的结果(如表)表明,这个博弈不存在纯策略的纳什均衡,下面计算该博弈混合策略下的纳什均衡:

设AG联盟的混合策略为X={x,1-x},x∈[0,1];B队的混合策略为Y={y,1-y},y∈[0,1]。由(X,Y)是博弈平衡点的充分必要条件(这里的EAG,EB都表示期望):

计算可得该博弈的混合策略纳什均衡为 ,对应的均衡结果为: 。说明在举报存在成本且只要举报黑哨就能被查处的前提下,B队对自己策略(举报,不举报)的选择是随机的,AG联盟达成黑哨概率并不高。

但是,前面分析中“只要举报黑哨就能被查处”的假设是有缺陷的,因为黑哨协议是当事人双方签署的,第三人很难找到确凿的证据来证明黑哨交易的存在,如同大部分的行贿受贿案件一样,除非当事人承认,否则很难找到直接的证据。而通过改变联盟内部各主体的支付函数,来诱导当事人互相揭发也是行不通的,因为协议双方的利益博弈形成了一个“反囚徒困境”,成为“拴在一根线上的蚱蜢”:

这里假设:若有一方承认就表示黑哨协议被查处,且没收球队的非法所得P和裁判的非法所得Q(也就是行贿量)。惩罚方面:如果一方承认,另一方不承认,承认一方的惩罚是1单位,不承认一方惩罚为10单位;如果两方都承认,则各惩罚3个单位。

从上表中的划线可知,该博弈有两个纳什均衡:(承认,承认)和(不承认,不承认)。对比这两个纳什均衡给双方带来的支付,(承认,承认)的结果导致原有的收益丧失而且还面临新的处罚,(不承认,不承认)不但保全原有所得而且避免了新的损失,并且两个均衡的结果对于局中人来说是公共信息。因此,不管是裁判还是对球队,只有选择不承认才能使自己的利益最大化。

当然,如果对承认者给予奖励而不是惩罚,并且奖励数量能够超过或者至少能够弥补承认所遭受的损失(对球队来说就是奖励大于P,对裁判来说是大于Q),就可能走向(承认,承认)的均衡,但这时的承认已经没有了意义:查处黑哨本来是要给予惩罚,进而减少黑哨,但这个的结果不但没有惩罚而且还给了激励。所以不承认的均衡是很难被打破,黑哨的查处相当困难。

六、结论

上面已经谈到,黑哨协议两方的利益增加不是新的商业活动创造的,而是掠取了黑哨受害者一方的利益,跟欺诈和抢劫的性质一样,将导致资源的不合理配置和低效使用,既不公平又无效率。此外,黑哨难以查处的性质使其有巨大的负外部效应,如果黑哨不被查处,协议双方有种“黑一次也是黑,黑两次也是黑”的想法,并且设法拉更多的人下水,以提高自身的安全性,从而扩大它的负外部效应。黑哨协议双方的巨额收益还有可能给其他的裁判和球队做出一个示范,进一步诱惑黑哨的发生,产生连锁反应,最终可能导致整个产业的腐败,以致产业的衰落。

鉴于黑哨的巨大危害,特提出几点防范措施:

1、对于裁判来说,首先,通过细化比赛规则和运用高科技手断(电子眼等)来减少裁判的主观判罚量,以减弱裁判对比赛的控制力。其次,提高裁判的收入水平以减少寻租的激励,增加其被发现的机会成本。最后,完善裁判市场,使裁判委员会独立于相关运动协会,增加业余裁判的数量,以增加裁判的可替代性和选择的不确定性。

2、对于参赛者来说,建立有关联盟保证其经营的可持续性,以便通过长期的重复博弈打破行贿的“囚徒困境”;加大重大赛事的监控,防止球队在巨大的利益面前铤而走险。

3、对于整个产业来说,推行完全的市场化,保证参与者能在市场机制的约束下考量自己的利益;增加市场的透明度,并建立避嫌机制,以减少裁判和球队协议达成的概率。

4、对于黑哨的查处,可以提高举报人的奖励,以鼓励更多的举报;加大对黑哨的处罚,以增加裁判和球队的风险。

参考文献:

[1] 汪贤裕、肖玉明.博弈论及其应用[M].北京:科学出版社,2008.

[2]卢现祥.新制度经济学[M].武汉:武汉大学出版社,2004.

[3]李保明.效用理论与纳什均衡选择[M].北京:经济科学出版社,2003.

[4]孙天法.黑哨之经济学分析[N].中国经营报,2002-04-09.

[5]陈夺.我国足球职业联赛“黑哨”问题的法学思考[J].科教文汇,2009,(06):219.

篇8

然而,直到最近10多年来,在均衡选择方面才取得进展,这些进展提出当存在多个均衡时,应该怎样去做。

一、纳什均衡

纳什,在1950年就已经对纳什均衡给出两种解释。第一种是群体作用的解释。此种解释假设,在博弈中存在对每个参与者又称局中人(player)起作用的参与者群体。参与者不断地积累各种纯策略中的令人注意的经验信息,如果此博弈稳定下来,那么这种均衡必是纳什均衡。然而。Shapley在1964年证明,如果博弈没有稳定下来,那么必然存在一种策略选择的有限循环。第二种解释的观点是把均衡看成一个“自动实施协议”或者是理性的预测。如果基于理性的预测是唯一的,那么博弈均衡确实得以存在,这时倘若均衡是众所周知的,它必是纳什均衡。纳什本人对此做了阐述,这是“一种十分强的理性化和理想化的解释”。这对阐述均衡而言是有效的,解决均衡选择问题是一个基本的问题。因此,对于经济学家的研究目的而言,与均衡选择相关的问题是必须加以分析和深入探讨。

对纳什均衡的第三种解释,是由MaynardSmith和Price在1973年首次提出的,它源于生物学领域的研究。在这种解释中完全不存在有意识的选择:参与者预先选取某一种策略,而且更为成功的策略生存下来;如果种群(population在生物学上称为种群,在经济学中我们将其称为群体更好)达到一种稳定状态,那么所有策略必是等价的,因此,这种状态必是纳什均衡。这种生物学上的方法,其优点是它不仅具体指出稳定的结果,而且它还靠可能达成的一些结果来给出一种显示性的过程。

当然,经济学家清楚地意识到将涉及到的生物学领域中的思想和方法应用到经济学领域中的疑问和困难,比如,像生物学中的“复制方程”扩展到经济学领域中的内容和意义是什么,至今还在探索中。

二、进化思想在经济学中应用的回顾

对经济学给出进化的解释不是一种新的手法。实际上,进化解释在社会科学中是先于达尔文(Darwin)而出现。例如,亚当·斯密(AdamSmith)曾说:“带来许多利益的劳动分工,原本不是人类智能的结果,虽然人类智能预见到劳动分工产生普遍富裕,并想利用它来实现普遍富裕。尽管在人类本能里没有意识到这样广泛效用中的一种互通有无、物物交换,以及相互之间交易的倾向,此倾向很缓慢并且渐进产生结果,但是劳动分工是必须的。”

进化思想也能够在马尔萨斯(Malthus)、马歇尔(Marshall),熊彼特(Schumpeter)和哈耶克(Hayek)所写的著作中找到。关于进化经济学,这是一个单独的学科领域,经常与熊彼特的工作相联系。Robson在2001年系统地给出了经济行为的生物学方面的基本解释。

进化经济学与进化对策论至今是完全相互独立地发展起来的。在经济学的理论研究中,理性人的偏好通常是固定的。然而,对于理性人的偏好变化或者进化选择,经济学家对此也进行了研究,特别是利他主义的生存价值以及风险态度等。然而,我们这里的进化对策论是将偏好作为固定的和已知的。

关于市场生存进化方面的研究和探讨,开始于Winter在1964年的文章“经济的‘自然选择’与厂商理论”,接下来Winter在1971年发表了“满足、选择与改革残余物”,Nelson和Winter在1982年出版的著作《经济变迁的演化理论》(有中文版),是这一领域中出现的最为重要的文献。最近由Blume和Easley(1992,1995,1996),Dutta(1992)Dutt和Radner(1993),Radner(1995),Bega—redondo以及Boldeke和Samuelson(1997)等学者在此领域进行探索和研究。虽然这个论题与进化对策论紧密相联系,但是,目前这两种文献在方法论上相距甚远。

三、进化对策论的基本原理与结论

最近10多年里,不像对策论的传统分析方法那样——考虑有限理性的经济行为人以及在严格的认知局限之下必须学习执行策略,这样的对策论理论及其应用有了迅速的发展。这方面的大量研究工作是在称为进化对策论所提供的框架下进行的。正如此学科标题所表示的,这一新学科的原理借用生物学中的进化模型所具有的与众不同的一些特征。然而,此学科本身也发展了一些新的方法和技术,特别地适合于有限理性基本假设下对社会和经济体制方面的分析。进化对策论在10多年里以快速的步伐取得长足的发展。

进化对策沦为人们提供一种具有广泛适用性的工具。其潜在的应用领域从进化生物学延伸到一般的社会科学,特别是经济学中。进化理论在经济学中有着悠久的历史传统。直到最近,这种方法在非合作对策论框架中才得到应用。

进化对策论是研究策略行为的稳健性,它是针对有限理人所组成的大群体中多次博弈背景下的进化力量而言的。这种新的组成部分在经济理论里导致一种新的预测方法,并且为其他社会科学开辟一条崭新的研究途径。

进化对策论的基本内容:

(一)进化稳定策略概念。进化对策论理论中,一个关键概念是进化稳定策略(ESS),这一概念的提出归功于MaynardSmith和Price在1973年的“动物冲突的逻辑”一文。此种策略在特定的意义上对进化压力而言是稳健的:群体执行该种策略对执行任何其他策略而言是非入侵的。假定一对个体是重复随机地来自于大的群体,去参与一个对称并有限的两人博弈,还假定所有的个体在博弈中起初都执行某一个纯的或混合的策略x是进化稳定的,那么对于每一个变异策略y,都存在一个正的“入侵障碍”,使得执行变异策略y的个体群体所获得的支付低于此障碍,从而x赢得的预期支付比执行的y所得要高。下面的不等式对于充分小的ε>0成立,即:

u[x,(1-ε)x+εy]>u[y,(1-ε)x+εy]…………(1)

其中左边的表达式记为对于策略x而言,当执行相对应策略的个体进入之后,混合群体情况的混合策略(1-ε)x+εy时的预期支付,而右边的表达式记为对于策略y而言,其所对应的情况的预期支付。

实际上,由上述定义知道,进化稳定性十分有用的特性是一个策略x是进化稳定的当且仅当(1)它是对自身的最佳反应;(2)它是对所有其他最佳反应的反应,当这些策略对其自身的反应比较时。为了弄清楚(1)是必要的,只需充分观察即知,否则会存在一个对x而言的最佳反应y。在一个充分小的种群中,表现出的这个“变异”策略几乎总会遇到策略x,从而会赢得比x水平高的收益。同样,(2)是必需的,因为否则的话一定会存在一个对x而言的可供选择的最佳反应y,它会赢得与x遇到x的时候或者至少x遇到y时候的收益相同,从而y的平均水平会赢得比混合种群要高一些的收益。注意到,进化稳定性准则没有解释种群是如何达到这种策略的。然而,一旦达到这种策略,则这样的策略对进化压力来说是稳健的。同时,人们发现,进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而,它隐含地把变异当成稀少事件,以致于种群有时间在另一个变异出现之前响应这种状况。

虽然,进化稳定性准则是一个生物学上的概念,但是它为各种各样的人类行为提供一种有关的稳健性准则。这样,进化稳定性要求人类群体中企图采用可选择的策略的任何一个小团体不比已经采用“固有”策略的那些个体所构成的团体收益好。相反,采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是,那些采用可选策略的小团体却受激励而具有转变固有策略的行为。在这种社会背景下,进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则。比如,社会风气、企业管理模式等都可以看为是某种人类群体的规则,而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然,在这种背景下,如果那些极少数的人群或企业的收益比不变异的人群或企业高时,那么这些变异分子会生存得更好!反之,则被淘汰掉。

可惜的是,许多博弈没有进化稳定策略。于是,研究人员探讨各种比进化稳定性稍弱一些的形式,以及集值形式的进化稳定性概念等。此外,ESS概念不能推广到n人对策的情况上。在本质上,ESS要求强的纳什均衡来实施,也就是每一个策略对于策略组而言应是唯一的最佳反应。

(二)复制动力学。复制动力学是选择过程的显性模型,它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学的数学公式是由Taylor和Jonker于1978年在“进化稳定策略和对策动力学”一文中提出的。他们认为由随机配对的个体所构成的一个大种群执行有限对策的两人博弈,犹如进化稳定性的设置一样。然而,此处的个体仅仅采用纯策略。种群状态是指在纯策略上的一个分布x。这种状态在数学上与博弈中的混合策略是等价的。

如果博弈中的收益表示成生物学上的适合性,也就是后代的数目,同时每一个后代继续其父母的策略,因此,采用纯策略i的个体数目(在大的种群中)将以某一比率指数增长,而此等于对纯策略i的预期收益u(ei,x),当执行着表示种群中当前策略分布的混合策略x时,采用任何纯策略i的种群分布的增长率等于此策略的收益与种群中平均收益的差。后者,等同于混合策略x当与其自身博弈时的预期收益u(x,x)。这是一个单种群的对称两人博弈的复制动力学。

Xi=[u(ei,x)-u(x,x)]xi………………(2)

注意到,对当前种群状态x的最佳反应具有最高的增长率。第二最佳反应具有第二高的增长率,如此等等。然而,虽然更成功的纯策略比欠成功的纯策略增长得快,但是种群中的平均收益不必随时间而增长。产生这一原因的可能性是,如果一个个体由采用最佳策略的个体所代替,那么遇见这个新个体的成员会得到比较低的收益。例如,这正是囚徒困境博弈的情况。如果最初几乎所有个体采用“合作”,那么个体中将逐渐地转向“抵赖”,从而平均收益将下降。然而,如果博弈在两个人总是获得相等的收益意义上是一个双对称的,那么自然选择的基本规律将成立:种群中收益随时间而增长,即使没有必要成为全局最大的。例如,这就是合作博弈的情况,其中所有个体逐渐地转向到执行同一个纯策略上。复制动力学能够推广到n人博弈的情况上,这可以看成是来自于n种群、中的个体随机地以n类型配对,其中每一个参与者的地位状况正如纳什所给出的群体行为解释的那样。目前,存在两种形式的n种群复制动力学,其中一个是由Taylor在1979年提出的,另一个是由MaynardSmith在1982年给出的。

(三)学习模型与选择动力学

人们把学习模型分成三种类型,即基于信念的学习、强化学习以及模仿学习。最近的一些研究表明,复制动力学是由后面两类的某种模型所促成的。

1.强化学习模型

心理学上的有关个体学习文献的中心模型是所谓的强化模型,这是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“导致过去好的选择在将来最有可能重复”。当然,人们注意到这里的选择隐含地作为概率上的一种说法。

Bush和Mosteller的强化学习模型及其他的推广形式,已经在一系列的人类主观执行博弈中得到运用。可惜,这些模型的通常数学性质,人们还知道得很少。然而,Borgers和Sarin在1997年发表的“通过强化和复制动力学的学习”文章把Cross的Bush—Mosteller学习模型的形式与Taylor的两种群复制动力学进行了理论上的对比研究。虽然这种学习过程在离散时间背景中是随机的、演化的,而复制动力学在连续时间背景中是确定的、演化的。他们证明,在适当地构造连续时间的界限下,他们的学习过程在有限时间区间内可通过复制动力学来*近。

更确切地讲,他们研究在多次博弈回合中(n=l,2,…),在一个固定的两人参与者采用混合策略对中有限两人博弈的情况。每一个参与者凭借由其所运用的纯策略来记录概率如下。如果参与者1(同样的考察参与者2)在博弈的n次回合中运用纯策略k,并且获得一个正的收益Vk(n),这里Vk(n)作为随机变量,它依赖于参与者2所做出的随机选择,那么参与者1对于运用这个策略的未来概率将越增加,其收益也就越高。参与者2以同样的方法记录其选择概率向量Y。所有收益均假设处于单位开区间上,不过,这里的收益不能解释成N—M(冯·诺依曼和摩根斯藤)效用。因此,一旦所用策略的概率是递增的,那么所有选择均是强化的。

从任何一个初始概率向量X(0)=x0和Y(0)=Y0开始,方程(3)定义出博弈的混合策略空间中的一个马尔可夫链{X(n),Y(n)}∞n=1。其中参数δ>0表示博弈的两次回合之间的时间:t=nδ是n次博弈回合中的“真实”时间。Borgers和Sarin得到这一过程的连续时间界限,通过设n∞和δ0以便有δn=t,在任何有限的“真实”时间上来估计价值。因此,博弈在越来越短的时间区间上执行,同时概率以相称的较小数值得以适应。他们证明,在这个界限内,此过程以状态(x(t),y(t))的形式出现在单位区间概率上,其中如果复制动力学的初始状态在时间0处以(x0,y0)开始,那么复制动力学会在时间t达到。在这个意义上,复制动力学在有限时间区间上近似于强化动力学(3)。

然而,这两类模型的渐进性质却十分不同。例如,为了在直观上理解这点,假设参与者1的收益既是恒定独立于他的策略选择又独立于参与者2的策略选择。设参与者1在强化动力学中的初始状态指派概率等于参与者1的所有可获得纯策略的概率。同样的,设复制动力学的初始状态指派种群的各部分采用策略的概率等于所有可获得纯策略的概率。显然,复制动力学的解是一个常量:所有种群的各部分分得的收益永远相等。然而,强化动力学的实现会容易随时间而收敛到参与者1可获得的任何一个纯策略上。由于在博弈的第一个回合中选用策略的概率将高于在下一次博弈回合中所选用的策略概率,所以强化动力学的性质更有可能把参与者1“锁定”到他的任何一个纯策略上。Borgers和Sarin证明,任何有限两人博弈的强化动力学以概率1收敛到一个纯策略组合上,而不像复制动力学那样。

2.模仿学习模型

博弈论学者Gale,Binmore和Samuelon在1995年提出一个所有个体参与者都采用纯策略的大群体,但是有限博弈的社会学习的简单模型。每一个参与者在博弈中都赢得一个渴望水平的收益。在离散时间0,δ,2δ,…上,任意从群体中抽取个体δ部分,把其当前收益与他们的渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来*近。

人们把个体策略的适应过程作为连续时间中的一个随机过程。假设在有限群体中每一个个体时常得到一个冲动,使其改变纯策略。如果这些冲动是依照i.i.d.的Poisson分布,那么同时发生的概率是零,而且总的过程也是一个Poisson过程。此外,总过程的密度刚好是各个过程密度的和。如果群体是很大的,那么人们利用预期值给出的确定流来近似这个总过程。

Bjornestedt和Weibull在1996年研究了一系列这种模型,其中改变的个体在其博弈的群体中模仿其他的个体,并证明许多正收益的选择动力学可以被人们推导出来,包括复制动力学的三种形式。特别,如果个体改变比率对其策略而言预期收益是线性递减的,那么每一个纯策略Poisson过程的密度是与其个体总数大小成比例,同时比例因素将是其预期收益递减的。如果每一个改变的个体选择其未来的策略是通过在其博弈中随机地模仿抽取的个体,那么其作为结果的流*近也是一个复制动力学。

Schlag在1997年分析当个体经常以参与者的同样地位去模仿其他参与者个体时,个体应该选择什么样的模仿规则的问题,然而参与者的同样地位却受制于信息和记忆的约束。他发现,如果个体想要学习规则是在所有平稳环境中收益递增,那么此个体应该满足:(1)当改变策略时,总是通过模仿来进行;(2)永远不向收益实现比其所拥有收益低的那些个体模仿;(3)向收益实现比其拥有收益高的那些个体模仿。

这种模型被各种各样不同的环境所发展。在有限两人博弈中,Schlag假设在随机地来自于两个相等大小的有限群体的个体之间两两配对,每一个有其自己的地位。个体总是执行纯策略。在每一个收益实现之后,每一个个体都要随机地与其他个体所处的群体进行抽样调查,并且比较两种收益的实现。行为规则是一种函数关系,即把收益实现和所用策略对应到博弈中个体地位上可获得的纯策略集合上的分布,为的是采用新的策略。换句话说,允许使用个体的唯一资料是这种收益实现和纯策略对。特别,从较早的博弈回合中实现收益被忽略。此外,假设个体在所有博弈中运用相同的行为规则,具有相同数目的纯策略可选择;也就是,个体不需要知晓他们执行什么样的博弈,他们知道所使用的纯策略数目就足够了。

在任何这样的博弈中,导致预期收益弱递增的以及在对手种群中对于任何固定策略分布的行为规则,称为改进。本文中的重要结果是对于所有这样规则的刻画。改进规则的一个特征是他们是模仿的:个体坚持其初始的策略或者采用抽样的个体策略;但是不会转向第三个的策略。

行为规则称为是占优的改进规则,如果在某一个博弈中不存在改进规则产生比较高的预期收益改进比例,而且在对手种群中的某一个策略分布上。Schlag证明,某一个行为规则为占优的改进规则,其具有上面给出的性质(1)(2)(3)。这个比例模仿规则是其自己的一个改进规则,而且可以证明它确有一些其他吸引人的性质。Schlag证明,Taylor两种群复制动力学的离散时间形式可以*近在任何给定有限时间范围内导出的一个随机过程,只要种群充分的大就行。

(四)进化对策论中的一些结论

本文集中探讨关于有限n人博弈的显性动力学种群模型方向的介绍,其中个体执行纯策略。首先探讨确定性选择动力学,然后介绍随机进化模型,其中把随机变异过程与确定性选择过程或者随机选择过程结合起来。

研究确定性动力学项目性质的一种直接方法是选取一个初始的种群状态,并且稍后可以计算。然后,人们应该记住让初始的所有纯策略在种群中出现,由于初始的已亡策略将在选择过程中仍保持已亡的状态。这种解的轨迹称为内部的。解的轨迹随时间流逝而安定下来,就称为收敛的。反之,则称为发散的。

如果种群状态是收敛的,那么什么是长时期限制状态的本质呢?可以证明,在任何一种弱的正收益选择动力学中,沿着任何收敛的内部轨迹,限制状态必将构建纳什均衡,研究人员发现,种群执行某种纳什均衡或者在渐进意义上的纳什均衡。Nachbar在1990年第一个证明出单种群复制动力学的这个结果。事实上,如果选择过程遇见弱的正收益的相对温和的条件,且如果汇总的行为随时间而安定下来,那么在长时期种群状态中的个体就好像他们预期一个特殊的纳什均衡对此执行着一个最佳反应,这点颇像是纳什所声称的“群体解释”。

如果对于弱的正收益选择动力学的内部解随时间而收敛,那么我们看到幸存下来的策略在作为结果的混合策略组合的最佳反应的意义上是理性的。此处的问题是,如果解的轨迹不收敛,那么会发生什么情况吗?当长时期中没有均衡达成时,我们产生的问题是,执行是否为理性的。

非合作博弈论中基本的理性假设是参与者不采用作为严格的劣(strictlydominated)纯策略。这个假设要求不知道其他参与者的偏好或者行为。一个更严格的理性一--附有知识的---假设是参与者不采用作为迭代的严格的劣策略。除了回避严格的劣的策略之外,这个假定要求所有参与者相互知道彼此的收益,而这些就是他们知道等等,一直到共同知识的某一个有限水平上使得迭代剔除严格劣的纯策略的过程停止。

因此,进化对策论中的基本问题是进化选择过程是否剔除掉所有的严格劣策略或者所有的迭代的严格劣纯策略。如果所有迭代的严格劣策略消失,那么这提供了在策略上相互作用的参与者行为假设的一种进化证明,就好像此假设是参与者他们作为理性人的共同知识。

Akin在1980年证明,在任何有限对称两人博弈中所有严格劣的纯策略沿着关于单种群复制动力学的任何一个内部解的轨迹都能消失。Samuelson和Zhang在1992年把这一结论推广到某一个两种群选择动力学的正收益子集合中的迭代的严格劣纯策略上。他们将这种情况称为聚集单调的(aggregatemonotonic)。

对长时期进化状态分析的辅助方法是研究种群状态的稳定性,也就是考察种群对于很小的扰动是如何反应的。Bomze教授在1986年曾证明,如果种群状态在单种群复制动力学中是弱的动态稳定的,那么此状态就是对自己的最佳反应,这里的状态被认为是采用混合策略的。经常运用的稳定性准则是李雅普诺夫稳定性,即状态x是李雅普诺夫稳定的,如果x的邻域B包含x的邻域A,使得在A中开始的解将永远保留在B中。不是李雅普诺夫稳定的状态称为不稳定的。因此,不仅进化稳定性的静态稳定性准则,而且复制动力学中的动态稳定性都蕴涵着纳什均衡的实施。这个结果能够推广到任何有限n人博弈中的任何弱的正收益选择动力学上。总之,对进化压力而言,以各种不同方式系统阐述的稳定性都需要纳什均衡来实施。然而,不是所有的纳什均衡在这个方面都是稳定的,因此,这些进化稳定性准则是纳什均衡概念的精炼。

另外,研究者在考察动力学进化稳定性时,把随机因素并入到进化过程的建模当中。特别,变异过程被认为是内在随机的一种情况。随机振动可以凭借稳定性分析方法来解释确定性选择动力学;一个稳定的种群状态对于种群的孤立的很小扰动而言是稳健的。然而,这种稳定分析几乎说不出一系列的小振动或者同时发生的小振动累计之后促成的大振动的稳健性。这样的一系列或者同时发生的连续不断的振动会使种群状态离开选择过程的吸引域。虽然这种大量涌现的小振动不可能是统计意义上的独立而稀少变异的事件,但这一可能性在基本方法上却改变了动力学进化过程的性质。代替历史依赖性(依赖于初始种群状态),此过程会成为遍历的(ergodic),也就是具有一种渐进分布,其中渐进分布是历史独立的(对于所有的初始种群状态都是相同的)。从而,导致人们现今研究的一个专题——随机动力学稳定性。这种研究路线的先驱者是Foster和Young(1990),随后是Fudenberg和Harris(1992),Young(1993)等等。注意到,进化稳定性准则没有解释种群是如何达到这种策略的。然而,一旦达到这种策略,则这样的策略对进化压力来说是稳健的。同时,人们发现,进化稳定性没有处理种群中具有两个或更多“变异”同时出现的情况。因而,它隐含地把变异当成稀少事件,以致于种群有时间在另一个变异出现之前响应这种状况。

虽然,进化稳定性准则是一个生物学上的概念,但是它为各种各样的人类行为提供一种有关的稳健性准则。这样,进化稳定性要求人类群体中企图采用可选择的策略的任何一个小团体不比已经采用“固有”策略的那些个体所构成的团体收益好。相反,采用固有策略的那些个体所构成的团体缺乏激励来改变他们的策略。但是,那些采用可选策略的小团体却受激励而具有转变固有策略的行为。在这种社会背景下,进化稳定策略被人们看成是传统习惯或者已经确立起来的行为规则。比如,社会风气、企业管理模式等都可以看为是某种人类群体的规则,而极个别的人群社会行为、习气的变化就会被认为是“变异”。当然,在这种背景下,如果那些极少数的人群或企业的收益比不变异的人群或企业高时,那么这些变异分子会生存得更好!反之,则被淘汰掉。

可惜的是,许多博弈没有进化稳定策略。于是,研究人员探讨各种比进化稳定性稍弱一些的形式,以及集值形式的进化稳定性概念等。此外,ESS概念不能推广到n人对策的情况上。在本质上,ESS要求强的纳什均衡来实施,也就是每一个策略对于策略组而言应是唯一的最佳反应。

(二)复制动力学。复制动力学是选择过程的显性模型,它说明种群是如何分配博弈中有联系的不同纯策略随时间而演化的。复制动力学的数学公式是由Taylor和Jonker于1978年在“进化稳定策略和对策动力学”一文中提出的。他们认为由随机配对的个体所构成的一个大种群执行有限对策的两人博弈,犹如进化稳定性的设置一样。然而,此处的个体仅仅采用纯策略。种群状态是指在纯策略上的一个分布x。这种状态在数学上与博弈中的混合策略是等价的。

如果博弈中的收益表示成生物学上的适合性,也就是后代的数目,同时每一个后代继续其父母的策略,因此,采用纯策略i的个体数目(在大的种群中)将以某一比率指数增长,而此等于对纯策略i的预期收益u(ei,x),当执行着表示种群中当前策略分布的混合策略x时,采用任何纯策略i的种群分布的增长率等于此策略的收益与种群中平均收益的差。后者,等同于混合策略x当与其自身博弈时的预期收益u(x,x)。这是一个单种群的对称两人博弈的复制动力学。

Xi=[u(ei,x)-u(x,x)]xi………………(2)

注意到,对当前种群状态x的最佳反应具有最高的增长率。第二最佳反应具有第二高的增长率,如此等等。然而,虽然更成功的纯策略比欠成功的纯策略增长得快,但是种群中的平均收益不必随时间而增长。产生这一原因的可能性是,如果一个个体由采用最佳策略的个体所代替,那么遇见这个新个体的成员会得到比较低的收益。例如,这正是囚徒困境博弈的情况。如果最初几乎所有个体采用“合作”,那么个体中将逐渐地转向“抵赖”,从而平均收益将下降。然而,如果博弈在两个人总是获得相等的收益意义上是一个双对称的,那么自然选择的基本规律将成立:种群中收益随时间而增长,即使没有必要成为全局最大的。例如,这就是合作博弈的情况,其中所有个体逐渐地转向到执行同一个纯策略上。复制动力学能够推广到n人博弈的情况上,这可以看成是来自于n种群、中的个体随机地以n类型配对,其中每一个参与者的地位状况正如纳什所给出的群体行为解释的那样。目前,存在两种形式的n种群复制动力学,其中一个是由Taylor在1979年提出的,另一个是由MaynardSmith在1982年给出的。

(三)学习模型与选择动力学

人们把学习模型分成三种类型,即基于信念的学习、强化学习以及模仿学习。最近的一些研究表明,复制动力学是由后面两类的某种模型所促成的。

1.强化学习模型

心理学上的有关个体学习文献的中心模型是所谓的强化模型,这是由Bush和Mosteller在1951年提出的。然而,它的思想可以追溯到Thorndikede的“导致过去好的选择在将来最有可能重复”。当然,人们注意到这里的选择隐含地作为概率上的一种说法。

Bush和Mosteller的强化学习模型及其他的推广形式,已经在一系列的人类主观执行博弈中得到运用。可惜,这些模型的通常数学性质,人们还知道得很少。然而,Borgers和Sarin在1997年发表的“通过强化和复制动力学的学习”文章把Cross的Bush—Mosteller学习模型的形式与Taylor的两种群复制动力学进行了理论上的对比研究。虽然这种学习过程在离散时间背景中是随机的、演化的,而复制动力学在连续时间背景中是确定的、演化的。他们证明,在适当地构造连续时间的界限下,他们的学习过程在有限时间区间内可通过复制动力学来*近。

更确切地讲,他们研究在多次博弈回合中(n=l,2,…),在一个固定的两人参与者采用混合策略对中有限两人博弈的情况。每一个参与者凭借由其所运用的纯策略来记录概率如下。如果参与者1(同样的考察参与者2)在博弈的n次回合中运用纯策略k,并且获得一个正的收益Vk(n),这里Vk(n)作为随机变量,它依赖于参与者2所做出的随机选择,那么参与者1对于运用这个策略的未来概率将越增加,其收益也就越高。参与者2以同样的方法记录其选择概率向量Y。所有收益均假设处于单位开区间上,不过,这里的收益不能解释成N—M(冯·诺依曼和摩根斯藤)效用。因此,一旦所用策略的概率是递增的,那么所有选择均是强化的。

从任何一个初始概率向量X(0)=x0和Y(0)=Y0开始,方程(3)定义出博弈的混合策略空间中的一个马尔可夫链{X(n),Y(n)}∞n=1。其中参数δ>0表示博弈的两次回合之间的时间:t=nδ是n次博弈回合中的“真实”时间。Borgers和Sarin得到这一过程的连续时间界限,通过设n∞和δ0以便有δn=t,在任何有限的“真实”时间上来估计价值。因此,博弈在越来越短的时间区间上执行,同时概率以相称的较小数值得以适应。他们证明,在这个界限内,此过程以状态(x(t),y(t))的形式出现在单位区间概率上,其中如果复制动力学的初始状态在时间0处以(x0,y0)开始,那么复制动力学会在时间t达到。在这个意义上,复制动力学在有限时间区间上近似于强化动力学(3)。

然而,这两类模型的渐进性质却十分不同。例如,为了在直观上理解这点,假设参与者1的收益既是恒定独立于他的策略选择又独立于参与者2的策略选择。设参与者1在强化动力学中的初始状态指派概率等于参与者1的所有可获得纯策略的概率。同样的,设复制动力学的初始状态指派种群的各部分采用策略的概率等于所有可获得纯策略的概率。显然,复制动力学的解是一个常量:所有种群的各部分分得的收益永远相等。然而,强化动力学的实现会容易随时间而收敛到参与者1可获得的任何一个纯策略上。由于在博弈的第一个回合中选用策略的概率将高于在下一次博弈回合中所选用的策略概率,所以强化动力学的性质更有可能把参与者1“锁定”到他的任何一个纯策略上。Borgers和Sarin证明,任何有限两人博弈的强化动力学以概率1收敛到一个纯策略组合上,而不像复制动力学那样。

2.模仿学习模型

博弈论学者Gale,Binmore和Samuelon在1995年提出一个所有个体参与者都采用纯策略的大群体,但是有限博弈的社会学习的简单模型。每一个参与者在博弈中都赢得一个渴望水平的收益。在离散时间0,δ,2δ,…上,任意从群体中抽取个体δ部分,把其当前收益与他们的渴望水平收益相比较,其中δ>0是很小的数。如果个体实现的收益低于其生存水平收益,那么该个体就会随机地模仿已抽取的个体,在相同的参与者群体中,所有其他个体都具有相同的概率被抽取。由此可见,如果渴望水平收益具有均匀分布(某一个区间上包含所有可能的收益值),那么模仿的概率对于个体的当前策略而言,在预期收益上是线性递减的。对于很小的δ,他们证明这个过程可以由有限时间区间上的复制动力学来*近。

人们把个体策略的适应过程作为连续时间中的一个随机过程。假设在有限群体中每一个个体时常得到一个冲动,使其改变纯策略。如果这些冲动是依照i.i.d.的Poisson分布,那么同时发生的概率是零,而且总的过程也是一个Poisson过程。此外,总过程的密度刚好是各个过程密度的和。如果群体是很大的,那么人们利用预期值给出的确定流来近似这个总过程。

Bjornestedt和Weibull在1996年研究了一系列这种模型,其中改变的个体在其博弈的群体中模仿其他的个体,并证明许多正收益的选择动力学可以被人们推导出来,包括复制动力学的三种形式。特别,如果个体改变比率对其策略而言预期收益是线性递减的,那么每一个纯策略Poisson过程的密度是与其个体总数大小成比例,同时比例因素将是其预期收益递减的。如果每一个改变的个体选择其未来的策略是通过在其博弈中随机地模仿抽取的个体,那么其作为结果的流*近也是一个复制动力学。

Schlag在1997年分析当个体经常以参与者的同样地位去模仿其他参与者个体时,个体应该选择什么样的模仿规则的问题,然而参与者的同样地位却受制于信息和记忆的约束。他发现,如果个体想要学习规则是在所有平稳环境中收益递增,那么此个体应该满足:(1)当改变策略时,总是通过模仿来进行;(2)永远不向收益实现比其所拥有收益低的那些个体模仿;(3)向收益实现比其拥有收益高的那些个体模仿。

这种模型被各种各样不同的环境所发展。在有限两人博弈中,Schlag假设在随机地来自于两个相等大小的有限群体的个体之间两两配对,每一个有其自己的地位。个体总是执行纯策略。在每一个收益实现之后,每一个个体都要随机地与其他个体所处的群体进行抽样调查,并且比较两种收益的实现。行为规则是一种函数关系,即把收益实现和所用策略对应到博弈中个体地位上可获得的纯策略集合上的分布,为的是采用新的策略。换句话说,允许使用个体的唯一资料是这种收益实现和纯策略对。特别,从较早的博弈回合中实现收益被忽略。此外,假设个体在所有博弈中运用相同的行为规则,具有相同数目的纯策略可选择;也就是,个体不需要知晓他们执行什么样的博弈,他们知道所使用的纯策略数目就足够了。

在任何这样的博弈中,导致预期收益弱递增的以及在对手种群中对于任何固定策略分布的行为规则,称为改进。本文中的重要结果是对于所有这样规则的刻画。改进规则的一个特征是他们是模仿的:个体坚持其初始的策略或者采用抽样的个体策略;但是不会转向第三个的策略。

行为规则称为是占优的改进规则,如果在某一个博弈中不存在改进规则产生比较高的预期收益改进比例,而且在对手种群中的某一个策略分布上。Schlag证明,某一个行为规则为占优的改进规则,其具有上面给出的性质(1)(2)(3)。这个比例模仿规则是其自己的一个改进规则,而且可以证明它确有一些其他吸引人的性质。Schlag证明,Taylor两种群复制动力学的离散时间形式可以*近在任何给定有限时间范围内导出的一个随机过程,只要种群充分的大就行。

(四)进化对策论中的一些结论

本文集中探讨关于有限n人博弈的显性动力学种群模型方向的介绍,其中个体执行纯策略。首先探讨确定性选择动力学,然后介绍随机进化模型,其中把随机变异过程与确定性选择过程或者随机选择过程结合起来。

研究确定性动力学项目性质的一种直接方法是选取一个初始的种群状态,并且稍后可以计算。然后,人们应该记住让初始的所有纯策略在种群中出现,由于初始的已亡策略将在选择过程中仍保持已亡的状态。这种解的轨迹称为内部的。解的轨迹随时间流逝而安定下来,就称为收敛的。反之,则称为发散的。

如果种群状态是收敛的,那么什么是长时期限制状态的本质呢?可以证明,在任何一种弱的正收益选择动力学中,沿着任何收敛的内部轨迹,限制状态必将构建纳什均衡,研究人员发现,种群执行某种纳什均衡或者在渐进意义上的纳什均衡。Nachbar在1990年第一个证明出单种群复制动力学的这个结果。事实上,如果选择过程遇见弱的正收益的相对温和的条件,且如果汇总的行为随时间而安定下来,那么在长时期种群状态中的个体就好像他们预期一个特殊的纳什均衡对此执行着一个最佳反应,这点颇像是纳什所声称的“群体解释”。

如果对于弱的正收益选择动力学的内部解随时间而收敛,那么我们看到幸存下来的策略在作为结果的混合策略组合的最佳反应的意义上是理性的。此处的问题是,如果解的轨迹不收敛,那么会发生什么情况吗?当长时期中没有均衡达成时,我们产生的问题是,执行是否为理性的。

非合作博弈论中基本的理性假设是参与者不采用作为严格的劣(strictlydominated)纯策略。这个假设要求不知道其他参与者的偏好或者行为。一个更严格的理性一--附有知识的---假设是参与者不采用作为迭代的严格的劣策略。除了回避严格的劣的策略之外,这个假定要求所有参与者相互知道彼此的收益,而这些就是他们知道等等,一直到共同知识的某一个有限水平上使得迭代剔除严格劣的纯策略的过程停止。

因此,进化对策论中的基本问题是进化选择过程是否剔除掉所有的严格劣策略或者所有的迭代的严格劣纯策略。如果所有迭代的严格劣策略消失,那么这提供了在策略上相互作用的参与者行为假设的一种进化证明,就好像此假设是参与者他们作为理性人的共同知识。

Akin在1980年证明,在任何有限对称两人博弈中所有严格劣的纯策略沿着关于单种群复制动力学的任何一个内部解的轨迹都能消失。Samuelson和Zhang在1992年把这一结论推广到某一个两种群选择动力学的正收益子集合中的迭代的严格劣纯策略上。他们将这种情况称为聚集单调的(aggregatemonotonic)。

对长时期进化状态分析的辅助方法是研究种群状态的稳定性,也就是考察种群对于很小的扰动是如何反应的。Bomze教授在1986年曾证明,如果种群状态在单种群复制动力学中是弱的动态稳定的,那么此状态就是对自己的最佳反应,这里的状态被认为是采用混合策略的。经常运用的稳定性准则是李雅普诺夫稳定性,即状态x是李雅普诺夫稳定的,如果x的邻域B包含x的邻域A,使得在A中开始的解将永远保留在B中。不是李雅普诺夫稳定的状态称为不稳定的。因此,不仅进化稳定性的静态稳定性准则,而且复制动力学中的动态稳定性都蕴涵着纳什均衡的实施。这个结果能够推广到任何有限n人博弈中的任何弱的正收益选择动力学上。总之,对进化压力而言,以各种不同方式系统阐述的稳定性都需要纳什均衡来实施。然而,不是所有的纳什均衡在这个方面都是稳定的,因此,这些进化稳定性准则是纳什均衡概念的精炼。

另外,研究者在考察动力学进化稳定性时,把随机因素并入到进化过程的建模当中。特别,变异过程被认为是内在随机的一种情况。随机振动可以凭借稳定性分析方法来解释确定性选择动力学;一个稳定的种群状态对于种群的孤立的很小扰动而言是稳健的。然而,这种稳定分析几乎说不出一系列的小振动或者同时发生的小振动累计之后促成的大振动的稳健性。这样的一系列或者同时发生的连续不断的振动会使种群状态离开选择过程的吸引域。虽然这种大量涌现的小振动不可能是统计意义上的独立而稀少变异的事件,但这一可能性在基本方法上却改变了动力学进化过程的性质。代替历史依赖性(依赖于初始种群状态),此过程会成为遍历的(ergodic),也就是具有一种渐进分布,其中渐进分布是历史独立的(对于所有的初始种群状态都是相同的)。从而,导致人们现今研究的一个专题——随机动力学稳定性。这种研究路线的先驱者是Foster和Young(1990),随后是Fudenberg和Harris(1992),Young(1993)等等。四、进化对策论在经济学中的应用

进化对策论的产生、发展在本质上就是起因于对策论中关于理人的假设与经济应用中行为人“试验——失误”(即试错法)学习过程相偏离的事实而引发的。从上述的阐述中,我们可以看到,进化对策论在经济学里的应用前景是十分广阔的和吸引人的。

最近,Routledge探讨了金融市场上个体行为人是如何通过适应性或者进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过对来自于模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Routledge运用Grossman和Stiglitz的1980年发表的经济模型的形式。Grossman和Stiglitz(GS)模型提供了考察适应学习过程的一种良好的框架,因为它是获得内生信息的标准模型,这点已经被后来的其他许多关于学习方面的模型都是基于GS而提出的事实所证明。

如果假设交易者能够观察到他们自己的适应度和其他行为人的行为,那么模仿是如何发生的许多特殊细节就显得不重要了。Routledge的研究结果表明:首先,作为单调选择动力学的适应学习会促成GS均衡;其次,由单凋适应学习驱使的模仿的稳健性可从随机实验中来获得噪声(noise)来研究。他发现,适应学习是缺少稳健性的。特别,他运用Binmore和Samuelson(1999)的技术来对模仿和经验建模。为了使带有漂移(drift)的适应学习产生GS理性预期均衡,必要的条件是在风险资产供给中的噪声与学习过程中的经验水平有很大的关系。

五、问题与前景

我们注意到,进化过程并不总是导致最优性、均衡或者社会有效性。通过目前已取得的一些成果,我们认为下面的一些方向或许是值得学者进一步探讨与研究的:

(1)引进机构,分析市场选择机制。

(2)探讨博弈中学习规则的进化稳定性。结果,这就会导致拥有适度认知能力的个体的模型。

(3)进一步探讨扩展形式博弈中的进化过程。

(4)对*近理论方面的进一步探讨。我们需要更多地了解确定性模型和随机性模型之间的联系与关系。

(5)探索、研究结构化的稳健预测。显然,某种博弈的子结构,诸如在最佳反应和弱最佳反应的条件下所促成的纯策略集合,是进化过程的稳健吸引子(robustattractor)等。

本文概括地阐述了进化对策论中的理论内容和一些模型,特别是博弈中有关学习模型的新近发展。通过上面的分析,我们发现,进化对策论的发展动力来自于与其他社会学科的交叉融合,吸收其他社会科学中的有益知识。为了把有关的选择过程、学习过程以及变异过程的类别变窄,我们需要更多地知晓个体、团体、组织、厂商以及整个社会是如何随时间而适应和学习的。这里的部分内容正是实验对策论中所要探讨的,同时这也是我们应向其他社会科学学习的领域。

参考文献:

1.王忠玉:《1994年度诺贝尔经济学奖与对策论》,载《科学(ScientificAmerican中文版)》,1996(7),3—5页。

2.王忠玉:《金融市场从众行为的数理模型》,载《中国管理科学》,2000(2),50~55页。

3.Binmore,K.,1990.EssaysontheFoundationsofGameTheory,BasilBlackwell.

4.Binmore,K.,Samuelson,L.andVaughan,R.,1995.MusicalChairs:ModellingNoisyEvolution.GameandEconomicBehavior11,1--35.

5.Binmore,K.andSamuelson,L.,1999.EvolutionaryDriftandEquilibriumSelection.ReviewofEconomicStudies,66,363--393.

6.Blume,L.andEasleyD,1992.EvolutionandMarketBehavior.JournalofEconomicTheory58,9-45.

7.BlumeL.andEasley,D.,1990.EvolutionandLearninginCompetitiveMarkets,inKirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).

8.Bomze,1.andPotscher,B.,1989.GameTheoreticalFoundationsofEvolutionaryStability.SpringerVerlag(Berlin).

9.Bomze,I.andWeibull,J.,1996.DoesNeutralStabilityImplyLyapunovStability.9Gameand

EconomicBehavior11,173--192.

10.Bryan,R.Routledge,1999.AdaptiveLearninginFinancialMarkets.TheReviewofFinancial

Studies12,1165--1202.

11.Canning,D.,1990.LearningandSocialEquilibriuminLargePopulations,in

Kirman,A.andSalmon,M.(eds.),LearningandRationalityinEconomics,Blackwell(Oxford).

12.Cressman,R.,1992.TheStabilityConceptofEvolutionaryGameTheory,SpringerVerlag(Berlin).

13.VanDammeE.,1987.StabilityandPerfectionofNashEquilibria,SpringerVerlag(Berlin).

14.Dekel,E.andScotchmer,S.,1992.ontheEvolutionofOptimalBehavior.Journalof

EaonomicTheory57,392--406.

15.Fudenberg,D.andLevine,D.,1993.Steady-stateLearningandNashEquilibrium,Econometrica61,523-574.

16.Fudenberg,D.andLevine,D.,1997.TheTheoryofLearninginGames.MITPress.

17.Haesanyi,J.andSelten,R.,1988.AGeneralTheoryofEquilibriumSelectioninGame,MITPress.

18.Kandori,M.,Mailath,G.andRob,R.,1993.Learning,Mutation,andLong-runEquilibriainGame,Econometrica61,29--56.

19.Nelson,R.andWinter,S.1982.AnEvolutionaryTheoryofEconomicChange.HarvardUniversityPress(CambridgeMA).

20.Robson,J.A.2001.TheBiologicalBasisofEconomicBehavior.JournalofEconomicLiterature,Vol.ⅩⅩⅩⅨ(March2001),11--33.

21.Samuelson,L.andZhang,J.,1992.EvolutionaryStabilityinAsymmetricGames.JournalofEconomicTheory,57,363--391.

篇9

虽然利益相关者对企业的共同治理已成为现代企业制度发展的普遍趋势,但这并不等于世界各国的企业制度都必然会趋向于同一种模式。这是因为,企业制度是“嵌入”[1]在制度环境当中的,企业制度变迁不仅遵循了效率追求的逻辑,同时也是制度环境选择的结果。这就是说在制度环境的异质性假设前提下,企业制度必然也是异质性的。据此,可以对中国制度环境条件下的独特企业共同治理机制做某些前瞻性的思考。

一、企业利益相关者共同治理的一般原理

历史地考察发现,在企业治理的角度,企业制度安排经历了一个:

单边治理双边治理三边治理利益相关者共同治理

的拓展过程。(1)所谓单边治理,主要是就古典企业所遵循的物质资本逻辑而言,个人业主制和合伙制企业是其典型代表,企业契约中物质资本所有者对于雇佣工人的绝对优势和支配地位是其显著特征。(2)所谓双边治理,是就企业作为物质资本与(异质性)人力资本的合约性质而言。人力资本职能开始从古典企业家当中分离出来而开始成为企业的重要制度性要素是其显著特征。(3)所谓三边治理,主要是就企业“员工参与”亦即“同质性”人力资本拥有者参与企业的治理以及剩余的分享而言。“员工参与”的逻辑起点,是企业员工对其自身人力资本的产权;“员工参与”的现实状况,取决于企业契约中其人力资本所决定的谈判实力。三边治理的显著特征,是企业员工、经理人员、股东之间的博弈制衡关系。(4)所谓共同治理,是就企业利益相关者共同参与企业的治理而言。共同治理已成为现代世界各国企业制度演进的共同趋势。

企业不同制度形式之间并非全然的纵向替代关系,也大量并存于现代经济社会当中。结果,在企业治理结构的争论中,形成了以物质资本逻辑为核心的委托理论和以利益相关者博弈均衡逻辑为核心的共同治理理论两种主要观点。一般来说,在现代社会,人力资本构成企业的制度性要素已成为不争的事实,纯粹的物质资本逻辑已经不能解释现代企业的治理结构。另外,事实上如科斯所说的,影响他人损益的行为也可视为生产要素和权利[2],结果凡是能给企业带来损益或其行为受企业行为直接影响的行为人均有可能参与或影响企业契约、企业所有权的分配进而企业制度的设定,也就是说成为了企业的利益相关者。因此,单从理论逻辑上推断,企业制度就是在企业所有利益相关者之间对企业所有权(剩余索取权和剩余控制权)的合理配置;进而,企业治理也就应当是利益相关者对企业的共同治理。当然,企业利益相关者也有“潜在”与“真实”之分[3],在一般情况下,对企业投入了专用性资产的产权主体可视为企业的直接利益相关者,而其他利益相关者角色如顾客、其他企业等则具有一定的派生性质,往往处于潜在状态。

现代企业理论把企业看作为一系列契约的联接,其内在遵循的是博弈均衡的原则。这就是说:企业制度安排的具体情况取决于企业利益相关者之间的谈判实力对比格局;企业的技术性特征、以及企业生产要素各自的特性是决定利益相关者谈判实力的主要因素。在此基础上,从理论上说设计企业利益相关者共同治理机制必须遵循同权原则、均占原则、市场原则和边际调整原则。[4]所谓同权原则,是说企业各利益相关者均拥有企业的剩余控制权;所谓均占原则,是说企业各利益相关者也都拥有企业的剩余索取权;所谓市场原则,是说企业制度的达成应该坚持通过谈判达成不应有不合理的人为干扰;所谓边际调整原则,则是就企业的再谈判机制和企业所有权的“状态依存性”而言。

二、制度环境变量的引入及其对企业共同治理机制的影响

“共同治理”并不等于按照剩余索取权和剩余控制权对等的原则在企业利益相关者之间对企业产权进行“平等”的分配,甚至也不等于“所有”利益相关者的企业治理权利都可以在现实当中得到实现。这是因为企业的技术特征以及生产要素的特性决定了企业利益相关者各自具有不同的谈判实力。但是,考察各国的企业制度发现,即使企业在技术特征和生产要素特性等方面几乎完全一致的情况下,企业制度之间仍可能存在显著的差异。西方发达国家公司存在的两种不同的公司治理模式英美模式和大陆模式就是一个例证。这种现象如何解释?

有学者对美国、日本等国的公司治理模式进行了历史比较制度分析[5]发现,企业制度是效率追求和制度适应的统一。[6]这就是说,企业制度不仅仅是在效率追求逻辑下对自身内在因素的调整,而且还要同外在的制度环境尽量达成高度的“契合”;或者说企业制度不仅是(狭义)效率原则的体现,而且也是制度环境选择的结果。由此可以推论,在对企业制度进行价值判断的问题上应该坚持“存在即合理”原则;制度环境必然会给其中的企业制度打上自己独特的烙印,而任何一种企业制度模式也只有在相应制度环境下才有意义而不可能具有普适性。由于技术特征和生产要素特性对企业制度的影响一般不以国别而不同,并且经济全球化条件下技术和生产要素的高度流动性已经大大减弱了其在国家之间造成企业制度显著不同的可能,因此可以说不同国家制度环境的“异质性”是形成多样化企业制度模式的真正根源。可见,有必要拓宽视野引入外在制度环境变量的因素,以使我们对企业制度的研究进而对企业共同治理机制的设计更加趋近真实。

尽管制度环境的异质性是企业制度多样化的真正根源,但现代企业理论作为西方企业理论所本来固有的“一维性”色彩,以及众多国家迷惑于西方发达国家企业经济绩效的眩目光环而对其制度安排的盲目追随,却严重影响了经济理论对制度环境与企业制度安排之间的契合关系以及异质性制度环境条件下企业制度不同模式的关注和考察。经济学领域的这一缺陷,被新经济社会学(TheNewSociologyofEconomicLife)敏锐的感知并捕捉,并运用“嵌入性”和“社会建构”理论对其进行了修正[7]。

新经济社会学认为,从宏观方面看,经济组织都是“嵌入”在社会网络之中的,经济制度本质上是“社会建构”的;从微观方面看,现实的人都是带有历史和社会属性的经济人。可见,如果说传统经济学主要遵循了个体主义的方法论的话,那么新经济社会学则依据现实整合了整体主义的方法和个体主义的方法。新经济社会学的理论使企业研究更加逼近现实。

总体上,新经济社会学和经济学的结合不仅是必要的,而且是可能的。新经济社会学首先提供了一个宏观制度背景的维度,这正是对经济学自身所固有一维色彩的扬弃或有益补充;其次,修正经济学的理性选择理论,整合经济学的“经济理性”和新经济社会学的“社会理性”,以“效用最大化”替代狭隘的“利益最大化”,实现人的选择集或效用函数的多元化,就可以对现实人的选择过程展开微观分析;再次,在新制度经济学和博弈论的平台上,在对经济生活的分析中把社会性变量纳入进去,就可以对现实的多样化制度安排作出合理解释。就是说,与传统经济学出于个体主义的方法论和对经济人的单维度界定而对制度创新的:

单维度经济人唯一的博弈均衡最优制度安排

的特定路径不同,现实经济组织制度创新的路径事实上是:

多样化制度环境不同经济人行为特征多重均衡样式多样化次优制度安排

这就是说,给定不同社会制度演进路径和制度环境的异质性区别,经济主体之间交易的博弈可能会存在多个均衡点或者多重的均衡样式,从而形成各自不同的制度安排,并且虽然不一定臻至那种理想的最优效率的境界,但在相应的制度环境下也都是最具有“适应性效率”[8]的,也就是说特定情境下“次优选择”即是“最优选择”。

对于西方社会而言,由于其制度变迁的自然演进性质,也由于其许多国家都具有相同或类似的文化渊源,其制度创新过程一般不涉及“异质性”制度环境之间的碰撞和摩擦问题。因此,虽然事实上其制度安排仅仅代表了特定制度环境下的特定制度均衡样式,其企业制度也仅仅意味着“企业制度特殊”,但在其发达经济的眩目光环之下,由其自身“致命的自负”以及后发国家的盲目崇拜,却被不恰当地赋予了普适性和一般性的色彩。而对于许多后发转轨国家,一方面其制度演进路径就与西方社会存在很大的不同,因此其企业制度建设必然是一种“过程”的创新;另一方面更重要的,是其制度环境与西方社会存在巨大的差别,与此适应,企业制度创新也必然是一种“目标”的创新,也就是说只可能有一种与特定制度环境高度契合的企业制度形式是最有效的,而决不能把西方的某些经验和做法不加分析地拿来为我所用。事实上,虽然后发国家企业制度建设对西方经验的借鉴不可避免,但是引进来的制度安排要想真正有效发挥作用,其一般也要经过一个特定的制度创新过程:首先,附着其上的那些与西方制度环境相适应的制度特征将被逐步剥离;其次,引进制度也必然会逐步打上本国特定制度环境的烙印从而逐步实现企业制度安排的“适应性效率”。

具体来说,不同企业制度模式的宏观制度根源,主要是通过对企业内部利益相关者博弈格局的影响来体现出来的。这也就是说,在不同的制度环境下,企业的真实利益相关者及其谈判实力和博弈均衡状况会有显著的不同,并进而体现在企业契约和企业制度安排当中。一个典型的案例,是在东南亚一带普遍存在着的家族制企业。东南亚各国或地区的家族制企业与一般所说的家族制企业并不完全相同:后者主要体现了一种纯粹的交易成本节约的逻辑,世界任何地方的初创企业都可能会采用;而前者则主要是一个文化地理上的概念,其后潜藏着特殊文化背景的深层根源。这就是说,在家文化传统根深蒂固的东南亚一带,经济行为人所拥有的家族、血缘关系以及忠诚、信义、情感这些特殊“人力资本”的“质”和“量”,是判定其是否企业真实利益相关者的重要标准,也是决定其在企业利益相关者博弈格局中地位和作用的重要因素,并体现于企业契约、企业制度以及企业治理结构的方方面面当中。这一逻辑也可以对其他的企业制度模式作出合理的解释。

三、中国制度背景下企业共同治理机制的若干特征

考虑到中国基本经济制度的稳定性和文化传统的深远历史渊源,中国企业的共同治理机制可能会具有如下特征:

第一,社会主义的和谐竞争理念与企业利益相关者“共赢”的利益格局

同一般而言制度环境“决定”企业制度特殊的“消极”含义相比,社会主义条件下中国特色的企业制度建设应当内涵一种特定的“积极”意蕴。就是说,居于后发转轨国家的位置,在现代企业制度的建设过程中,我们应当也可以用社会主义的价值追求和政府主动的制度创新,来尽量避免马克思所严厉批判过的,那种资本主义发展初期曾严重存在的种种紧张、矛盾、冲突所付出的巨额交易成本甚至由此造成的灾难,比如说古典企业当中劳资双方之间的种种斗争现象,而应当反过来主动地倡导一种和谐的理念,通过相关的制度设置,在中国现代企业当中形成一种各利益相关者共赢的利益格局。这是因为,在传统经济学那里,由于每个人都追求自己的私利,因此“每个人都妨碍别人利益的实现,这种一切人反对一切人的冲突所造成的结果,不是普遍的肯定,而是普遍的否定”[9]。这种自斯密以来逐渐形成的“竞争”的经济学体系,在较大程度上包含着霍布斯所谓“个人永远处于所有人反对所有人的战争之中”的悲观主义理念。而事实上,不仅在现实生活中人们之间的“合作”同“竞争”同样的广泛,而且由于合作是人们之间展开可持续性竞争的普遍基本框架,“合作”更加符合人类的终极价值追求。[10]

第二,我国基本经济制度与企业治理的“劳动者参与”

我国的基本经济制度对我国企业制度将会有非常重要的影响。虽然我国社会主义尚处于初级阶段,基本经济制度还不能达到经典作家所设想的个人在全社会范围内实现对生产条件的社会的直接的结合,劳动还是人谋生的手段,而不是人生存的第一需要,但是,毕竟我国的社会性质是社会主义的,在生产力还不够发达的现阶段,企业制度即使不能臻至劳动者主导的理想境界,也必然会因由公有制主导的基本经济制度,在相当程度上关心劳动者的诉求、关照劳动者的命运、关注劳动者的地位,从而促进劳动者对企业治理的参与,形成“劳动者参与”的鲜明企业制度特色。

第三,我国文化传统与企业制度的家族色彩

家文化体现了中国文化传统的突出特征,几千年文化传统的社会心理积淀作为一种非正式制度环境对嵌入其中的经济行为人进而企业制度都产生着重大影响。一方面,在不同制度框架下活动着的经济人其选择集是不同,对于侵家文化传统几千年的中国人来说其选择集中一个至关重要的内容就是信任、忠诚、情义,或者说是家族范围内部的利他主义世界观,这是一种内化了的精神效用;另一方面,嵌入家文化非正式制度之中的企业,其经济行为人所拥有的家族关系,以及所拥有的信任、忠诚、情义这样一种特殊人力资本的质和量,是企业据以判定自身真实利益相关者的一条重要标准,也是一种据以分配物质资源、经济利益和企业剩余的重要标准,由此成为影响企业利益相关者谈判格局和博弈均衡格局的决定性因素,使企业治理打上鲜明的家族烙印。显然,这种意义上的家族企业和一般所理解的在企业发展初期阶段为了节约交易成本而采取的家族式管理具有本质的不同,也更具有旺盛的生命力。不可否认,家族式企业治理方式在成功地避免企业成员的机会主义行为、节约交易成本、提高企业绩效等方面的同时,也存在不少内生性的制度缺陷。但是,这只是说明我们需要根据新的情况对既有的家族制度进行创新以提高其“适应性”,而决不意味着我们对家族式企业制度模式的有效性视而不见甚至否定。我们认为,从总体上讲,在正处于新旧制度转型期的中国社会,在由于制度真空因而以一种异化了的方式引进西方那种个人主义的价值观结果形成社会普遍信用缺失的情况下,家族式企业制度模式可能更主要地发挥着一种积极的作用。

注释:

①⑦参见:张其仔,《新经济社会学》,中国社会科学出版社2001年版。

②科斯:《社会成本问题》,载《论生产的制度结构》中译本,上海三联书店,1994年版,p191。

③杨瑞龙,《企业的利益相关者理论及其应用》,经济科学出版社2000年版,p132。

④参见:《企业利益相关者共同治理机制设计》,张立君,载《中南财经政法大学学报》,2002年第三期。

⑤参见:王东,《美国日本企业的历史比较制度分析》,载《经济评论》2002年第二期。

⑥参见:孙早,《现代公司治理结构:经济效率与制度适应的统一》,载《湖南社会科学》2000年第六期。

⑧“适应性效率”是说,当某一种制度能在不同的环境下得以生存和发展,那么该制度就是有效率的;假定生产费用不变,一个具有适应性能力的制度从投入来看就是最能节约交易费用的制度。由于一种有效率的行为都是在一定的制度环境下作出的;同一种制度安排在不同的制度环境下会有不同的效率表现;制度安排只有“适应”制度环境才能最大限度地节约交易成本,因此动态地看,制度安排只有同制度环境高度契合才有效率。本文对制度的“适应性效率”作此理解。

篇10

关键词:道德风险; 农产品质量安全; 结构方程; 渠道权利

中图分类号:F322 文献标识码:A 文章编号:1003-3890(2013)12-0005-06

一、引言

俗话说“民以食为天,食以安为先”。食品是我们生存和发展的基础,食品安全问题不仅影响人的身体健康,更间接地影响整个社会经济及政治秩序的稳定,同时也关系着国家的形象与尊严。然而由于种种原因,我国食品安全状况仍不容乐观。尤其是近年来,我国农产品质量安全问题呈现直线上升趋势。因此,深入研究农产品市场问题,切实有效保障我国农产品质量安全就成为关系到广大人民群众身体健康和生命安全,关系到经济健康发展和社会稳定,紧迫而又无法规避的重要课题。然而,解决农产品质量安全问题,既不能仅诉诸于制度,通过加强立法与日常监督管理以及惩戒措施来实现,也不能完全交给市场(杨瑞龙,聂辉华,2006)[1]。正是由于农产品市场具有信息不对称、外部性、公共物品等属性特征,农产品市场存在着市场机制失灵的可能性。王可山(2012)也认为,农产品质量安全问题的根源在于契约的不完全性。而契约的不完全性,一是由于信息不完全,部分农产品质量信息存在不可预测性或不可描述性;二是由于信息不对称,部分农产品质量信息存在不可观测性或不可鉴别性[2]。不完全信息会导致道德风险,一方面农产品生产者刻意降低质量,甚至以次充好、制假贩假;另一方面消费者因无法判断农产品质量,进而高质量产品的生产者或被逐出市场,或被迫改为生产低质量产品(聂辉华,2008)[3]。因此,深入研究农产品生产和流通环节中因市场失灵而出现的道德风险及其规避问题,就成为利用市场机制自身来解决农产品质量问题的重要方面。然而,目前国内外现有农产品质量安全问题研究多数忽略了道德风险在农产品质量安全中的作用,明显缺乏农产品生产流通市场农户风险行为与市场失灵内在机理研究。这种状况不仅不利于农产品质量安全问题的进一步研究,而且也使得那些基于风险视角揭示农产品质量安全问题的精辟论述,不无遗憾地仅从非市场的角度去寻求解决问题的举措,而失去了利用市场机制自身来解决市场问题的根本手段。

二、道德风险的理论分析与基本设想:制度视角

本部分从制度供给、示范效应以及实施主体自我效用考量三方面来探讨可能导致农产品质量安全道德风险的因素。新制度经济学的研究表明,制度是经济理论中除传统的要素、技术和偏好这三大理论基石外的第四大基石,制度至关重要(卢现祥,2011)[4]。很多时候,制度是影响某一经济现象出现的关键因素。道德风险从制度视角可以理解成行为主体在现实制度所赋予的制约条件中活动的一种结果。因而,我们探讨道德风险的成因就不得不从制度的视角来考虑制度因素对道德风险产生的影响。

很多研究表明我国多数经济问题的出现根源于我国制度供给的缺失。制度供给缺失包括核心制度的缺失和一般配套制度的缺失。核心制度的缺失会导致陷入制度供给陷阱(邓大才,2000)[5]。这意味着如果现有的制度中缺少核心制度,即使提供再多的有利制度也无济于事,制度的边际效率是不变或者下降的,于是就会出现政策失灵的现象。此外,制度供给中一般配套制度的缺失则可能造成制度效率的损失,即由于缺失配套制度而使得一项制度难以实现本应达到的效果。这里的配套制度,应该包括两层涵义(以农产品质量安全管理制度为例):一层是指与农产品质量安全管理体系同一等级的用于辅助农产品质量安全管理顺利实现的其他方面的制度安排;另外一层涵义是指对于中央政府出台的农产品质量安全管理体系,地方政府为能更好地贯彻执行,结合其地方具体情况,相应出台的配套政策。显然,对于农产品质量安全的配套制度安排中,后者的供给协调程度对制度实施的影响更为重要。然而,由于中央与地方财权与事权的非对称、不平衡导致地方政府为了保护地方经济发展,维护地区利益而在配套制度的设立中存在倾向短期的眼前经济利益,而“有意”或“无意”地忽视配套制度与中央制度的协调度,这就导致道德风险产生的可能性提高。

基于以上分析,提出假设1:

H1:制度供给与道德风险具有相关性。

制度供给短缺来源于制度的稀缺性。所谓制度的稀缺性,是指相对于人们行为的差异性、多样性和发散性而言,作为规范人们行为的制度安排总是不足的,不可能对每种行为都制定相应的制度安排加以约束,总有一些行为没有制度安排予以规范。或者说,由于制度被认为是关于人们相互行为的知识载体,制度的稀缺性也可以理解为相对于人们对这类信息的需要而言,制度所能传递的信息总是不足的。于是在制度稀缺的情况下,人们的行为选择往往受到周围他人(主要是那些与之从事相近活动的人)的行为的影响,这就是示范效应。一旦有人出现道德失范行为,由于示范效应的存在,往往使得道德失范风险的进一步扩大成为可能。尤其是对于一些新技术、新工艺和新资源的使用,制度供给存在“时滞”问题,这就意味着一个新生事物从产生到建立起针对它的制度规范,存在着一个制度空白期,这就使得道德风险发生的可能性加大。

基于以上分析,提出假设2:

H2:示范效应与道德风险具有相关性。

制度由三个基本部分构成:正式约束、非正式约束及其实施机制。一个制度形成之后所面临的就是实施机制。从制度功能实现角度来看,只有规则而没有执行机制,制度就是不完整的。而实施是由人执行的,因而他们自身的效用函数将影响制度执行的结果。就农产品质量安全监管来说,是消费者委托政府来执行实施职能的。于是,消费者与政府之间形成委托-关系。政府能否有效行使职能主要受其自我效用函数的影响。实施者有着自己的利益考虑,若是制度的实施与其自身利益冲突,必然导致实施主体的实施懈怠。所以制度能否有效发挥其应有效应,与实施者的自我效用考虑直接相关。另外,正式制度的制定和执行不仅需要建立一套专门的组织机构,而且需要通过一定的工作程序,这些都要耗费大量的资源,运行成本很高。若是政府由于资金等因素的困难而未能正常地执行实施职能,如不能建立先进的检测体系,不能培养和雇佣足够的业务人员,道德风险产生的可能性就增大了。同时,考虑到不同知识背景与不同个性特征都会影响到个体采取不同的经济活动方式(郝大江,2011)[6]。

基于以上分析,进一步提出假设3:

H3:实施主体自我效用考量与道德风险具有相关性。

三、道德风险的理论分析与基本设想:行为主体视角

本部分从农产品流通市场中的主体间信息、行为以及渠道权力的视角探讨农产品质量安全道德风险问题。农产品生产流通主体主要归结为农产品生产者、中介组织(主要包括各种农产品的集散和物流组织)与农产品需求者三类。本部分将分析农产品流通环节中农户的理性选择及各主体之间的信息不对称性,并将消费者纳入渠道权力的研究范围,将传统的二元分析范式扩展为网络分析,进而剖析可能导致流通主体道德风险的因素。

从流通领域的起点出发,农户行为的决策机制将首先被研究。对农户经济行为的研究,西方经济学中主要存在两个流派。一是以恰亚诺夫为代表的组织生产流派,其主要观点为:农民的经济是一种道德经济,导致农民这一行为特征的是社会压力,即个人不追求欲望的极大满足,而是担心越轨而受到社会的惩罚,农户以自身的需求和劳动辛苦程度决定自己的劳动投入程度。而另一流派则是以西奥金·舒尔茨为代表的理流派。该流派认为:在市场机制的竞争中,农户行为与企业行为本质上没有任何差别,农户的行为完全是理性的,收益的最大化将是农户的行为决策目标。在本部分的分析中,农产品的生产者具有博弈论中理性人的特质,即其所作决策不仅依据自己的个人效用函数,还将依赖市场中其他参与者的决策,这区别于传统经济学中理性的特质(张维迎,1996)[7]。基于农户理性的判断,我们得出农户道德风险理性决策函数模型:

Z=(1-P)(R-U1)-P(U1+U2)(1)

函数中P为农户道德风险行为被相关职能部门查出的概率(0

基于以上分析,本文提出假设4:

H4a:农业生产要素投入与道德风险具有相关性。

H4b:农户道德失范成本与道德风险具有相关性。

在信息经济学中,常常将博弈中拥有私人信息的参与人称为“人”,不拥有私人信息的参与人称为“委托人”。据此,信息经济学的所有模型都可以在委托-的框架下进行分析(Rasmussen,1994)[8]。在农产品流通环节,消费者向中介机构购买农产品可以理解为委托中介机构收购安全的农产品,而中介机构向农产品生产者收购农产品则可以理解为委托其生产农产品。为此,消费者作为需求的终端,其需求的取向将会作为市场的取向影响中介机构和农产品生产者的行为。由于消费者处于信息不对称的劣势地位,其对于农产品质量安全的判断主要基于其先前的经验与主观想象,这往往会导致事前信息隐藏的逆向选择与信息传递问题。在农产品市场中,消费者由于信息不对称而导致的消费非理性,往往使质量上乘的产品卖不到好价钱,进而可能会导致价格机制的失效,从而使农产品生产者退出市场。除了被动的选择退出市场外,农产品生产者还可以利用信号传递模型主动出击,规避可能由消费者非理性消费而扭曲市场的风险。为了显示自己的类型,人选择某种信号,委托人在观测到信号之后与人签订合同。农户在提供自己所生产的农产品信息时是有选择性的,他们不仅可能会主动隐藏不利信息,甚至还有可能伪造信息,以促使自己在过度竞争的市场中快速达成交易。

基于以上分析,本文进一步提出假设5:

H5:误导性市场导向与道德风险具有相关性。

在农产品流通的过程中,行为主体之间的联系除了信息,还包括农产品自身。下面将讨论农产品的流通路径,即渠道的问题。渠道依赖与权力关系是渠道行为的基础,也是整个渠道行为理论研究的中心议题之一(Stern,1988)[9]。所谓渠道权力,即为某个渠道成员A对另一个渠道成员B的权力,是指B在A的干预下的行为概率要大于没有A干预下的行为概率。尽管渠道权力理论体系日渐完善,但从二元分析范式向网络分析范式的转换问题与作为渠道成员的消费者一直没有被纳入渠道权力分析视野是其中较为突出的两个问题(张闯,2007)[10]。消费者作为一个渠道的终端,将生产的农产品全部消费,其对于农产品的需求将会产生较大影响。农产品的销售渠道对于农户来说十分重要,其决定着农户是否能将农产品顺利的销售出去以及以什么样的价格销售出去的问题。我们将从农户可选择的渠道的多少、选择或更改渠道的成本以及在与渠道商间的力量对比,即渠道商的侵略性渠道权力的强弱来分析农户道德风险的可能。

H6a:渠道选择自由度与道德风险具有相关性。

H6b:侵略性渠道权力与道德风险具有相关性。

四、数据及建模结果分析

(一)数据取得

基于制度经济学、信息经济学、渠道权力等相关理论,本研究提出八个农产品质量安全道德风险引致因素。为验证这些引致因素的真实性和有效性,本研究采用问卷与实地走访相结合的方式进行社会调查。其中,回收有效问卷392份。问卷涉及农户类型多样,覆盖粮油、瓜果蔬菜、牧畜、食用菌等农户。此外,通过农产品集散中心实地走访,完成了农产品渠道市场调研。在调研数据的基础上,本研究采用结构方程模型(Structural Equation Modeling,SEM)进行实证分析。SEM是一种建立、估计和检验因果关系模型的多元统计分析技术,它可以用线性方程系统表示观测变量与潜变量之间,以及潜变量之间的关系,并可同时处理多个因变量。本部分利用研究中提出的基本设想及各变量间的相互影响构建用于验证的结构方程模型。同时采用AMOS17.0软件和SPSS13.0软件对数据进行分析和模型检验。AMOS17.0是一种利用基于方差矩阵结构的潜变量对结构模型进行估计的软件包,可通过多层路径分析对变量之间的直接或间接的相互关系进行验证。为了确保调查问卷的可信性,我们还采用了信度分析和效度分析,将Cronbach’α值作为信度的评判标准,将KMO样本充足度和Bartlett球形检验作为效度评价标准,最后通过因子分析所得出的结果对设想的真实性进行讨论。

(二)信度检验和效度检验

为确保实证结果的准确,本研究对392份问卷进行信度检验和效度检验。在进行信度和效度检验之前,已将反向题项的数据进行标准化处理。在总体的量表中,每个变量对应着不同的题项,首先通过对每个变量(设想)所对应的题项进行信度和效度检验,测量题项之间是否具有一致性以及题项是否包含了变量的所有层面,删除不符合要求的题项或相关性较低的题项,然后对整个量表进行信度检验和效度检验,检验结果见表1。这里所使用的信度检验方法为Cronbach’s α检验,效度检验方法为因子分析法。对整体量表进行Cronbach’s α信度检验,值为0.949,说明量表的整体信度很好,各个题项之间存在较高的一致性,可以进行结构方程测算。

从表1的结果中可以看出,变量“农业生产要素”的Cronbach’s α值非常低,未通过信度检验,因此不能继续进行效度检验,故没有相应因子分析的指标值。

其余7个变量的检验结果:(1)信度检验:Cronbach’s α值均良好,说明可以进行因子分析。(2)KMO和Bartlett相关性检验:KMO值均显著,通过球形检验,表明各个题项之间有相关关系。(3)因子分析结果:每个变量提取一个因子,且因子的特征值均大于1,解释程度均大于50%,说明提取的因子的特征值能够解释总体方差的50%,各个题项因子载荷均大于0.5,均可保留。以上检验表明上述7个变量的各个题项之间具有较高的相关性和稳定性,通过了信度检验和效度检验。

(三)SEM模型及设想检验

1. 数据拟合情况。(1)选用的统计量及统计量标准。P统计量:大于0.05符合要求。拟合优度指数(GFI)和修正拟合优度指数(AFGI):大于0.9符合要求。近似误差均方根(RMSE):小于0.05拟合较好,一般认为在0.08以下均为合理。Bentler的比较拟合指数(CFI):大于0.9,且接近1,拟合较好。正规化拟合指数(NFI):大于0.9,拟合较好。

(2)拟合结果。利用AMOS17.0构建的修正后的结构方程,其各项拟合指标检验结果见表2所示。

由表2可知,以上的拟合指标中除了P统计量以外基本都符合标准。一般情况下样本容量应该为变量的10倍到15倍,但本文中所选用的样本数量为392,远远超过标准,不过对于社会科学类的研究,样本要涉及到足够多的人群和足够大的范围。因此为了保证结构方程结果的可靠性,本研究选用了大样本,而卡方会随着被试样本的数量增大而增大,易受被试样本数的影响,“当样本数过大,如400左右时,易使拟合度指标检验出现拟合不佳的结果”(侯杰泰,2004)[11]。一般在大样本的情况下P值都较为容易显著,因此在这里不考虑P值,而是观察各个变量的总体拟合情况以及结构方程的检验情况。

2. 设想检验结果。H1:制度供给与道德风险具有相关性。该设想讨论的是制度供给与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.983,P=0.005

H2:示范效应与道德风险具有相关性。该设想讨论的是示范效应与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.126,P=0.033

H3:实施主体自我效用考量与道德风险具有相关性。该设想讨论的是实施主体自我效用考量与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.27,P=0.039

H4b:农户道德失范成本与道德风险具有相关性。该设想讨论的是农户道德失范成本与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.73,P=0.038

H5:误导性市场导向与道德风险具有相关性。该设想讨论的是误导性市场导向与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为1.77,P=0.145>0.05。因此,设想H5在0.05显著性水平上未通过检验,同时路径系数大于1说明变量间可能存在多重共线,应该对模型进行修正。但是,我们只是借助结构方程探索影响农产品质量安全道德风险产生的原因,因此将此未通过的检验删除。

H6a:渠道选择自由度与道德风险具有相关性。该设想讨论的是渠道选择自由度与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.347,P=0.000

H6b:侵略性渠道权力与道德风险具有相关性。该设想讨论的是侵略性渠道权力与道德风险产生之间的相互关系。检验结果表明二者之间的标准回归系数即路径系数为0.244,P=0.000

H4a:农业生产要素投入与道德风险具有相关性,由于在信度检验中未通过,因此删除该设想。剩下的6个设想的检验结果如表3所示:

五、农产品质量安全道德风险现状分析

兼具指导之力以及对策之功,这不仅是本文研究的初衷,同样也是本文研究的理论归宿。本研究在第二阶段,以上述问题为导向,通过实践调研,基于制度供给、示范效应、失范成本、渠道选择自由度、侵略性渠道权力等角度,深入分析各种导致农产品质量安全道德风险产生的原因,探寻农产品质量安全中道德风险规避思路、对策建议及其制度安排。为使调研结论具有典型性和代表性,本阶段调研对象不仅选取了在我国农产品生产和流通环节中具有普遍意义的个体农户、大型农产品流通交易中心的经营者和管理者,而且也针对我国现代化大型农业生产特征,选取了黑龙江省农垦系统中较为突出的农场进行调研。结果显示:

(一)制度宣传不足,农户未建立起标准意识

在保证农产品质量安全方面,农户作为生产者,无疑是最为关键且责任最为重大的。农产品的质量安全水平与农户对于质量安全的认识和执行有着密不可分的关系。本研究的调查结果显示,81.5%的农户反映在他们的实际生产过程中并没有受到任何专业性的指导,且对农产品质量安全问题了解甚少,主要是靠以往的经验进行农业生产。农户的文化程度不高,获取新事物和理念的渠道单一,是导致其匮乏农产品质量安全知识的根本原因。目前,农户获取相关信息和政策的主要途径仍然是媒体广播,然而根据调查结果表明,全国各省(市)广播电视台仍没有专门针对农民宣传农产品质量安全生产的节目。尽管我国农产品生产,以及与质量安全监管相关的各职能部门都在其官方主页上开辟专栏,介绍和宣传农产品质量安全标准和规范,但在实践中,我国农户间的网络普及率较低,也很少浏览相关职能部门的官方媒介,因此我国农户多数仍未建立起质量安全标准意识。

(二)制度体系仍不健全,缺乏必要的协调一致性

现阶段,我国有关农产品质量安全监管的正式制度主要有:农产品质量标准体系、农产品质量安全监测体系以及认证体系。然而这些法律法规内容笼统,流于泛泛。对于农产品的生产过程和方法,农产品质量安全的检测认证标准及方法等都只提出一般性的指导意见,没有细节性的内容,存在很多漏洞。此外,我国目前农产品质量安全问题涉及工商、质检等九个政府部门,多部门的分头管理,势必造成部门之间职能交叉责任不明,效率低下,协调性差,造成职能扩张和行政垄断,更加重了政府行为失范。同时,我国现行标准也分为四级:国家标准、行业标准、地方标准和企业标准。除企业标准之外,国家标准、行业标准和地方标准都是政府标准,从法理上应该拥有相同的法律约束力,并且不能相互交叉。但在实践中,由于各级标准的审批和制定部门不同,加之缺乏信息沟通与统一规范,结果许多农产品质量标准及其生产技术规范,存在标准不统一、不一致现象,甚至在一些重要的关键参数上差异也较大、相互矛盾。这就容易造成执法标准不统一,农户难以适从,引起市场混乱。

(三)制度实施存在诸多失范,未有效发挥市场功能

在我国农产品质量安全问题的管理中,政府是制度实施的人,而消费者是委托人。由于政府在经济中的特殊地位和职能,政府往往有着自我效益的考虑以及运行成本等方面的顾及,因此出现大量的执行失范行为。然而与此同时,由于经济地位的悬殊,作为委托人的消费者却无法对人的行为进行选择或有效的约束[12]。事实上,在国外市场中存在着由政府以外的第三方作为方的制度安排。这里所谓的第三方机构,是指具有可靠的执行制度的必要能力,并在执行过程中能够客观、公正、独立地从事经济活动的机构。虽然近年来农产品质量安全第三方认证在我国一些地方发展速度较快,但由于种种现实原因,仍存在着很多突出的问题,如产品认证的总量规模小、认证缺乏权威性、认证的后续监管不严格等。

(四)市场存在道德失范的风险激励

随着市场机制的不断完善,产业间生产要素流动加快,农业生产要素逐渐流失,但随着科技的发展与进步,一些不正当的手段(如添加剂的使用等)可以弥补农业生产要素投入减少所带来的后果,加之我国现阶段所实行的政策性农业保险制度使得农户即使不在农业生产中投入足量的要素,也能获得政策性保险所提供的收入保障,使得其变相成为一种“道德失范风险激励”,从而使农业生产的要素投入上存在着一定的道德风险。在实际走访中,多数农户认为由于现行的检查机制和检验制度标准存在缺陷以及农产品质量出现问题之后的惩罚力度不足,存在质量问题的农产品并不会被完全查处,便使得农产品生产者在生产过程中会存在很大的侥幸心理,即使其被发现,付出的代价也是远远不及违法生产获得的利益多,从而为道德风险行为提供激励。

(五)渠道体系存在垄断性现象,渠道权力失衡

在我国“小农户”与“大市场”的背景之下,现有农产品市场的市场结构不合理,多数农产品流通渠道是无组织的、分散的,农产品从最初的由农户生产到最后出现在消费者的餐桌上,中间将通过储藏、加工、运输和销售众多环节,各个环节之间复杂的渠道体系大大减弱了现有监管体制的效率,延缓了解决问题的时间。此外,农产品流通渠道两端的力量不对等和缺乏足够的市场竞争也是道德风险产生的重要原因。农产品生产者所面对的渠道商拥有相当大的权力,对于农产品的品种,数量及价格,渠道商都有着较大的话语权。在这样的情况下,为了保障自身的利益,农户或中介组织往往存在以次充好、对农产品的外观做某些不合理的处理或者在农产品中添加某些有害的物质等道德风险行为。农产品渠道不规范,渠道权力失衡导致农产品质量安全中道德风险的增加。

六、结论与启示

近年来,我国政府非常重视农产品质量安全管理工作,并在系列政策的实施中取得了令人瞩目的成绩。然而,我国农产品质量安全现状却仍不容乐观。农药残留超标,添加剂误用滥用问题严重,食品中毒事件也时有发生。毋庸置疑,提高食品科学技术和加强卫生检疫水平是保障农产品质量安全的一个重要方面,但是整个农产品市场生产和流通环节中的伦理与道德规范,同样也是保障农产品质量不可或缺的一面。事实上,国内外很多学者已经开始关注农产品生产流通环节中的道德风险问题,相关成果也日益深厚。然而,从目前的研究成果上看,现有以风险视角解读农产品质量安全问题的研究多倾向于依靠政府制度供给来进行安全保障,而对农产品生产流通微观主体风险行为缺乏深入研究。尤其是现有研究对农产品生产流通主体风险行为分析基础理论准备不足,明显缺乏农产品生产流通市场农户风险行为与市场失灵内在机理研究,这就使得那些基于风险视角揭示农产品质量安全问题的精辟论述,一直游离于市场范畴之外。因此,本项目基于农产品市场主体风险行为分析,构建基于道德风险的农产品质量安全分析框架,揭示道德风险在农产品质量安全中的作用和影响机理,其理论价值在于创新了农产品质量安全研究视角,而其应用价值则在于可为我国完善农产品市场建设提供切实可行的政策引导,从而避免道德风险,保障我国农产品的质量安全。

参考文献:

[1]杨瑞龙,辉华.不完全契约理论:一个综述[J].经济研究,2006,(2):104-114.

[2]王可山.食品安全政府监管的困境与对策研究[J].宏观经济研究,2012,(7):68-71.

[3]聂辉华.契约不完全一定导致投资无效率吗?一个带有不对称信息的敲竹杠模型[J].经济研究,2008,(2):132-143.

[4]卢现祥.新制度经济学[M].武汉:武汉大学出版社,2011.

[5]邓大才.农业制度安排的非均衡研究[J].当代财经,2000,(8):19-23.

[6]郝大江.区域经济增长机制研究:基于要素适宜度视角的解析[M].北京:中国物资出版社,2011.

[7]张维迎.博弈论与信息经济学[M].上海:上海三联出版社,1996.

[8]Rasmussen. Crop Insurance and Agricultural Chemical Use[J].Natural Resource Management and Policy,1994,(4):121-125.

[9]Stern.The Roles of Weather Insurance and the Carbon Market [J].Greening the Financial Sector,1988,(4):87-91.

[10]张闯.渠道权力结构的过度倾斜与权力失效:基于农产品营销渠道的研究[J].财经论丛,2006,(9):96-101.

[11]侯杰泰.结构方程模型检验:拟合指数与卡方准则[J].心理学报,2004,(7):186-194.

[12]刘彦平,田光.货币信息弱势理论及其应用[M].北京:中国社会科学出版社,2012.

On the Moral Risk of Agricultural Goods' Quality and Safety in China

Jiang Li

(School of Marxism Studies, Heilongjiang Institute of Science and Technology, Haerbin 150027, China)