登陆注册
8158800000002

第2章 认识博弈论(1)

博弈论,又叫对策论,是研究两人或多人之间竞争合作关系的一门科学。用我们日常的语言来说,博弈论就是研究在不同情境下的策略选择的一种理论。它既是经济学的一个重要学科,也是现代数学的一个新分支。

在经济学上,博弈论是一个非常重要的理论概念,通过使用严谨的数学模型来解决现实生活中的各种利害冲突问题。具体来说,博弈论是指某个个人或是组织,在一定的环境条件和规则约束下,依靠所掌握的信息选择并加以实施各自所倾向的行为或是策略,并从中取得相应结果或收益的过程。

博弈论思想古已有之,早在2000多年前,博弈论的原始思想即已萌芽。古代文献中不乏充满博弈思维的案例。《孙子兵法》、《三十六计》、《三国演义》等等,就不仅仅是军事著作,而且可以算是很好的博弈论教材,只不过还没有上升到现代博弈论的层次而已。

博弈论最初主要研究象棋、围棋以及赌博中的胜负问题。那时候,人们对博弈局势的把握只停留在经验层面上,并没有向理论化发展,其正式发展成一门学科则是在20世纪初。

1928年,美籍匈牙利数学家约翰·冯·诺伊曼证明了博弈论的基本原理,并与经济学家奥斯卡·摩根斯坦合作于1944年发表了《博弈论与经济行为》一书,提出合作博弈的基本模型,并将二人博弈结构推广到n人博弈结构。至此,博弈论被引入了经济领域,奠定了这一学科的基础和理论体系。人们都把诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生的标志。

目前,博弈论作为分析和解决冲突和合作的理论工具,已经在管理科学、国际政治、经济、外交和社会学等领域得到广泛的应用,为解决不同实体的冲突和合作提供了宝贵的方法,并日渐发展成为一热门学科。

博弈的三要素

任何一局博弈都至少包含以下三个基本要素:

——决策主体决策主体,又译为参与者、局中人或博弈者。在一场竞赛或一局博弈中,每一个有决策权的参与者构成一个决策主体。

决策主体的目的是通过选择行动或者战略以使自己的效用水平最大化。只有两个决策主体的博弈现象称为两人博弈,多于两个决策主体的博弈称为多人博弈。一局博弈中的决策主体可以是自然人,也可以是团体:如企业,国家等。

——策略策略,又译为战略,即决策主体在给定信息的情况下的行动规则,它规定了决策主体在什么时候采取什么行动。

一局博弈中,每个决策主体都会选择实际可行的、完整的行动方案。一个可行的自始至终地对全局进行筹划的行动方案,称为这个决策主体的一个策略。如果在一局博弈中决策主体的策略是有限的,就称为有限博弈,相反则称为无限博弈。

——效用效用,又叫做支付,是指在一个特定的策略组合下,决策主体得到的确定效用水平,或者说是期望效用水平。简单来说,效用就是指进行博弈的付出或者收益。效用是所有决策主体真正关心的东西,每个决策主体在一局博弈结束时的效用,不仅与该决策主体自身所选择的策略有关,而且与全部决策主体所取定的一组策略有关。一局博弈结束时每个决策主体的效用是全体决策主体所取定的一组策略的函数,通常称为支付函数。

博弈的分类

博弈可以从多个角度进行分类。

——按照博弈各方是否同时决策,博弈可以分为静态博弈和动态博弈静态博弈是指在博弈过程中,参与者同时决策或同时行动,或者尽管决策或行动有先后顺序,但后行动者并不知道先行动者采取了什么具体的决策或行动。比如说工程招标(排除标书泄密的违规行为),其截止日期是6月1日,尽管有的竞标者在5月上旬就投了标,有的竞标者到5月下旬才投标,参与者的决策时间有先后之分,但效果却与同时决策是一样的。

动态博弈是指在博弈过程中,参与者的行动有先后顺序,并且后行动者可以观察到先行动者所采取的行动。

——按照参与者对其他参与者的了解程度,博弈可以分为完全信息博弈和不完全信息博弈完全信息博弈是指在博弈过程中,每一位参与者对其他参与者的策略空间、策略组合及收益信息有完全的了解。

如果参与者对其他参与者的策略空间、策略组合及收益信息了解得不够确切,或者说并没有掌握所有参与者的策略空间、策略组合及收益信息,在此种情况下进行的博弈就是不完全信息博弈。此时,参与者所做的是努力使自己的期望支付或期望效用最大化。

——按照参与者能否形成约束性的协议以便集体行动,博弈可以分为合作博弈和非合作博弈合作博弈是指所有参与者都从利己的角度出发,与其他参与者进行谈判并达成具有约束力的协议或形成联盟,参与者在协议范围内进行的博弈,其结果对联盟各方均有利。合作博弈主要研究人们达成合作时,如何分配合作得到的收益,即收益分配问题。

合作博弈强调团体理性、效率、公平和公正。典型的合作博弈是某一行业的寡头企业之间的串谋行为,即企业之间通过公开或者私下签订协议,对各自的价格或产量进行约束,以达到获取更多垄断利润的行为。

反之,不能强迫其他参与者遵守某一协议,各参与者只能选择自己的最优战略的,则属于非合作博弈。非合作博弈主要研究人们在利益相互影响的局势中如何选择决策,使自己的收益最大,即策略选择问题。

非合作博弈强调个人理性、个人最优决策。下面将要讲到的囚徒困境就是典型的非合作博弈。因为非合作是当今社会中利益博弈的常态,所以非合作博弈是博弈论探讨的主要内容。

非合作博弈按照参与者对其他参与者的信息掌握程度和博弈各方采取行动的顺序,可以分为四种不同的类型,即:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。这四类博弈一个比一个精彩,也一个比一个难。

完全信息静态博弈——是指在博弈过程中,所有参与者事先达成一项具有约束力的协议,规定每个决策主体的行为规则。如果在没有外在强制性约束时,各参与者自觉遵守该协议,没有人偏离协议规则,就构成一个纳什均衡(概念见第2章)。只要有一个参与者违背协议规定,则此协议就不构成纳什均衡,就不可能自动实施,不满足纳什均衡要求的协议是没有任何意义的。

完全信息动态博弈——动态是世间万物的基本特征,而静态只是一种独特的理想状态。在现实生活中,当一个参与者后采取行动时,自然会根据先前参与者的选择而适时调整自己的决策,而先采取行动的参与者也会理性地预期到这一点,所以也会考虑到自己的选择对其他后行动参与者的影响。

不完全信息静态博弈——是指参与者同时采取决策或者说决策虽然有先后顺序,但后行动者并不知道先行动者的决策,也没有机会观察先行动者的选择以调整自己的决策。每个参与者的最优策略只能是在给定自己的类型和他人类型依从策略的情况下,最大化自己的期望效用。

不完全信息动态博弈——是指各个参与者采取的决策有先后顺序,且后行动者掌握了前者的选择并获得了其偏好、策略空间及策略组合等信息,并依此修正自己的决策;而先行为的参与者也知道自己行为的效用对后行动者的影响,也会有意识地选择某种行动掩盖自己决策的真实目的。

博弈论是一门现实中非常有趣,理论上又颇有深度的学问。可以毫不夸张地说,了解博弈论知识对每一个现代人来说实在是太重要了。因为在现实社会中,每个人都在试图使自己的利益最大化,而在取得利益的过程中,往往会产生矛盾与冲突。利益均衡的实现主要取决于各自的策略选择行为,而策略选择问题实际上就是博弈论的本质所在。

多种立场,一个思想

囚徒困境最早是由美国普林斯顿大学数学家塔克于1950年提出来的。他当时编纂了一个故事,意在向斯坦福大学的心理学家们解释什么是博弈论。后来经过发展,囚徒困境成为了博弈论中最著名的案例之一。

所谓囚徒困境,大意是这个样子的。有一天,某富翁在家中被杀,财物被窃。警方在侦破此案的过程中,抓到了汤姆、杰克两个犯罪嫌疑人,并从他们的住处搜出了被害富翁家中丢失的财物。面对呈现在眼前的物证,他们承认了自己的偷窃行为,但却矢口否认杀害富翁,辩称是先发现富翁被杀,然后他俩只是顺手牵羊偷了点儿东西。

针对两人的狡辩,警方对他们采取了隔离审讯。为了分化瓦解他们,检察官分别对两人说了以下一段话:

本来你们的偷盗罪证据确凿,可以就此判你们1年刑期。但是,根据将功赎罪制度,如果你主动坦白并且揭发同伙的杀人罪行,我们将对你进行从宽发落,判你无罪释放,但你的同伙要被判30年刑期。如果你顽抗到底,拒不坦白,而被同伙检举出你的杀人行为,那么你就要受到严惩,将被判刑30年,你的同伙将被无罪释放。当然,如果你们两人都坦白,那么你们都将只被判15年刑期。在这里,博弈的决策主体——汤姆和杰克各有两个选择,即坦白和抵赖。这两个嫌疑犯该怎么办呢?他们面临着两难的选择——坦白还是抵赖。显然最好的选择是两人都选择抵赖,都得到最好的结果——只判刑1年(杀人罪按照疑罪从无原则,证据不足无法成立,只能以偷盗罪各判每人1年徒刑)。但是由于两人处于隔离的情况下,没有串供的条件,所以他们不得不仔细考虑对方可能采取什么策略,以及对方采取的策略对自己有什么影响。

心理较量就这样开始了,汤姆和杰克都是绝对的精明人,都只在乎减少自己的刑期,并不关心自己的选择会对对方产生什么影响,对方因为自己的决策又将被判多少年刑期。

汤姆会这样推理:假如杰克选择抵赖的话,我只要坦白,马上就可以无罪释放,获得自由,而我若抵赖则要坐牢15年,显然坦白比抵赖要划算得多;假如杰克选择坦白的话,我若抵赖,则要坐30年牢,坦白却只坐15年牢,显然还是选择坦白为上策。所以说,无论杰克选择抵赖还是坦白,我的最佳选择都是坦白,还是坦白交代了吧。

同样,杰克也跟汤姆一样会算计,也会如此推理。囚徒困境之所以称为困境,就是因为这局博弈的最终结果对两个参与者来说都是最坏的,两个嫌疑犯双双选择坦白,结果皆被判刑15年。这对他们个人来说都是从自身利益出发的最佳选择,符合他们的个体理性选择。因为坦白交代者可能会被无罪释放,显然比自己抵赖可能会独自承受30年刑期要好。而原本对双方都有利的策略——两个人都抵赖,每人被判1年刑期就不会出现。囚徒困境是典型的非合作博弈的范例,为我们探讨合作是怎样形成的提供了极为形象的解说方式,其产生不良后果的原因是两个嫌疑犯都从利己目的出发,最终导致结果损人不利己,合作没有产生。反过来我们就可看到:彼此达成合作是最好的利己策略,但合作必须符合以下黄金定律:“己所不欲,勿施于人”。基于此基础之上的合作才能形成一个和谐的、良好的社会环境。

在囚徒困境中,最好的策略直接取决于对方所采用的策略,取决于对方所采取的策略为发展双方合作留出多大的余地。独立于对方所用策略之外的、从利己目的出发的、最好的决策是不存在的。

实际上,囚徒困境是现实生活中许多现象的一个抽象概括,有着广泛而深刻的意义。同一行业不同企业之间激烈的价格竞争就是典型的囚徒困境现象。在价格博弈中,只要双方都以对方为敌手,只关心自己的利益,那么不管对方采取怎样的决策,自己采取低价策略总会占便宜,就如同囚徒困境中的犯罪嫌疑人始终认为自己选择坦白为最佳决策一样,这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的价格竞争、各大航空公司之间的价格战,等等。

如果双方进行合作,共同制定比较高的价格,就可以避免无休止的价格大战并获得较高的利润。但是这些联盟往往处于利益驱动的囚徒困境之中,双赢也就成为泡影。不同企业之间五花八门的价格联盟总是非常短命,道理也就在这里。

合作,有时是利益需要

农村某地有一个只有上官、欧阳两户人家的小居民点。由于地处偏僻,交通不便,使得两户人家与外界的交流十分困难,急需修一条通向外界的好路。假设修这条路的成本为4个单位,每户人家从修好的这条路上获得的好处为3个单位。如果没有中间人协调,上官、欧阳两家就各自打着自己是否修路的小算盘:若两家共同出钱联合修路,每家平均分摊修路成本2个单位,则每户人家获得的好处为1(3-2=1)个单位;当只有其中一户人家出钱修路而另一家坐享其成时,修路的那户人家付出4个单位的成本,却只得到3个单位的好处,获得的纯赢利为-1(3-4=-1)个单位,也就是得不偿失,倒贴1个单位,结果是亏损的,而坐享其成的一家却仍然可以使用修好的公路(修路人并没有拥有道路的占有权,总不能因为修了路就不让邻居走),白白获得3(3-0=3)个单位的好处;如果上官、欧阳两家都不修路,两家的纯赢利皆为0。

对上官家来说,若欧阳家修路,我家也修路,会获得1个单位的好处,而我家不修路,则会获得3个单位的好处,显然修路是劣势策略;若欧阳家不修路,我家修路,则净亏损1个单位,而我家不修路,则不赢也不亏,修路还是劣势策略,因而上官家决定不出钱修路。同理,欧阳家也会选择不修路。最终修路博弈的结局将是:两家都不动手,大家都得零。这就应了英国历史学家麦考莱的一句话:

大家的事情反而无人管。一般情况下,若上官只有欧阳一家邻居,欧阳也只有上官一家邻居,他们两家多半会互帮互助,好好商量修路的问题,合力把路修好,大家都得到方便。但是如果出现极端情形,如两家有仇,那就另当别论了。但是,这两种情形都不在博弈论讨论的范围之内。如果不附加说明,博弈论讨论所牵涉的参与者,都是经济学上的理性人:他们并没有私人恩怨,也不是世代友好,而只是具有自私本性但并不刻意损害他人的人类一员。

公共品和私人品的性质不一样。私人品是纯属私有私用,别人很难占到什么便宜。但公共品就不一样了,不管由谁提供出来,大家都可以共享。典型的如公园里的长椅,只要有人出钱出力设置好了,所有行人都可以坐下休息,哪怕他没有为此作出丝毫贡献。那么,这长椅由谁来设置呢?恩惠于大家的公共事情又由谁来管呢?

同类推荐
  • 你的职场口才价值百万

    你的职场口才价值百万

    本书旨在从职场人士提高口才能力的实际需要出发,对职场中各种环境下的语言沟通艺术,做出精辟的概括与总结,分别介绍了八十多条鲜活、实用、有效的具体方法,如职场管理中言之有情的说话妙招,职场纠纷时言之有理的说话诀窍,职场会议上言之有物的发言技巧,职场公关中言之有趣的说话艺术等。
  • 为人处世方与圆

    为人处世方与圆

    随着社会的发展,社交越来越多样化了。朋友来往、同事相处、夫妻关系等等,每一个社交圈子都有其独特性,对于不善于处理这些关系的人来说,每一个圈子就是一道解不开的难题。只要懂得以方圆策略指导个人的社交行为,社交就会成为一件驾轻就熟的事情。为人处世知方圆,尽是人间四月天。
  • 名人微博精选

    名人微博精选

    本书从徐小平、王永、王育琨、王金阳等四位名人的两万余条新浪微博中精选出八百余条,他们微博的内容涵盖了心得感悟、生活态度和社会观察等方面,从他们的微博中可以看到他们对人生和社会的思考和探讨。为了方便读者阅读,本书的编者还围绕每个主题还辅以编者手记一篇,使每章的内容更加突出,读者更容易阅读。
  • 一个自己的房间

    一个自己的房间

    《一个自己的房间》沿袭了《有些事现在不做,一辈子都不会做了》温暖治愈的文风,从生活的微小处,生命的细节处找到感动的力量,重新审视我们所有的,拾回那些渺小却重要的爱好、乐趣,让一颗身处浮世的心不再彷徨、焦躁、不安。《一个自己的房间》采访了9位散落在不同行业,拥有着积极乐观的人生态度,善于从生活中捕捉“微小而确实”的幸福的男女。欣赏他们房间的细节,继而得以窥探他们关于人生的态度和生活的哲学。
  • 改变一生的闪念

    改变一生的闪念

    一个看似普通的闪念,却可能在人生的十字路口担当重要的角色;一个看似平凡的闪念,却可能在人生的抉择中,让人们选择正确的方向。一念之间所做出的选择是重要的,因为它影响着以后的人生。那么,在当今社会,特别是在经济快速发展的形势下,人们应该如何选择自己的命运,摆正自己的心态,面对经济的贫穷、生活的无奈、人生的平淡等一系列问题,从而塑造完美人生呢?本书将为您解读人生的本质,帮助您洞悉人生的规律,领悟人生的真谛,寻找成功的轨迹,把握人生的方向,从而实现自我的价值。
热门推荐
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 美女总裁老婆赖上我

    美女总裁老婆赖上我

    本书首发:创世中文网,在创世已签约。喜欢的书友可以上创世中文网或者qq.阅读搜索:美女总裁老婆赖着我观看。推荐本新书(萌妻来袭,总裁乖乖被擒!)有些遇见,从一开始就注定了不一样的缘分——没有装逼泡妞技能的周汉被美女总裁“威逼利诱,”般的结啦婚。三天不打,上房揭瓦。忍无可忍,必须残忍。且看我怎么和美女总裁媳妇周旋斗法。等等……“——日”久生情?那从今以后,你负责貌美如花,我负责赚钱给你花!【本书献给那些你懂的,我懂的,我们不懂的……青春】牵绊之中,总会生出这样或者那样不一样的情愫所幸的是,我爱你的时候,你也爱我。西瓜2016年都市言情力作!给你看不一样的都市言情,谁说一定要霸道总裁.
  • 重生嫡女:风华绝代

    重生嫡女:风华绝代

    她是21世纪顶级特工,一朝穿越在重生的云沧澜身上。带着前世云沧澜的记忆,她整渣女渣男,斗姨娘渣爹,收娘亲嫁妆,现绝世之才,展绝代风华。人人皆知,云家大小姐容颜绝世,才华惊世,财富无尽,医术无双,但却行事不定,慵懒成性,冷心无情。流年锦瑟,那女子浅浅一笑,宁我负天下人,也绝不叫天下人负我!可勾天引地,还不小心牵了某个男人的心。公众前:某男霸气侧漏:“怎么,你们要为难本王的女人,先将本王挫骨扬灰再说!”私下里:某狼睁着一双冷傲双眸狂狷地看着某女:“空虚、寂寞、冷!”某女咬牙切齿:“穿上、衣服、滚!”
  • 妖尾传说之紫龙降世

    妖尾传说之紫龙降世

    灭龙魔法吗?纳兹,伽吉鲁,温蒂,拉克萨斯,克布拉,斯汀格,还有你罗格,我要把你们踩在脚下,我墨紫延,我要得到力量,力量就是保护“家人”最好的工具!小说有一段时间进入了过度期,但是已经做好修整了,知道大家想抱怨不足的地方,所以请加QQ讨论群:583231714
  • 天地有妖灵

    天地有妖灵

    天地有妖灵,万物皆封尽!……………………
  • 这游戏真不是我创造的

    这游戏真不是我创造的

    按照无限恐怖制作的游戏,竟然能够影响现实…何宏轩苦笑着说:这游戏真不是我制作的你信嘛?
  • 半夏离歌

    半夏离歌

    曾经的青春里,没有了快乐没有了汗水没有了所有的人来人往。只剩下满地的遗殇,随风而逝。我想我还在等,等你说早已不可能。夏离歌,你是我过不去的劫数,数不清的守护。即便你的笑容没有酒,我也沉迷了三年。如果有一天,我们都累了,那就及时告别吧。就让那些人走啊散啊,只留我一人在这里守着曾经的故事,我们的故事。
  • 妖啸九天之凤破苍穹

    妖啸九天之凤破苍穹

    她,与生俱来的妖冶之祖,跟鸿钧分掌正邪之气,却因为莫名的陷害被关入了黑洞。幽怨,忿恨纠结上心,她发誓,要让所有害过她的人生不如死。“鸿钧,你跟女娲狼狈为奸,害我如此,三千年后,我将借怨气重返人间,必然颠覆你的宇宙,血染整个天地。我,姬妖,以天妖者的身份发誓,他日重生,必然让我妖族啸傲天地,混淆人间。”三千年的恨火,三千年的等待,她终于可以把所谓的神踩到了她的脚底下,可暮然回首,一丝惊愕却印在了心头,她疑惑了?
  • 剑逆天道

    剑逆天道

    夜幕覆盖了大地,所衍生出来的就是罪恶和堕落,而在这个堕落都市里显得犹为明显。奢靡的背后,很多时候就是痛苦与无奈。但是背后就是背后,表面的繁华还是吸引了无数向往“光明生活”的年轻人来到这个城市,而墨云就是其中一个。只可惜墨云也跟随着大家从一开始的向往,到屡屡的失望,直至最后的迷茫。
  • 兽王·沙海远征

    兽王·沙海远征

    兰虎三人在剑塔中各自获得不同的守护碑传承,兰虎甚至还收伏了一只树精。选拔的时间逐渐逼近,兰虎三人也抓紧了时间在守护者联盟中学习一切知识,为即将到来的选拔做准备。时间的脚步无法阻挡,选拔的日期终于到了。守护者联盟的战舰载着来自各星球的强者们,将他们投入到不同星系的不同星球,这些星球有着不同的地理面貌和生存环境,它们的共同点是这里都曾遭到过侵略,有的战火仍在继续,有的则战火已经熄灭,但是却有一些邪恶的强者潜伏了下来,这就是选拔者的任务,他们要完成任务,并炼制出守护碑,才能正式成为守护者联盟的一员。