第四章困境下的策略选择——囚徒困境 (2)
两年后,即公元前643年,齐桓公生病沉重,不能起床。竖刁、易牙发现姜小自己没有利用价值,效忠已不能带来利益,于是决定杀掉太子姜昭,拥立齐桓公的另一个儿子姜无亏,这样他们就可以顺理成章地继续得到宠信,他们下令禁止任何人出入寝宫。可是3天之后,齐桓公仍然不死。易牙勃然大怒,把左右服侍的人全部逐走,又在寝宫四周,筑起围墙,隔绝内外,把齐桓公饿死在病榻上。
孔子说:“人心比山川还要险恶,知人比知天还难。天还有春秋冬夏和早晚,可人呢,表面看上去一个个都好像很老实,但心世界却包得严严实实,深藏不露,谁又能究其根底呢?”
平常的好人也会在利害关头表现现出他的恶。例如有人为了升迁,不惜设下圈套打击其他竞争对手,有人为了生存,不惜在利害关头出卖朋友;有人走投无路,狗急跳墙,于是行骗行抢……比如说,有时欺骗我们的恰恰是我们的好朋友。
于是,有人感慨,世态炎凉,其实完全没必要,因为整个世界上所有人实际上都处于一场博弈之中,每个人的行为表现必定都有他的目的,都要符合自己的利益原则,你幻想别人是好的,好其实也是对自己好,因为对有的人,每个人的评价不一样,即使你身边的朋友,大家也都褒贬不一,因为从别人身上得到好处或利益的人,人们就会说他好,得不到利益或损害了自己的利益,也许因为嫉妒或伤害而贬低对方,这些都是正常的,即使出卖了合作者,甚至是自己的最好的朋友,像易牙这些人连自己的主人都出卖了,在那个封建年代这是最大逆不道的,但他们为了自己的利益也是迫不得已,因为一朝天子一朝臣,如果让下一代君主即位,而下一代君主又不支持自己的话,那么他们的命运将会极为悲惨,所以他们活活饿死齐桓公也是迫不得已的选择。如果齐桓公能在王位上保持长久,他们会一直侍奉下去,但齐桓公的病入膏肓,使他们感觉到了危险,他们必须要尽早确定自己中意之君,虽然他们的良心受到谴责,但这也是博弈规则下的无奈。
囚徒策略与懦夫困境
一旦陷入“囚徒困境”,任何一方都无法独善其身,即使双方都有合作意愿,也很难达成合作。从一个故事的角度,我们会为两个囚徒不能合作而遗憾。然而在现实生活中,我们都巴不得他们互咬,否则罪犯就逃脱了法律制裁;商家如果通过合谋控制物价,我们的生活水平就要打折扣。有一利必有一弊,其实我们完全可以把囚徒困境作为自己的一种策略。
现在我们做个假设,你正作为一名士兵身处第一次世界大战的战场。你们在战场上遇到了敌军。假设你们都不怎么爱国,那么活命是你的最高目标。
在战斗打响时,避免成为炮灰的最好办法是你逃跑,而其他的弟兄留下来战斗。
当然,假如你这边的其他弟兄也跟着逃跑,那么你的逃跑就更显得明智了,因为当敌军打到你们这边时,你一定不希望只剩下自己在战斗。
因此,不管其他弟兄怎么做,逃跑都是你所能采取的最佳策略。
但是,假如你这边的每个人都逃跑,那么你们大概只有全军覆没。
在这种情况下,类似囚徒困境的“懦夫困境”就出现了。
假如你这边的每个人都逃跑,敌军就很容易把你们一举擒获并加以歼灭。因此,与其每个人都逃跑,不如每个人都留下来更有利。
就个人而言,懦弱一点比较有利;就团体而言,勇敢一点对大家都好。部队自有打破这个懦夫困境的方法:在大部分的军队中,假如有士兵在战斗时逃跑,会被就地正法。因此,退缩就会被枪毙的压力反而对士兵有帮助,因为它等于帮他们破解了懦夫困境。
古罗马有这样的军规,军队排成直线向前推进的时候,任何士兵,只要发现自己身边的士兵开始落后,就要立即处死这个临阵脱逃者。为使这个规定更可靠,未能处死临阵脱逃者的士兵也会被判处死刑。这么一来,一个士兵宁可向前冲锋陷阵,也不愿意回头捉拿一个临阵脱逃者,否则就有可能赔上自己的性命。
罗马军队这一军规的精神直到今天仍然存在于西点军校的荣誉准则之中。该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除。不过,由于学生们不愿意“告发”自己的同学,学校规定,发现作弊而未能及时告发,同样违反荣誉准则,也会被开除。一旦发现有人违反荣誉准则,学生们就会举报,因为他们不想由于自己保持缄默而成为违规者的同伙。与此同理,各国刑法也将未能举报罪行者以罪犯同论。
囚徒困境与夫妻游戏
囚徒困境大家都已经很熟悉了,我们也知道,囚徒困境可以应用于生活的各个方面,在囚徒困境中有一个经典的夫妻游戏的例子给我们讲明了夫妻间一旦出现价值取向的矛盾该怎么办?
丈夫阿里和妻子劳斯商量晚上的活动。丈夫喜欢看足球,妻子喜欢听音乐。但是,两个人都希望在一起度过一个夜晚。那整个夜晚该怎么办呢?是去音乐会还是看足球呢
看一下双方的支付矩阵
丈夫
妻子 听音乐 看足球
听音乐 (2,1) (0,0)
看足球 (0,0) (1,2)
假设最后听音乐,妻子的效用是2,丈夫的效用是1;如果看足球,丈夫的效用是2,妻子的效用是1。在这两个均衡中,最后到底是哪个是无法知道的,这取决于双方哪一人的“权力”更大一些,是一种“温柔的独裁”,因为效用为1的那一人,虽然没看到自己想看的节目,但还是达到了“共同度过这一夜晚”的预期。
在理论上是这样的,在实际生活中有时候人的行为和理论上是有偏差的。博弈的基本假设是“理性人”假设,人们在作决策的时候会尽量使利益最大化。由于现实中人不一定理性,就会出现很多问题,比如这个夫妻博弈。由于夫妻是相爱的,所以自然会更多地考虑对方的感受,不仅是要“共度夜晚”,还要”愉快的共度夜晚“。因此,丈夫会想:若勉强她和我一起看足球,她心里肯定不愉快,所以还是看听音乐吧。同时妻子会想:若勉强他和我听音乐,他一定会不舒服,还是看足球吧——结果是陷入了尴尬的两难,最后很可能是既不看足球也不听音乐,两人的效用同时降低,同时没有得到满足。换一个角度说,人们在作出行为之前,会对结果有一个预期,在作出行为之后,将结果与预期相比较,吻合的程度是满足感的一个重要来源。如果既不听音乐也不看足球的话,双方都不会满足。
这里的夫妻虽然不是理性的,但却是充满爱的,因为对对方的着想,使得最后的结果不理想。如果人是理性的,会选择两个节目中的一种,让其中一个人效用最大化。
那么人到底是理性好呢,还是感性好呢?生活总是充满了奇怪的问题。囚徒困境在生活中往往让我们陷入两难的境地。如果两个人不相爱,非要让对方满足自己,夫妻之间就可能要吵架了,而夫妻之间的吵架也是一场博弈,也可以用囚徒困境策略来解释。
如果夫妻之间要吵架的话,夫妻双方都有两种策略,强硬或软弱。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。至于哪一种是夫妻之间的最后选择,必须列出其支付矩阵才可以确定。支付矩阵不一定非要用量化确定的数字表示,也可以用支付函数表示。经济学家们常用支付函数进行讨论。
但结果往往是选择夫妻共同让步的比较多,因为无论采取哪种策略,都不可能达到共赢的局面,只有双方都选择软弱策略的时候,共赢才可能出现。
猎人博弈的帕累托优势
以前的村庄里有两个猎户,他们为了生存不得不去打猎,但在他们附近的森林里,猎物只有两种:鹿和兔子。在那个时候,人类的狩猎水平都是比较低的,弓箭的力量也不是很强。在这样的情况下,我们可以这样认为,如果两个人一起去打鹿,可以打到1只鹿。如果一个猎人自己去打,他只能打到4只兔子。从填饱肚子的角度来说,4只兔子可以吃上4天,1只鹿却差不多能够解决一个月的问题。这样,两个人的行为决策就可以写成以下的博弈形式:要么分别打兔子,每人得4;要么合作,每人得10(平分鹿之后的所得)。
两个纳什均衡,就是两个可能的结局。那么,究竟哪一个会发生呢?是一起去猎鹿还是各自去打兔子呢?这就和情侣博弈一样,不能完全由纳什均衡本身来确定。
比较(10,10)和(4,4)两个纳什均衡,明显的事实是,两人一起去猎鹿的赢利比各自去打兔子的赢利要大得多。按照长期合作研究的两位博弈论大师美国的哈萨尼教授和德国的泽尔腾教授的说法,甲乙一起去猎鹿得(10,10)的纳什均衡,比两人各自去打兔子得(4,4)的纳什均衡,具有帕累托优势。猎人博弈的结局,最大可能是具有帕累托优势的那个纳什均衡:甲乙一起去猎鹿得(10,10)。
比起(4,4)来,(10,10)不仅是总额的改善,而且每个人都得到很大改善。这就是(10,10)对于(4,4)具有帕累托优势的意思。关键是每个人都得到改善。
这里要解释一下帕累托效率和帕累托优势到底是什么。帕累托效率是意大利经济学家帕累托提出来的。其内容是:社会资源如何配置才能改变人们的境况,只有资源配置已经达到这样一种状态,也就是在不使其中一个变的更坏的情况下,另一个也不能变的更好的时候。这个定义读起;来有点艰涩。其实主要是看资源是否已经被充分利用。如果资源已经被充分利用,要想再改善我就必须损害你或别的什么人,要想再改善你就必须损害另外某个人,一句话,要想再改善任何人都必须损害别的人了,这时候就说一个经济已经实现了帕累托效率。相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未充分利用,就不能说已经达到帕累托效率。
在“猎人博弈”中,两人合作猎鹿的收益(10,l0)对于分别猎兔(4,4)具有帕累托优势。这是因为如果比较原来的境况(4,4),现在的(10,10)我们说境况得到了帕累托改善。作为定义,帕累托改善是各方的境况都不受损害的改善。
可是上面的情况是假设双方平均分配猎物,也就是说,两个猎人的能力和贡献差不多,但是实际上并不一定如此。
如果一个猎人各方面都非常优秀,他就会要求得到较大的一份,这样分配的结果就可能是(14,6)或(15,5),但有一点是确定的,如果合作的话就要保证一点那就是能力较差的猎人的所得,至少要多于他独自打猎的收益,否则他就没有合作的动机。如果合作的结果是(17,3),相对于分别猎兔(4,4)就没有帕累托优势,这是因为3比4小,乙受到损害。这样,我们就不能说境况得到了帕累托改善。虽然17比4多,改善了很多,17+3也比4+4大很多,改善了很多,但是3比4小,乙没有改善反而恶化。所以站在乙的立场,(17,3)没有原来的(4,4)那么好(第一个数代表甲的满意程度或者得益,第二个数代表乙的满意程度或者得益)。如果合作的结果如此,那么,乙一定不愿合作。可见,帕累托改善是一种各方都认同的改善,不是要求任何一方作出牺牲的改善。
“帕累托效率”很有现实意义,也是目前经济学家比较关注的问题。著名经济学家吴敬琏几年前曾出过一本书,名为《改革正在过大关》,他指的是中国的改革开放到了一个关乎成败的紧要关头。改革开放的成就世人共睹,为什么还要这样说呢?
关于中国的成功有很多分析,有人认为中国的“渐进式”改革,避免了前苏联、东欧那样一步到位的“振荡疗法”或“休克疗法”,社会损失较小。深刻一点的分析,则说中国的改革是从体制外的改革开始,向体制内的改革发展等等。
人们比较一致的看法是,一直到前几年为止,中国的改革进程大致上是一种帕累托改善的过程。虽然有一小部分人发了大财,社会不平等程度在增加,但是广大人民的收人也多多少少在增加,生活基本上都在改善。可是这种改善总要被帕累托效率代替:有些人不可避免地要为社会的发展付出代价。
例如目前的国企改革问题。国企效益不好,既有责权不分、经营不善的原因,也是因为计划经济下国有经济一直承担着“企业办社会”的重任。企业办社会,就一定会损失效率。兼办社会的国有经济,担负着为改革开放提供安全网的作用。国有经济不仅承担了国家财政收入的绝大部分,而且是亿万职工生计的保证。当私有企业、外资企业等“体制外”经济轻装上阵蓬勃发展的时候,国有经济承担了国家和政府的许多社会责任。