走近蜈蚣博弈
蜈蚣博弈是由著名博弈专家罗森塞尔(Rosenthal)提出的。它是这样一个博弈:两个参与者A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如100次。假定这个博弈各自的支付给定如下:
合作合作合作合作
A——B——A…A——B——(100,100)
背叛背叛背叛背叛
(1,1)(0,3)(2,2)(99,99)(98,101)
现在的问题是:A、B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名为蜈蚣博弈。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第100步;B在“合作”和“背叛”之间做出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第99步才到第100步,在99步,A考虑到B在100步时会选择“背叛”,此时A的收益是98,小于B合作时的100。
那么在第99步时,他的最优策略是“背叛”。因为“背叛”的收益99大于“合作”的收益。如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100~99。
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的,而从逻辑的角度看,一开始A应采取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过实验,他们发现,在蜈蚣博弈中,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的,然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,肯定在某一步采取不合作策略。倒推法肯定在某一步要起作用,只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与者不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。
理性的人,非理性的表现
“非理性”似乎是个贬义词,可事实上,正是许多所谓“非理性”的行为促进了人类的福利。而且,仅仅从策略的角度说,这种拒绝合作的“非理性”行为也是可取的,它其实有这样的意思:你受的伤害,远远大于我受的伤害;如果你要避免这种最坏结果,你就不要伤害我。事实上,聪明人都懂得不要把事情做得太过火,古代的“明君”轻徭薄赋,也正是这个道理。只有那些昏君、暴君才会横征暴敛,就是因为他们把老百姓看得太“理性”,以为只要人民能对付活下去,就不会拼死造反。
有这样一个博弈:
两人分一笔总量固定的钱,比如100元。方法是:一人提出方案,另外一人表决。如果表决的人同意,那么就按提出的方案来分;如果不同意的话,两人将一无所得。比如A提方案,B表决。如果A提的方案是70:30,即A得70元,B得30元。如果B接受,则A得70元,B得30元;如果B不同意,则两人将什么都得不到。
A提方案时要猜测B的反应,A会这样想:根据理性人的假定,A无论提出什么方案给B,除了将所有100元留给自己而一点不给B留这样极端的情况,B不会同意,否则B只有接受,因为B接受了还有所得,而不接受将一无所获——当然此时A也将一无所获。此时理性的A的方案可以是:留给B一点点比如1分钱,而将99.99元归为己有,即方案是:99.99:0.01。B接受了还会有0.01元,而不接受,将什么也没有。
这是根据理性人的假定的结果,而实际则不是这个结果。英国博弈论专家宾莫做了实验,发现提方案者倾向于提50:50;接受者会倾向于70:30,如果给他的少于30%,他将拒绝;多于30%,则不拒绝。
这个博弈反映的是“人是理性的”,这样的假定在某些时候存在着与实际不符的情况。博弈思维的原则是,站在对方的立场上看问题,把对方当成是理性人。但这则故事说明,生活中的人的行为不完全是理性的,博弈思维不总是有效的。人们进行博弈思维的基础是人具有的理性。然而,在某些情况下,理性思维不能使自己的利益最大,甚至阻碍利益的获得,而非理性思维反而能够获得极大的利益。
理论的假定与实际不符的另外一个例子是“彩票问题”。我们说理性的人是使自己的效益最大,如果在信息不完全的情况下则是使自己的期望效益最大,但是这难以解释现实中人们购买彩票的现象。
人们愿意掏少量的钱去买彩票,如福利彩票、体育彩票等,以博取高额的回报。在这样的过程中,人们自己的选择理性发挥不出来,而唯有靠运气。在这个博弈中,人们要在决定购买彩票还是决定不买彩票之间进行选择,根据理性人的假定,选择不买彩票是理性的,而选择买彩票是不理性的。
彩票的命中率肯定低,并且命中率与命中所得相乘肯定低于购买的付出,因为彩票的发行者早已计算过了,他们通过发行彩票将获得高额回报,他们肯定赢。在这样的博弈中,彩票购买者是不理性的。但在社会上有各种各样的彩票存在,也有大量的人来购买。可见,理性人的假定是不符合实际情况的。
当然我们可以给出这样一个解释:在购买彩票问题上,付出少量的金钱给购买者带来的损失不大,损失的效用几乎为零,而所能命中的期望也几乎是零。这时候,影响人抉择的是非理性的因素。比如,考虑到如果自己运气好的话,可以获得高回报,这样可以给自己带来更大的效用,等等。彩票发行者正是利用人存在着这样的心理而寻求保证赚钱的获利途径。
作为策略家进行博弈思维,其出发点就是,要时刻牢记,他人与我们一样,也是理性人,也有自己的目标。但有些时候,人们并不表现为理性的,此时,博弈思维不一定有效,在某些情况下,博弈思维反而有害。博弈论难以分析或解释人的情感领域里的行为。在人的情感领域里,人的行为是非理性的,人们的博弈思维无法施展。如果某人在感情问题上也采取博弈思维,那么他此时的行为倒是很可怕的。
海盗分金币
有一个与蜈蚣博弈相近的博弈,称之为“海盗分金”,据说这道博弈题是美国微软公司面试时的考题,如果有人能在20分钟之内回答出正确答案,他的年薪就可达到8万美元以上。
下面请看题目:
海盗,是一帮亡命之徒,在海上抢人钱财,夺人性命,干的是刀头上舔血的营生。在我们的印象中,他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝的习惯,而且总要画上一张藏宝图,以方便后人掘取。然而很少有人知道,海盗是世界上最民主的团体。参加海盗的都是桀骜不驯的汉子,富有独立精神。平时海盗们之间一切事都由投票解决。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。
现在船上有若干个海盗,要分抢来的若干枚金币。自然,这样的问题他们是由投票来解决的。投票的规则如下:先由最凶残的海盗来提出分配方案,然后大家一人一票表决,如果有50%或以上的海盗同意这个方案,那么就以此方案分配,如果少于50%的海盗同意,那么这个提出方案的海盗就将被丢到海里去喂鱼,然后由剩下的海盗中最凶残的那个海盗提出方案,依此类推。
我们先要对海盗们作一些假设:
(1)每个海盗的凶残性都不同,而且所有海盗都知道别人的凶残性。也就是说,每个海盗都知道自己和别人在这个方案中的位置。另外,每个海盗都是很聪明的人,都能非常理智地判断得失,从而做出选择。最后,海盗间私底下的交易是不存在的,因为海盗除了自己谁都不相信。
(2)一枚金币是不能被分割的,不可以你半枚我半枚。
(3)每个海盗当然不愿意自己被丢到海里去喂鱼,这是最重要的。
(4)每个海盗当然希望自己能得到尽可能多的金币。
(5)每个海盗都是功利主义者,如果在一个方案中他得到了1枚金币,而下一个方案中,他有两种可能,一种得到许多金币,一种得不到金币,他会同意目前这个方案,而不会有侥幸心理。总而言之,他们相信二鸟在林,不如一鸟在手。
(6)最后,每个海盗都很喜欢其他海盗被丢到海里去喂鱼。在不损害自己利益的前提下,他会尽可能投票让自己的同伴喂鱼。
现在,如果有5个海盗要分100枚金币,结果将会怎样呢?
此题公认的标准答案是:1号海盗分给3号1枚金币,4号或5号2枚金币,自己则独得97枚金币,即分配方案为(97,0,1,2,0)或(97,0,1,0,2)。现来看如下各人的理性分析:
首先从5号海盗开始,因为他是最安全的,没有被扔下大海的风险,因此他的策略也最为简单,即最好前面的人全都死光,那么他就可以独得这100枚金币了。
接下来看4号,他的生存机会完全取决于前面还有人存活着,因为如果1号到3号的海盗全都喂了鲨鱼,那么在只剩4号与5号的情况下,不管4号提出怎样的分配方案,5号一定都会投反对票来让4号去喂鲨鱼,以独吞全部的金币。哪怕4号为了保命而讨好5号,提出(0,100)这样的方案让5号独占金币,但是5号还有可能觉得留着4号有危险,而投票反对以让其喂鲨鱼。因此理性的4号是不应该冒这样的风险,把存活的希望寄托在5号的随机选择上的,他唯有支持3号才能绝对保证自身的性命。
再来看3号,他经过上述的逻辑推理之后,就会提出(100,0,0)这样的分配方案,因为他知道4号哪怕一无所获,也还是会无条件的支持他而投赞成票的,那么再加上自己的1票就可以使他稳获这100枚金币了。
但是,2号也经过推理得知了3号的分配方案,那么他就会提出(98,0,1,1)的方案。因为这个方案相对于3号的分配方案,4号和5号至少可以获得1枚金币,理性的4号和5号自然会觉得此方案对他们来说更有利而支持2号,不希望2号出局而由3号来进行分配。这样,2号就可以屁颠屁颠地拿走98枚金币了。
不幸的是,1号海盗更不是省油的灯,经过一番推理之后也洞悉了2号的分配方案。他将采取的策略是放弃2号,而给3号1枚金币,同时给4号或5号2枚金币,即提出(97,0,1,2,0)或(97,0,1,0,2)的分配方案。由于1号的分配方案对于3号与4号或5号来说,相比2号的方案可以获得更多的利益,那么他们将会投票支持1号,再加上1号自身的1票,97枚金币就可轻松落入1号的腰包了。
海盗分金币模型的最终答案可能会出乎很多人的意料,因为从直觉来看,此模型中如此严酷的规定,若谁抽到1号真是天底下最不幸的人了。因为作为第一个提出方案的人,其存活的机会真是微乎其微,即使他一个金币也不要,都无私地分给其他4个人,那4个人也很可能因为觉得他的分配不公而反对他的方案,那他也就只有死路一条了。可是看起来处境最凶险的1号,却凭借着其超强的智慧和先发的优势,不但消除了喂鲨鱼的危险,而且最终还使自己的收益最大化,而5号表面上看起来是最安全的,可以坐山观虎斗,先让前面的海盗拼个你死我活而坐收渔翁之利,可实际上最后却不得不看别人的脸色行事,勉强分得一杯小羹。
不过,游戏任意改变一个假设条件,最终结果都不一样。而现实世界远比游戏复杂。首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的游戏中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。
如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓!
再就是俗话所说的“人心隔肚皮”,由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5号大放烟幕弹,宣称对于1号所提出任何分配方案,他一定会再多加上一个金币给他们。这样,结果又当如何?
通常,现实中人人都有自认的公平标准,因而时常会嘟囔:“谁动了我的奶酪?”可以料想,一旦1号所提方案和其所想的不符,就会有人大闹……当大家都闹起来的时候,1号能拿着97枚金币毫发无损、镇定自若地走出去吗?最大的可能就是,海盗们会要求修改规则,然后重新分配。
而假如由一次博弈变成重复博弈呢?比如,大家讲清楚下次再得100枚金币时,先由2号海盗来分……然后是3号……这颇有点像轮流主政了。说白了,其实是民主形式下的分赃制。