一对恋人好比一对囚徒,囚于情丝编织的牢笼,并在牢笼里上演着爱情的博弈,谁输谁赢,往往靠的不是情深爱笃,而是博弈手段的高低优劣。在恋爱的这场不太好玩的“游戏”中,谁能熟练地驾御游戏或博弈规则,谁就是爱情的赢家。
我们总说做事情不能蛮干,爱情也同此理,不能蛮爱,要讲究技巧,讲究手段,讲究规则,从而学会与恋人合作,学会对付对方的不合作,至少不被对方所欺骗。
为爱情盲目牺牲自己精力、财力、时间、前途乃至生命的人,简直是糊涂透顶,被对方涮了,还不以为耻,反以为荣,且美其名曰“我忠实于爱情”。我不是说你的真情可耻,真情从来都是可歌可泣的,我是说你的“爱令智昏”是可耻的。
恋人,既是你的合作伙伴,也是你的对手,甚至敌人。所以,要想在恋爱中成为赢家,你要学会与伙伴一样的恋人合作,也要学会与敌人一样的恋人周旋。面对对手围追堵截的爱情围剿,你要学会闪转腾挪的诸多反围剿手段。实在不行了,再三十六计走为上:对不起,不陪你“玩”了!
几乎所有的博弈论书籍,都从经典的囚徒困境说起。虽然那是说一对纵火犯的,但其原理也照样适用于“纵爱犯”。爱,本来也就是一场火嘛,所以爱情的囚徒也都可以看成是纵火犯。
还是让我们看看纵火的囚徒是怎样走出困境的吧!
所谓“囚徒困境”,说的是这样一个事例,此例版本不一样,但道理是一样的。
一场火灾之后,两个嫌疑人被囚禁,分别关在两个独立的不能互通信息的房间里。这可以被看成是一个纯粹的试验,没有任何社会意义或政治意义。实验的前提是,如果两人都承认,则各被扣留8年,如果一人承认另一人不承认,承认的放走,并且得到奖赏,不承认的被扣留10年,并且被罚款,如果都不承认则因证据不足各被扣留1年。
我们看到,假定A选择承认的话,B最好是选择承认,否则就要被处罚;假定A选择否认的话,B最好还是选择承认,因为这样可以被放走,还可以得到奖金。即是说,不管A承认与否,B的最佳选择都是承认。反过来,同样地,不管B承认与否,A的最佳选择也是承认。结果,两个人都会选择承认的。
这就是有名的“囚徒困境”,在生活中这种情形并不存在,它只是一个理论模型,所反映的问题是个人理性和集体理性的矛盾。理性告诉被实验者,谁选择抵赖,谁就可能会大倒其霉,而对方却逍遥自在,受到奖励。所以,就出现了这样一个悖论,有时对同伙的忠诚,往往会把自己送上绝境,除非双方都能100%的忠诚,但,这是不可能的,谁能在巨大的利益诱惑面前永远不动心呢?
恋爱中的人,也类似于走入了囚徒困境。如果双方都不变心,那是最好的结局,在天愿为比翼鸟,在地愿为连理枝嘛;如果都变了心,效果也不坏,你走你的阳关道,我过我的独木桥嘛;如果一方变了心,另外找到了更好的情侣,一方却还傻乎乎地忠贞不二,那么,另觅新欢的一方是幸福的,比两人都不变心的结果还幸福,因为他找见了更好的情人,而被抛弃的一方是最不幸的,比两人都变心的结果更不幸,因为他承担的压力既来自于对方的太幸福,也来自于自己的太不幸福。
按照囚徒困境的分析结论,恋人最好是都防范对方一些,不奢望天荒地老,也不怕分道扬镳,怕只怕对方另有所爱而自己却还执迷不悟。所以,恋人最天真的选择是天荒地老,最理性的选择是分道扬镳,最糟糕的选择是被另有新欢的对方无情抛弃。既然天真的结局过于不真实,糟糕的结局过于心痛,那么唯一的出路就是要么不再付出爱,要么有所保留的爱,千万别把爱当成生命来对待。
但是,现实中的恋人,大都希望天荒地老,没有谁愿意回头是岸,甚至被对方抛弃了也不死心。为什么会这样呢?
因为纵爱的恋人与纵火的囚徒,其博弈状况有一个重大的不同。囚徒被警方抓住之后,是隔离审查的,因此无法订立功守同盟,即便能够订立,谁能保证自己或对方永远不毁约呢?
恋人就不一样了,他们被爱情抓住以后,一般并不是隔离的,而是整天泡在一起。泡在一起干什么呢?除了发誓,还是发誓!人生发誓最多的时期,大概就是恋爱期。发什么誓呢?无非就是什么非你不娶啊非你不嫁啊的一类誓言罢了,目的只有一个,就是让对方相信自己能够天荒地老而此情不渝。他们希望彼此忠诚,从而换来一个好的博弈结果。而且为了防止对方变心,总要设法让对方相信,遇到我是你三生有幸,而我遇到你也是万世不毁。
可是,世间没有什么誓约是永恒的。所有爱情的悲剧,都从背弃誓约开始,而天下又似乎没有没有誓约的爱情。
天各一方的恋人,更不容易恋爱成功,像被隔离审查的囚徒一样,除了违背誓约,他没有更好的选择。
所以,要想在恋爱中成为赢家,你最好是不遵守爱的诺言,如此才能走出“囚徒困境”。
然而,这个结论在实际上是有问题的。因为,恋爱成功的人并不少见,厮守一生的人也不少见,你不能说他们都是勉强的。
我相信,多数情侣的爱情生活过得还是可以的。那么,究竟是什么机制让他们信守誓约呢?
这也可以从博弈论中找到答案。
这个问题的答案大部分归功于美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家,他组织了一场计算机竞赛。这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于,他们不只玩一遍这个游戏,而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。
“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且,这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合,则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次,则双方就建立了各自的历史档案,用以记录与对手的交往情况。同时,它们各自也通过多次的交手树立了或好或差的声誉。虽然如此,对方的程序下一步将会如何举动却仍然极难确定。实际上,这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗?或者,它能总是采取背叛行动吗?它是否应该对对手的举动回之以更为复杂的举措?如果是,那会是怎么样的举措呢?
事实上,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报。我把它叫做“以其人之道,还治其人之身”。
“一报还一报”的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方,从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,它的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是“简单明了的”。