“囚徒困境”是博弈论中最有名的范例。1950年,就职于兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔拟定出相关困境的理论,后来由顾问艾伯特·塔克以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
警方逮捕了两名嫌疑犯,但是没有足够的证据证明他们两个有罪。警方现在面临的情况是:
(1)如果两个犯人都保持缄默,那么由于警方没有足够的证据,两人会在被监禁半年后获得自由。
(2)如果一人招供一人不招供,那么就会判处保持缄默的人10年有期徒刑,而招供的人会因为与警方合作而被无罪释放。
(3)如果两个人都招供,那么两人都会获得2年的有期徒刑。
警方把两个罪犯分别囚禁在两个牢房里,并分别告知他们自己面临的处境。可能你会认为他们两个都不会招供,但是,警方会运用博弈论引诱他们双方互相陷害。
警方会对其中的一个罪犯(罪犯甲)说:
如果另一个罪犯(罪犯乙)招供,那么他(犯罪甲)面临的处境是:如果招供,他会获得2年的有期徒刑;如果不招供,他会被判处10年的有期徒刑。所以,在对方招供的情况下,他选择招供会获得比较轻的惩罚(2年的有期徒刑总比10年好)。
如果罪犯乙选择不招供的话,那么罪犯甲面临的处境是:如果招供,那么他可以当庭无罪释放;如果不招供,那么他会获得半年的有期徒刑。所以,在对方不招供的情况下,他选择招供是对自己最有利的(当庭释放必然要比半年监禁更好)。
警方把上面的情况告诉罪犯甲之后,相信罪犯甲会明确地知道:不论对方选择招供还是保持缄默,选择招供对于他来说都是最好的。
既然这招对罪犯甲有效,警察就可以运用相同的手段,让罪犯乙也招供。警方巧妙地运用了博弈论,诱使双方都招供,从而把两名罪犯都判处了2年的有期徒刑。
如果两个人同时选择沉默,那么实际上两个人只要坐半年牢,就能获释。但是作为理性人,两人在都为自己的利益考虑之后,会同时招供,结果都要坐两年牢,才能获得自由。
如果我们把这个道理说给他们两个听,他们会改变自己的选择吗?肯定是不会的。在博弈论的领域中,大家都只会考虑到自己的利益。他们都不会冒险保持缄默。因为如果此时对方招供,那么自己面临的将是10年的有期徒刑,即使某个罪犯能说服对方保持缄默,招供对他来说依然是最好的选择。
我们再来换一个场景,如果两个罪犯事先讲好,就算是被警方逮捕了,也绝对不会招供,那么情况会有所改观么?答案是,如果这是一个一次性博弈,也就是说两人做完这个案件之后再也不会合作了,那么双方都不会选择缄默。恰恰与我们所想要的结果相反,两个人会更急切地想要招供。因为事先的约定会让对方保持缄默,只要自己选择招供,就一定能无罪释放,而不用承担获得2年有期徒刑的风险。当然,在这种情况下,他的同伴会被判处10年的有期徒刑,但是这又怎么样呢?反正这是一个一次性博弈,以后他也没有机会对自己施以报复。
但是,如果把两个罪犯放到同一个审讯室里审讯,结果又会怎样呢?这时,囚徒困境基本上就不会发生了。因为被分开审讯时,两人都会怀疑对方不会选择缄默,所以能得到对警方有利的结果。但是,在同一个审讯室里,两个人会受到对方的影响,选择就会发生改变。这也是为什么在现实中警察会把同一个案件中的犯罪分子分开审讯的原因。
我们的假设一直都建立在两个犯罪分子都为理性人的基础上,但如果他们两个都是非理性人呢?很可能最后的结果就是我们想要的:两人同时保持缄默,在被剥夺自由半年之后获释。这是不是说明了在现实中理性人反而会得到不好的结果?不是的,理性只对自己最有利,但是如果你的对手也是理性的,那么结果就会变成两败俱伤。最好的结果是,你是理性的,而你的对手是非理性的。
现在我们看到了两个解决囚徒困境的办法:把两个犯罪分子放到同一个审讯室审讯;两个犯罪分子中有非理性人。还有其他的方法吗?有的,我们至少还能再想到两种方法:一个是把一次性博弈变成重复性博弈,并在事先约定大家在被捕后都选择缄默。因为如果你们还会继续博弈的话,那这次就不能背叛约定,否则对方可能会在下次博弈时报复自己,这对自己也是不利的。第二个方法是,增加招供的代价。比如,在犯罪分子中建立一个组织,如果有人在被捕后招供,该组织负责将这个人暗杀。在这个博弈中,由于外部力量的介入,如果选择招供,反而会有更大的牺牲,因此两个罪犯都会选择缄默,从而得到在囚徒困境中不能得到的结果。从这个分析中得到的结论是:犯罪的时候,选择参加某个组织,而不是单干,是有好处的。这也是为什么犯罪团伙的犯罪分子会比独自行动的犯罪分子更加猖獗的原因。
博弈智慧
如果你的同伴是投机者,那他仅仅会考虑这次博弈中是否能得到比较好的结果,而不会预期将来还会与你合作。所以,在你们俩同时被抓起来时,他会毫不犹豫地选择招供,以期获得释放。因此,当你在选择同伴时,如果知道对方是投机者,就要格外小心才好。