为了鼓励合作,通常需要包含某种惩罚作弊者的机制。这种机制有助于减少双方作弊的动机。在一次性博弈中,这种机制的作用无法发挥,因为没有下一次的合作,作弊的行为也就无法得到惩罚。但在重复博弈中,一方背叛的出现,会在日后以损失的形式使其得到惩罚。如在迟到问题上,当迟到者没能准时到达时,其受到的惩罚远远超过其迟到的收益,因此故意迟到的行为最终会消失。
通常来说,一般性的惩罚在解决一些简单的问题上是有效的。但对于重大问题来说,则又另当别论。如在价格战中,虽然双方都签订了合作的协议,有的甚至还制订了惩罚的办法,但由于没有执行这一机制的保证,那么各方都有动机偏离合作,因为一方背叛的收益还是要远远高于合作的收益。
我们知道,在重复的囚徒困境中,签订合作协议并不难,制订一个简单的惩罚办法也不是一件困难的事情,真正具有挑战的事情是如何保证这一协议对双方都有约束力。如果协议签订之后,没有执行惩罚机制的约束,最后的结果还是会令人失望,博弈参与者在有限次重复博弈中仍有作弊的动机。
霍布斯曾经说过:“不带剑的契约不过是一纸空文。它毫无力量去保证一个人的安全。”也就是说,没有约束力的合作协议对合作毫无帮助。
在人类社会的长期博弈中,早已形成的法律可以说是对合作协议的有力保证。从博弈论的角度来看,法律就是通过第三方强制实施的行为规范,由于这一规范的强制性和权威性,能够促使惩罚机制可信且有效执行。在一种有效的法治环境中,法律可以改善囚徒困境。
我们来看这样一个例子。假设公司甲与公司乙是商业上的合作伙伴,公司甲经常向公司乙购买原材料,由于两家公司在不同的城市,于是两个公司经过谈判之后签订买卖合同,一般在一周最后的那一天,公司甲将现金打入公司乙的银行账户,公司乙则发货到公司甲,若违约则处以2倍罚款。
实际上,公司甲与公司乙都是理性人,他们的合作就是一个有限次数重复博弈,在社会不存在法律的情况下,在两个公司任何一次交易中都有可能存在其中一家公司不遵守合同,逃款或逃货的风险,即使公司甲现金充裕,而公司乙货源充足。
然而,在我们理想的法律环境下,两公司最佳策略都是合作。我们不妨假设公司甲与公司乙每年的交易都有十几次,平均每笔生意为100万,若违约则罚款200万。公司乙的产品成本为80万,公司甲受到产品后可获得净收益也为20万。
如果两公司都选择合作,双方收益均为20万(指两公司各自的利润);
如果公司甲合作,公司乙背叛,那么公司甲付款后,公司乙不发货,甲会损失100万,乙收益100万;
如果公司甲背叛,公司乙合作,那么公司乙发货后,公司甲不付款,公司甲收益120万(其中包含20万的利润),公司B损失80万(指公司B货物的成本,也就是收入减去利润);
如果两公司都背叛,公司甲不付款,公司乙不发货,双方收益为零。
在没有法律背景的条件下,双方选择不合作是自然的纳什均衡点。然而当引入强制性的法律时,结果就会有所不同,这时他们所签合同具有法律效应,一旦有一方违约,另一方有权罚款其200万元,并且法院可以强制执行。
在这种情况下,合作才是两个公司的最佳策略。简单说来,就是法律通过惩罚的有力保证,改变了两个公司博弈的均衡结果。
霍布斯认为,国家以法律形式规定对某种行为如“违约”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“违约”策略中获取的好处也大于他采劝守信”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是使得惩罚有效的一个重要前提。
在我们的社会中,当涉及公共物品时,普遍存在着“社会悖论”的问题。人类共有的资源是有限的,当每个人都从自身利益出发企图多占有一些资源时,就会产生个人利益与集体利益的冲突。公共地的悲剧、人口问题、大气污染等都可以在社会悖论中得以解释。在这些问题中,关键是要制订游戏规则来控制每个人的行为。
博弈智慧
作为第三方的法律无疑是一个有效的手段。法律以其强制性和至高无上的权威,能使所有的人都遵守法律的约定,包括制定与执行法律的人,否则必然要受到无法逃脱的惩罚。这一惩罚改变博弈的结果,使得合作得以促成。