为了进一步说明博弈如何达到“均衡”的结果,我们可以以两大杂志为例来演示这一过程。
美国有两大著名的杂志:《时代》和《新闻周刊》。每个星期,《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。
他们这么做的时候,很清楚此时《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情,而他们的对手显然也知道这一点……这两家新闻杂志投入了一场策略博弈中。
由于《时代》与《新闻周刊》的行动是同时进行的,双方不得不在毫不知晓对手决定的情况下采取行动。等到彼此发现对方做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期很可能竭力反扑,不过,等到那时,说不定已经出现了一个完全不同的新的形势,开始了又一场完全不同的博弈。
在这场同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。那么两大杂志该如何确定自己的最佳策略呢?
我们假定本周有两个大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻作为封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面故事,那么感兴趣的买主就会平分为两组,一组买《时代》,另一组买《新闻周刊》。
假如《时代》和《新闻周刊》都采用预算问题作为封面故事,那么两家就会平分“预算问题市潮,分别得到全体读者的15%;
假如《新闻周刊》采用艾滋病新药做封面故事,《时代》采用预算问题,《新闻周刊》可以得到整个“艾滋病新药市潮(即全体读者的70%),《时代》只会得到整个“预算问题市潮(即全体读者的30%);
假如《新闻周刊》采用预算问题做封面故事,《时代》采用艾滋病新药,《新闻周刊》可以得到整个“预算问题市潮(即全体读者的50%),《时代》只会得到“艾滋病新药市潮(即全体读者的70%);
假如《时代》和《新闻周刊》都采用艾滋病新药作为封面故事,那么两家就会平分“艾滋病新药市潮,分别得到全体读者的55%。
简单分析便可看出,两大杂志都选择“艾滋病新药”做封面故事是唯一的纳什均衡点。
对《时代》来说,如果《新闻周刊》采用艾滋病新药做封面故事,那么,假如我采用预算问题,就会得到整个“预算问题市潮(即全体读者的30%);假如我采用艾滋病新药做封面故事,两家就会平分“艾滋病新药市潮(即我得到全体读者的35%),因此,“艾滋病新药”为我带来的收入就会超过预算问题。如果《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用“艾滋病新药”,就会得到70%的读者;因此“艾滋病新药市潮同样会为我带来更大的收入。分析到这里便可以看出,《时代》杂志有一个优势策略,就是采用“艾滋病新药”做封面故事。无论《新闻周刊》选择采用上述两个新闻当中的哪一个,这一策略都会比其他策略更胜一筹。类似的,对于《新闻周刊》来说也是如此,“艾滋病新药”也是其优势策略。
在这个博弈里,双方都有一个优势策略。所谓优势策略就是指无论对方选择何种策略,我选择的策略总是最优的,对方选择哪种策略与我无关。以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。
在囚徒困境中,两个参与者都有一个优势策略,那就是选择“招供”。对于任何一个囚犯,不论另外一个囚犯选择什么策略,“招供”都是优势策略。
有时候,某参与者有一个优势策略,其他参与者则没有。这时可以通过剔除劣势策略的方法来找到纳什均衡点。
所谓劣势策略是指相对于其他任何策略,这一策略最为劣势。假如支付矩阵里一方有一个劣势策略,就应该避免采用,并且应该知道另一方若是有一个劣势策略,他也会规避。假如你只有两个策略可以选择,其中一个是优势策略,那么另一个一定是劣势策略。既然劣势策略参与博弈的双方都会规避,我们就可以在支付矩阵里剔除这一策略。这样,当某参与者有一个优势策略,另一个参与者没有时,可以进一步剔除劣势策略缩小整个博弈的支付,降低博弈的复杂度。
当然,规避劣势策略的做法在至少一方拥有至少三个策略选择的博弈中应用更为广泛。在没有优势策略的情况下,可以一步步地剔除所有劣势策略。在这么做的过程当中,可能会在较小的博弈里出现优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩小整个博弈的规模,降低博弈的复杂程度。利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂度已经降到最低限度。
我们这里仅以较为简单的二个策略矩阵为例来说明。
回到上面的例子,略微修改一下《时代》与《新闻周刊》的封面故事大战的内容:假设全体读者略偏向于选择《时代》。两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。
在这样的情况下,对于《时代》,“艾滋病新药”仍然是优势策略,但对于《新闻周刊》就不再是了,因为《时代》的优势策略是选择艾滋病新药这个主题,如果它也做同样选择,那么只能得到28%的读者,小于选择预算问题的30%。
这时,《新闻周刊》的最佳选择就依赖于《时代》的策略。假如《时代》选择“艾滋病新药”,《新闻周刊》选择“预算问题”就能得到更好的销量,对于《新闻周刊》,“预算问题市潮总比“艾滋病新药市潮要大。但是《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过这其实是可以分析出来的。因为《时代》有一个优势策略,那么另外一个就一定是劣势策略,他们一定不会选择。因此,《新闻周刊》的编辑们可以很有把握地假定《时代》已经选了“艾滋病新药”,并据此选择自己的最佳策略,即“预算问题”。
在前面的智猪博弈中,我们也可以运用这一方法。对于小猪来说,无论大猪踩不踩踏板,小猪不踩踏板总是最优的选择。但是大猪没有优势策略,因为大猪的策略随着小猪策略的改变而改变,若小猪踏则大猪最好不踏,若小猪不踏则大猪最好选择踏。
那么,这个博弈的稳定结果将是怎样的呢?不妨这样来考虑,既然不踩踏板是小猪的优势策略,踩踏板就是小猪的劣势策略。而劣势策略是参与者永远不会选择的,因此就可以把“踩踏板”这个策略从小猪的策略集合中剔除出去。大猪作为“理性人”,显然知道这一点,因此在小猪选择“不踩踏板”的情况下,大猪的最优选择就是“踩踏板”。
博弈智慧
在生活中,不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。