经济学的产生基于两个条件:一个是人类欲望的无穷性,另一个是资源的稀缺性。博弈未尝不是基于这两个条件而形成。存在资源稀缺,存在多于两个及两个以上的竞争者,就会产生博弈。博弈的目的就是获取利益,利益形成博弈的基矗
一般来说,博弈是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。
目前我们对博弈有两个最基本的分类:一种分类方式是按照博弈各方是否同时决策,分为静态博弈和动态博弈,同时决策或者同时行动的叫做静态博弈,决策或行动有先后次序的叫做动态博弈。这里要注意的是,即使决策或行动有先后,但是只要局中人在决策时都还不知道对手的决策是什么,也属于静态博弈。关于这两种博弈在第十章有详述。
另一种分类方式是根据大家是否都清楚各种对局情况下每个局中人的得益,分为完全信息博弈和不完全信息博弈。本书介绍的主要是完全信息博弈,使用博弈矩阵,可以把各种对局情况下每个局中人的得益写得非常清楚。博弈论把完全信息这种情况,概括为“各种对局情况下每个局中人的得益多少,是所有局中人都清楚的”。
了解了博弈的基本分类后,为了进一步把握博弈对局,我们将通过下面的一个例子,来详细地解释一场博弈中的各个要素。
在原始社会,人们靠狩猎为生。为了使问题简化,设想村庄里只有两个猎人,主要猎物只有两种:鹿和兔子。在古代,人类的狩猎手段比较落后,弓箭的威力也有限。在这样的条件下,我们可以假设,两个猎人齐心合力,忠实地守着自己的岗位,他们就可以共同捕得一头鹿。但是如果他们各自行动,单兵作战,就只能各自抓住4只兔子。从能够填饱肚子的角度来看,4只兔子可以供一个人吃4天;1只鹿如果被抓住将被两个猎人平分,可供每人吃10天。也就是说,对于两位猎人,他们的行为决策就成为这样的博弈形式:要么分别打兔子,每人得4;要么合作,每人得10(平分鹿之后的所得)。如果一个去抓兔子,另一个去打鹿,则前者收益为4,而后者只能是一无所获,收益为0.
在这场博弈中,完整地包含着形成一场博弈所包括的四个要素。
两个或两个以上的参与者,即“博弈方”。在一场博弈中,要求必须有两个或两个以上独立决策并承担相应后果,且以自身利益最大化为最终目的来选择行动的决策主体。博弈的规则一经确认,各个参与者的地位都是平等的,都必须严格按照规则来办事。在实际当中,只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。在上面的猎鹿博弈模型中,如果只有一个猎人,就不存在博弈的问题。
例如《鲁滨孙漂流记》里面的鲁滨孙,自己一个人生活在单独的岛屿时,他自己组成了一个独立的经济系统,不存在博弈的问题。从经济学的角度来看,如果是一个人做决策而不受他人干扰的话,那就是一个传统的最优化问题,也就是在一个既定的局面或情况下如何决策的问题。然而“星期五”的加入,就使得鲁滨孙不再是独立的系统,他的决策就要受到星期五的影响,经济系统就形成一个博弈的问题。
博弈要有参与各方争夺的得失或收益。一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。
在上面的例子中,博弈各方不同的决策会导致不同的得失结果。如果两位猎人各自分别打兔子,每人得4;如果两人合作打鹿,每人可得10.而如果一个去抓兔子,另一个去打鹿,则前者的收益为4,而后者只能是一无所获,收益为0.
参与者拥有一定的信息。这主要是指参与者在博弈过程中掌握的对选择策略有帮助的情报知识,特别是有关其他参与者的特征和行动方面的知识。现代社会,信息已经成为取胜的关键。谁先掌握了信息,谁就占领了主动权。
在猎鹿模型中,我们假设两个猎人之间的博弈是完全信息博弈,双方对于他们选择策略的收益彼此都是清楚的。
参与者要有自己能够选择的策略。这指的是参与者选择的全部行为或策略的集合。在博弈的过程中,经常出现的状况是在参与者的身边时常充斥着其他具有主观能动性的决策者,他们的选择与其他博弈参与者的选择相互作用,相互影响。这种互动关系很自然地会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响博弈结果。
在博弈中,每个参与者对于局势和整体状况进行分析,确定局势特征,找出其中关键因素,为达到最重要的目标进行手段选择。在同一个博弈中,不同参与人的可选策略或行为的内容和数量也通常不同,有时只有有限的几种,而有时又可能有许多种。在博弈中,策略的选择常常是牵一发而动全身的,常常对整个局势造成重大的影响。
在猎鹿博弈中,每个猎人都有两种策略可选择:合作猎鹿,各自打兔。两人必须分析各自采取特定的策略与他人采取策略时的各种情形,从而选择最大化自己受益的策略。
为了帮助大家更好地分析博弈局势,我们在此将常用的支付矩阵列出,并运用划线法来给出博弈结果。
设博弈模型的局中人Ⅰ位于支付矩阵的左侧,而局中人Ⅱ位于支付矩阵的上方。支付矩阵中每一格左边的数表示局中人I的收益,支付矩阵中每一格右边的数表示局中人Ⅱ的收益。这样,两个局中人不同的策略选择都可以组合为不同的支付函数。如,猎人A和猎人B都选择合作猎鹿时,猎人A所得的收益是10,猎人B所得的收益也是10.类似的,你可以说当猎人A选择各自打兔,猎人B选择合作猎鹿时,前者所得的收益是4,后者的收益是0.
划线法的法则是:
给定局中人Ⅱ的策略,在局中人I的每个策略选择对应的收益中选择最大的数,在选择的数的下方划一短线以作标志。给定猎人B选择合作猎鹿,那么猎人A的两个策略对应的收益分别是“10”和“4”。显然,应该在“10”下面划线。给定猎人B选择各自打兔,那么猎人A的两个策略对应的收益分别是“0”和“4”,这样,就应该在“4”的下面划线。
给定局中人Ⅰ的策略,在局中人Ⅱ的每个策略选择对应的收益中选择最大的数,在选择的数的下方划一短线以作标志。给定猎人A选择合作猎鹿,那么猎人B的两个策略对应的收益分别是“10”和“4”,显然,应该在“10”下面划线。给定猎人A选择各自打兔,那么猎人A、B的两个策略对应的收益分别是“0”和“4”,这样,就应该在“4”的下面划线。
若在支付矩阵中存在双划线的格,即格中的一对数,左边的数及右边的数下方都有短划线。则此格对应的结局,就是博弈的解。上面的矩阵中,通过划线法,我们已经看到这个博弈有两个均衡解:(10,10),(4,4)。
博弈智慧
若支付矩阵中不存在双划线的格,则表示这个博弈不存在纯策略意义上的纳什均衡。也就是在纯策略意义下,此博弈无解。