对策决策是竞争性的决策,是决策者在与对手之间的竞争中,利用掌握的有效信息,采取使自己处于有利地位的行动方案的过程。虽然对策理论的形成只是近几十年的事,但朴素的对策思想在古代就产生了。例如,“田忌赛马”就是一个典型的对策例子。
在战国时期,有一天,齐威王提出与田忌赛马。双方约定各选三匹马参赛,比赛分三轮进行,每轮各出一匹马,以千金为注。虽然同序的马(上、中、下)都是齐王的好于田忌的,但田忌的上、中马却可取胜齐王的中、下马。于是田忌的谋士孙膑让田忌以他的下马对齐王上马,以上马对齐王的中马,以中马对齐王的下马。于是田忌一负二胜,赢得了千金。由此看来,他们各自采取什么样的出马顺序对策对胜负是至关重要的。
一、对策行为的基本要素
对策行为具有三个基本要素,即局中人、策略和赢得函数。分析对策行为首先必须清楚这三个基本要素。
1.局中人
在一局对策中,有权决定自己行动方案的参加者称为局中人,通常用P表示局中人的集合。“齐王赛马”的局中人集合可表示为:P=(齐王,田忌),一般一个对策行为中至少应有两个局中人。
局中人这一概念具有广义性,可以理解为一个人,也可以理解为一群人,甚至是一种自然事物。比如在扑克游戏中,虽然有4个人参加,但由于对决的双方是联盟关系,有着完全一致的目的,对决一方只能看成为一个局中人,所以系统中的局中人有两个;再如,在研究不确定气候条件的生产决策时,大自然成为对策行为的一方。需要强调的是,在对策行为中总是假设每个局中人都是“理智的”决策者,不存在利用他人失误来扩大自身利益的可能性。
2.策略
在一局对策中,可供局中人选择的完整的行动方案称为策略。所谓完整的行动方案是指一局对策中自始至终的全局规划,而不是其中某一步或某几步的安排。在“齐王赛马”这一例中,如果用(上、中、下)表示上、中、下马参赛的顺序,那么(上、中、下)便是一个完整的行动方案,即为一个策略。显然局中人齐王和田忌各自都有(上、中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(下、上、中)、(下、中、上)六个策略。
3.赢得函数
在一局对策中,局中人使用每一策略都会有所得失,这种得失可能是胜利或失败、收入或支出以及名次的先后。每个局中人在一局对策中的得失,通常不仅与其自身采取的策略有关,而且还与其他局中人所采取的策略有关。也就是说,每个局中人的得失是全体局中人所采取的一组策略的函数,这一函数称为局中人的赢得函数。在“齐王赛马”这一引例中,当齐王和田忌各自采取不同策略时,齐王的赢得函数值。
在一局对策中,各局中人所选定的策略所形成的策略组称为一个局势,如果用si表示第i个局中人所采取的策略,则n个局中人所形成的策略组S=(s1,s2,……,sn)就是一个局势。当局势出现后,对策的结果也就随之确定了,即对任意一个局势S,局中人i可以得到一个赢得Hi(S)。
二、对策的分类
现代对策论内容十分丰富,总体上可分为静态对策和动态对策两大类。在静态对策中,由于大多数对策均与局中人的特定行为有关,因此,按照局中人是否允许合作,又分为结盟对策与不结盟对策。结盟对策又可分为联合对策和合作对策。在不结盟对策中,按局中人拥有策略的多少分为有限对策和无限对策;按局中人数量的多少分为两人对策或多人对策(n>2);按对策值总和是否为零分为零和对策和非零和对策等。这些分类的各种组合又形成各种类型的对策模型,如两人有限零和对策、多人无限零和对策等。