理论上说,在围棋博弈中,信息是完全的,没有任何盲点。围棋作为争夺地域或空间的竞技游戏,有明确的目标结构、战略战术。即除了盘面上的选择,没有其他选择。另外,理论上说,博弈双方都知道对方有哪些选项,整个棋局的历史演进是明了的,自己想干什么,对手想干什么,互相之间没有秘密;围棋博弈在这种意义上是信息对称的博弈。作为博弈,棋手必须考虑对手可能的谋略、抵抗、反击,这是决策活动的主要制约条件。但是,我在上一节谈到,由于围棋的变化太多,要棋手完全算清所有变化是不现实的。那么在什么意义上我们可以说围棋是信息对称的呢?只有一种假定,即双方的围棋棋力相当,从而互相可以说没有秘密。这就是博弈论学者罗伯特·奥曼提出的“共同知识”假说,即我知道你知道什么,而且,我知道你知道我知道什么。这为“纳什均衡”理论提供了充分的认知基础。罗伯特·奥曼的对博弈论的贡献,使他获得了2005年诺贝尔经济学奖。
信息对称观(“共同知识”)在现实世界中(包括围棋)是否现实呢?当哈萨尼被美国裁军委员会邀请作裁军谈判研究时,他最初意识到的问题就是谈判各方对自己的优势、能力了解很清楚,但对对方了解甚少。同样,“商务公司对于与自己公司的运作有关的经济变量比对于与自己的竞争者运作有关的经济变量总是要更熟悉”。我在前面谈到围棋作为“话语”的公约性,也意味着手谈双方对对方能心领神会(信息的对称)。但是,难道话语的一方不会瞒天过海,甚至“误导”对手吗?从心理学角度说,博弈的优化决策的数学模型的论证是一回事,在现实中人们是否按照这一模式行事是另一回事。与奥曼同年获得诺贝尔经济学奖的托马斯·谢林对此有深入论述。
博弈双方在用战争还是和平手段解决利益冲突上都有“两败俱伤”的共同知识,但是博弈中产生的变数使回报(效用)上稍稍的不平衡就有可能使一方贸然选择风险更大的战争威胁。美国和朝鲜围绕后者研制核武器而展开的博弈充分证明这一点。谢林认为,这种策略效用的微妙变化是纯形式分析说无法掌握的:“没有经验证据,人们无法靠逻辑演绎出零和博弈的真谛,这就像我们无法依靠逻辑推论断定某个笑话一定会好笑一样”。他认为选择什么样的均衡关系,是“实验心理学可以对博弈论做出贡献的地方”。谢林进一步引入心理学因素,认为虽然和平总比战争强,但是,如果一方可能无法确信对方的诚信而引起紧张,就会使和平进程变得十分脆弱。这在巴勒斯坦和以色列的关系中尤其明显。共同知识是一回事,是否能领会对手在当下的情绪、动机、意图、意向,是另一回事。总之,行为经济学或实验经济学将心理学科(行为的实证研究)引入了以数学论证为主的经济学领域。另一方面,围棋作为人类的实践领域,也提供了大量信息对称和不对称的经验证明。
三、信息不对称性:博弈主体间的本质特性
从心理学着手的博弈论和从数学着手的博弈论是有巨大差别的。数学要求一个问题可以通过公式求解、证明,否则它就不成其为数学问题。心理学本质上是描述性和解释性的,是对现象作行为上的描述,同时对行为背后的心理根源作推测和验证。一个问题有数学上的解决,不一定具有心理学上的有效性和可行性。比如博弈论中最关键的参数是不同策略的“回报”(payoffs)。这种回报或收益的估计在心理学上如何实现,数学家不关心或者没有责任回答这样的问题,而心理学者必须回答。那么,博弈的心理学依据究竟是什么呢?简单地说,是根据经验对对手的意图和行为的预期,表现在棋类博弈上,如果自己这样走对手会如何应,结果大致会演变为怎样的局面?上一节我们看到职业棋手对“效率”确实有一种精微的把握。这可以作为信息对称的证据,在一定程度上支持了数学意义上的博弈论的观点,即“回报”对于棋手确实有可量化的一面,而且,双方对棋的效率和价值有相同的判断,在这个意义上,信息具有哈萨尼和奥曼所强调的对称性。但是,围棋也提供了博弈中信息不对称的大量例证,这主要是因为主观预期未必与客观现实和对手意图吻合。
首先,棋力的差异主要体现在信息不对称上,棋力弱的棋手相对较强的棋手,必然是知其一,不知其二。马晓春调侃道:“世界冠军的棋,你也看得懂?”讲的就是这种差异。两个棋手水平的差距越大,信息越不对称:你看到三分,对方看到了八分,所以你绞尽脑汁,还会输,对手能“多面打”,还能赢。棋艺的优劣,棋手的自信,如胡荣华大师所言,相当程度上取决于能否构建有效的对手的行为模型(目的、意向、计划、风格等),以此作为自己行动的重要依据。当然,棋力造成的信息不对称,与奥曼的“共同知识”论述没有矛盾。奥曼认为,人们正是通过学习达到信息对称(共同知识)的。与高手“手谈”就是一种直接在博弈中学习博弈的方式:学习他们的洞察力,他们思考问题的方法。
但是,还有一些场合,即使双方棋力相当,信息依然不对称。这是因为,虽然棋手理论上可以对“效率”作精确的计算,但他们建立的各种可能的模型时常是根据经验和心理预期,而不是做最充分的分析和计算(时间往往不允许)。我们在前面已经谈到了棋手的谋略,而谋略的前提是信息不对称:对手有所不知,此所谓明修栈道,暗度陈仓。围棋棋子都在明处,不像纸牌游戏,无法佯装。但围棋的复杂使人无法看清所有变化的结果,及各种结果的微妙关联,也无法看清对手的全部意图,给棋手施展计谋提供了用武之地。我在“运筹篇”引用的曹薰铉的例子就是一例。马晓春《三十六计与围棋》一书,讲的就是如何发挥想象力,达到“出奇制胜”的效果。出奇制胜,本身就隐含着运用想象力制造信息不对称的含义。瞒天过海,偷梁换柱,等等,都是信息不对称的妙用。
进一步分析,我们就可以看到,这种不对称是因为谋略者通过协调局部的战术特点和整体的战略意图来实现的。它源于对一步棋对全局和局部影响的周密考虑,所谓牵一发而动全身。能否协调和整合力量最大限度地稳固或扩张自己,遏制或打击对方,是围棋实力的重要标志。和空间关系的协调相关的是时序的把握,即围棋中常常强调的“次序”和“时机”。曹薰铉在上篇提到的战例中,次序细微到环环相生,丝丝入扣。次序在围棋中是一个极其重要的概念,它在政治、商业、军事行为和管理学上有广泛启示作用。次序是一个因果链问题,一个环节都不能差。在战术上走错一个次序,或漏走一步,都会无功而返,甚至铸成大错。在战略上不重视次序(如积蓄力量是重拳出击的前提),则要么是犯冒进的错误,要么是缺少建立战略优势的深远谋略。
信息不对称和计谋的成功,与棋手各自所处的位置和角度不同也有关。我们现在来做一个“思想实验”:想象一次对弈中,你拿的是白棋,棋下到90手,你判断你的白棋不错,这时,你被突然要求下对手的黑棋,而由对手来下你的白棋。这时,你会不会重新审视你原来的白棋,你对白棋是否不再那样乐观?你是否觉察到白棋先前没有被发现的弱点呢?不管怎样,你一定有一个调整自己思考问题的角度的问题,因为攻防的地位完全对换了,思考的角度也出现了变化。
我们在任何对抗竞技(如篮球中人盯人防守)中都能看到,防守方总是要比进攻方慢半拍。这是因为“出招”总是在先,“接招”总是在后。从心理学角度说,当棋手处于进攻姿态时,其倾向是无所不用其极,尽可能最有效地打击对方,确立优势。而当棋手处于防守方时,他(她)会根据经验判断有没有死活问题,是否需要补强,而不会像对方那样处心积虑,机关算尽。这就像匍匐在丛林里准备出击的狮子,它应该选取什么时机,猎物会怎样逃窜,它有什么对策,早有预谋。而防守方相对是被动的,一只羚羊在那儿可以万分警觉,但它还是无法完全知道猎豹的全部招数,也无法预测猎豹出击的时机。对棋手而言,攻击的预谋总要强于防守的缜密。第五届应氏杯常昊在对宋泰坤的决胜局中第116手过早消劫,没有防范对方在左上方的严厉攻击手段,差点失去进入决赛的机会。
信息不对称与攻防中计算的宽度和深度也有关。罗洗河对崔哲瀚的白2(见《知觉篇三》)的出乎意料的着法,按罗洗河自己说是“99%%的灵感,1%的诡道”。为什么会得手呢?这是因为进攻方专注的是计算的深度,即既定方案的可行性,战斗的最终结果问题;防守方专注的是计算的广度,即受到攻击的多种可能性,以及如何摆脱受攻状态。这种广度和深度的不对称,也许是导致崔哲瀚对白2 的缺少考虑的重要原因。攻防双方思考问题的“不对称性”,是以计算“回报”或“收益”为基础的博弈论不会考虑到的心理法则,也是使棋局跌宕起伏、精彩纷呈的重要原因。
信息不对称的最明显的例子,是“骗着”和“鬼手”。“骗着”就是利用对手的常规思路和期待,诱使对手下出随手棋来,埋藏下出其不意的好棋。如罗洗河对宋泰坤的两年前的一次对局,罗洗河下出一手反常的棋,常昊怀疑可能是“鬼手”,宋泰坤随手应了一下,由此埋伏下后来被罗洗河“挖”的致命一击。“鬼手”、“骗着”成功的前提是对手不会识破或看清,否则可能亏损。
博弈的信息不对称是理性决策的又一挑战,同时又为创造性谋略和想象提供了机遇。赛蒙、谢林、哈萨尼、泽尔腾都沿着阿尔弗雷·马歇尔所指的方向,向心理学靠近,更贴近现实中人的实际行为,对人的理性和非理性作出更深入的理解。塞蒙在他的1978年12月8日诺贝尔奖纪念演讲中谈到,管理科学中的决策理论关注的是如何决策,而不是应该做什么决定(theories%of%how%to%decide,%“rather%than%theories%of%what%to%decide”)。也就是说,决策理论应该把握的是程序理性(procedural%rationality),而不是内容理性(substantive%rationality)。这个观点今天依然是有启发的。在如何作决定上,围棋为研究博弈论提供了新的视野。围棋的实验和经验研究将为我们打开一扇窗口,看到行动中人的理性及其限度,而不是虚拟的逻辑理性。它没有数学的雄辩,却透露出古老的智慧。
)第三节 棋风=决策的稳定价值取向
风格即人。—— 布封
少考虑风格,多关心结果。——鲍比·奥尔
常昊三星杯对李昌镐决赛的第二局(见《决策篇一》图一),69手究竟是吃右边9子,还是左边跳起形成模样。前者获得实利并使黑棋中央十分厚实,但落了后手;后者赢得全局的主动和先机,但究竟能够获得多大实利无法准确判断。究竟哪一步更大,即使高手中也有分歧。正是这些不确定性提供了棋手表现不同个性的空间,风格由此凸现。
一、作为价值取向的棋风