一个冬日的午后,我在杜兰特酒店(加州大学伯克利分校附近的一家精品酒店)与泰特罗克共进午餐。他的表现足以证明自己是狐狸型专家:柔声细语,严谨治学,每次回答我的问题之前都会停顿二三十秒(唯恐给我的答复太仓促)。
泰特罗克问我:“成为公众学者的动机是什么?一些学者非常低调、避开公众视线,但另外一些人则急切地想成为公众学者,高调、张扬、引人注目,这样才更有可能吸引众人的眼球。”
换句话说,高调、夸大的刺猬型预测更有可能使你成为电视中的公众人物。曾任美国前总统克林顿顾问的迪克·莫里斯现在是《福克斯新闻》的评论员,他是典型的刺猬型专家,他的策略就是抓住一切机会做出惹人注目的预测。2005年,莫里斯称,小布什总统处理卡特里娜飓风的方式会使他重新赢得民众的支持。2008年美国总统大选前夕,莫里斯预测奥巴马会赢得田纳西州和阿肯色州的竞选。2010年,莫里斯预测共和党人会轻而易举地赢得美国众议院的100个席位。2011年,莫里斯预测唐纳德·特朗普会竞选共和党候提名选人,并极有可能获胜。
然而,所有这些预言最终都落空了。卡特里娜飓风是小布什政府走向终结的开始,奥巴马在田纳西州和阿肯色州的竞选以惨败收场——实际上,奥巴马在这两个州的表现比4年前与小布什争夺美国总统宝座的约翰·克里的表现还要糟糕。2010年11月共和党人确实有所收获,但他们只赢得了众议院的63个席位,而不是莫里斯所说的100个席位。莫里斯坚持认为特朗普会竞选共和党提名候选人,但在他做出预测后仅仅两周,特朗普就宣布退出了。
但是,莫里斯思维敏捷,说话风趣,非常善于推销自己——他在《福克斯新闻》中有固定的栏目,他所著图书的销量也高达几十万册。
狐狸型专家有时对刺猬型专家游走于电视节目、商业和政治活动的做法很难苟同。狐狸型专家认为,许多问题难以预测,所以我们应该对这些不确定性进行解释。他们的这种做派会让人误认为他们缺乏自信,他们的多元方法也被误解为缺乏确定性。杜鲁门总统曾经提出一个著名的论断,说自己需要一个“独臂经济学家”,他觉得那些狐狸型专家根本无法为自己的决策提供任何确定性的意见。
但是,狐狸型专家偶尔也会做出很好的预测。他们能较快地意识到数据的嘈杂,而不去盲目跟踪错误的信号。与刺猬型专家相比,狐狸型专家更清楚自己还有很多无知之处。
如果你想让医生为你预测某种药物的疗效,或是想让投资顾问为你估算养老金的最大回报,那你最好选择狐狸型专家。他们可能会很谦逊地说自己的能力有限,但是成功的把握其实很大。
政治预测为什么常常失败?
在进行政治预测时,狐狸型专家的态度也许尤为重要。在进行政治展望时,刺猬型专家很容易落入陷阱,而狐狸型专家却能小心地绕过这些陷阱。
其中一个陷阱就是党派意识形态。尽管莫里斯一直以克林顿总统顾问的身份出现,却常被视为共和党人,并且为共和党候选人筹集资金,他保守的观点与《福克斯新闻》的风格也很吻合。但是,自由主义者却极有可能成为刺猬型专家。在对“麦克劳夫伦讨论小组”成员预测的精确性进行研究时,我发现,埃莉诺·克里夫特通常是小组成员中最自由的,她几乎从不发表对共和党特别有利的预测,总是跟小组里其他成员的总体意见相左。也许正是因为这一点,她才在2008年美国总统大选的预测中尝到了甜头,然而久而久之,她的预测也和保守派一样不准确了。
与泰特罗克的研究对象相似的那些专家学者,可能都会遇到同样的问题。实际上,对于拥有博士学位的刺猬型专家而言,一知半解是很危险的事。泰特罗克还有一些更重要的发现,其中之一便是,狐狸型专家的经验越丰富,预测就越准确,而刺猬型专家则恰恰相反:他们获得的额外信息越多,表现得就越糟糕。泰特罗克认为,刺猬型专家掌握的事实越多,他们以自己的方式改变且操纵事实的机会就越多,而这些方式往往会强化他们的个人偏见。如果你让一个忧郁症患者待在一个可以上网的黑暗房间里,就会出现类似的情况。你给他的时间越多,他要处理的信息越多,他最后得出的自我诊断也就越荒谬,不久之后,他就会把普通感冒误认为腺鼠疫了。
泰特罗克发现“左翼”和“右翼”两派刺猬型专家都会做出格外差劲儿的预测,但是所有政治派别中的狐狸型专家都不会出现这样的问题。狐狸型专家也许内心也会强烈地期待一种理想状况的出现,但他们在对现实情况和未来可能出现的情况进行分析时,通常可以将自己的理想与现实状况区分开来。
相反的,刺猬型专家总会将自己固有的偏好与分析的问题混为一谈。用泰特罗克的话说就是,他们创作了一个将“真相与个人价值观搅和在一起的混合体”。他们对证据总是带有偏见,仅凭个人喜好取证,不尊重客观事实。
你可以用泰特罗克的测试为自己作个诊断,看看你是不是一个刺猬型的人:在获得更多信息的时候,你的预测准确率是否有所提高?理论上来说,拥有更多信息会让你的预测能力如虎添翼,不过你也可以忽略那些没用的信息。但是,刺猬型专家做不到这一点,他们经常会陷入信息荆棘之中,无法自拔。
《国家政治内幕期刊》(下文简称为《国家期刊》)曾经作过一项调查,对象是政治家、政治顾问、民意测验人和评论员,人数大约为180位。这项调查在民主党和共和党中分别展开,但是两个党派的受访人员回答的问题是一样的。抛开政治派别不谈,这组受访人员都比较接近刺猬型:那些政治活动家以身上的战争创伤为荣,并且发现自己一直都在与另一派别——鸡尾酒会派——进行无休止的斗争。
2010年美国总统中期大选前期,《国家期刊》要求专门小组成员讨论民主党是否有可能继续掌控参众两院。大家几乎一致认为,民主党会掌控参议院,而共和党会掌控众议院(事后证明这两项猜测都是对的),两党的成员也基本同意由共和党获得众议院的大部分席位。民主党的专业人士呼吁本党派要拿到其中47个席位,而共和党则预测民主党将获得53个众议院席位,考虑到众议院中有435个席位,两党之间的预测差别可以忽略不计。
同时,《国家期刊》还要求专门小组成员对11场个人竞选的结果进行预测,包括参议院、众议院和州长竞选,但这一次的预测结果则颇有出入。在预测内华达州、伊利诺伊州和宾夕法尼亚州的参议员竞选、佛罗里达州的州长竞选和艾奥瓦州的关键众议院竞选中,小组成员的意见产生了分歧。整体上看,支持共和党的成员预计民主党只会赢得11场竞选中的一场,而支持民主党的成员则预计自己的党派会赢得6场竞选。(实际结果是两派预测的中间值——民主党最终赢得了11场竞选中的3场。)
很明显,党派偏见对预测产生了一定影响:民主党和共和党成员都会从自己的党派利益出发去考虑问题。然而,这并不足以解释为什么小组成员在回答不同类型的问题时会出现不寻常的分歧。当问及一般问题时,如共和党人可能会有何种表现,小组成员之间的答复几乎没有什么区别。但当问及具体问题时,他们的答案就会大相径庭,党派分歧就会显现出来。
刺猬型专家掌握太多信息可不是一件好事。共和党会赢得多少席位终究是一个抽象的问题:除非你仔细地研究了全部435场竞选,否则没有多余的细节能帮你解决这个问题。相反,当问及某一次竞选时,比如内华达州参议员竞选,小组成员就需要处理各种各样的信息:这些信息不仅包括投票数,还包括自己读到的相关新闻报道、有可能是从朋友中打听到的小道消息,以及他们在电视上看到候选人时想到的。他们甚至与候选人相熟,或者认识候选人身边的工作人员。
刺猬型专家一旦掌握大量信息就会编一些故事,这些故事甚至比真实世界发生的事情更有条理、更加有序,有主角和反派、胜者和败者、高潮和结局,通常以大团圆结局收场。竞选票数低10个点的候选人将会取得最后的胜利,你若问刺猬型专家为什么会这样,他会说,因为“我”了解这个候选人,“我”了解她所在的那个州的选民,“我”还从她的新闻秘书那里听说票数咬得很紧。他还会反问你,你没看过她最新的商业广告吧?
当我们编故事的时候,就无法以批判的方式看待信息。选举通常都是扣人心弦的叙事性故事。无论你怎样看待巴拉克·奥巴马、莎拉·佩林、约翰·麦凯恩以及希拉里·克林顿这些人在2008年的政治表现,你都得承认他们的人生经历确实很有说服力。他们撰写竞选纪实著作,如《规则改变》,它读起来颇像一本畅销小说。参加2012年美国总统竞选的几位候选人虽然没有引起太多关注,但依然使民众过足了戏瘾,从赫尔曼·凯恩的悲剧到里克·佩里的闹剧,全部涵盖在内。
叙事性故事会使人忘乎所以。政治之所以特别容易受错误预测的影响,恰恰是因为其中的人为因素:每一次竞选我们都要投入很多情感。这并不是说,为了对某一政治事件做出准确预测,你对这件事就一定不能带有任何感情因素。但是这再一次表明,狐狸型预测者的冷漠态度更有助于他们做出准确的预测。
狐狸型预测方法
2008年2月,我在新奥尔良的路易斯阿姆斯特朗国际机场候机,我的航班延误了。在等待登机的过程中,我萌生了建立538网站的想法。出于某种原因——也许是卡津马提尼酒在作祟——我觉得应该有人牵头建立一个网站,然后用这个网站来预测奥巴马和希拉里(当时两人还在为争夺民主党总统提名权激战)将如何完胜麦凯恩。这个想法突然间就明朗起来了。
我对政治选举的关注时间可能还要早一些,之所以关注,并不是因为热爱政治,而是对它感到失望。2006年,我曾密切关注过美国国会下令禁止“互联网扑克”这一事件,“互联网扑克”可是我的主要经济来源之一。我发现,即使与体育报道相比,政治报道也依然存在盲区,前者的报道和分析至少借着《点球成金》节目有所改善。
在大选之前,我发现自己越来越关注政治节目,主要收看美国广播电视台、美国有线电视新闻网和福克斯新闻的节目,可大部分内容都索然无味。尽管离美国总统大选还有数月之遥,但各档节目的评论都认为希拉里必然会获得总统提名权,却忽略了民意调查这种方式本身所固有的不确定性。这些评论似乎过于强调希拉里的性别优势和奥巴马的种族劣势,若某个候选人在一场新闻发布会上开了一个机智的玩笑或获得某个无名议员的认可,新闻界就会以此大做文章,断言这个人最终定会获选,可99%的选民都不会在意这些事情。
政治新闻,尤其是那些真正影响美国总统大选的重要新闻,传播速度十分惊人。但是,新闻报道每天都有,且大部分都是用来填充版面的,而媒体却总是将这些报道打造成劲爆新闻。政治新闻报道不仅经常抓不住信号,还时常会强调噪声。如果一个州有大量选票显示共和党领先,而且大家都知道这件事,这就称不上是新闻。如果一个新的投票结果显示该州民主党处于优势地位,即使选票并非来自投票的主要群体,而且也不能准确预测出结果,但也一定会上头版头条。
换句话说,竞争设置的障碍当时已经相当小了。某些人只不过是对政治活动中真正拥有预测能力的事物进行了相当基础性的研究,他们看上去可能就像一个天才了。于是,我开始在Daily Kos网站上发表博文,公开了民意调查和募捐数目这类问题的细节,利用数据对这些问题进行分析。我研究过哪些民调公司在过去这些年的预测最准确,也研究过赢得某一个州(如艾奥瓦州)的选票究竟会对另外一个州的选票数产生多大的影响。尽管像Daily Kos这样的网站上的评论通常都是定性的(而且具有党派取向),而不是定量的(不用数据说话),但是我的那些文章还是很快就有了跟帖。2008年3月,我将作过的分析转到我自己创建的538网站上,旨在对美国总统大选进行各种预测。
起初,538网站的预测模型十分简单——基本上总是取自民意调查的平均值,但会根据之前的准确程度给这些调查加权——后来就逐渐变得比较复杂了,但预测模型始终遵循三大原则,而且这些原则都是典型的狐狸型原则。
原则一:用概率的方法思考问题
几乎我发布的所有预测,不管是政治方面还是其他方面,都是以概率的形式公布的。我不会随便给出一个准数或声称某事一定会发生,只会给出几个可能的结果。比如,2010年11月2日,在预测共和党会赢得多少众议院席位时,我的估计正如图2–1所示。
可能性最大的几个结果——足以覆盖所有可能出现情况的1/2——显示,共和党会获得45~65个席位(实际上获得63个)。但是,也存在共和党会获得70或80个席位的可能性——这个数字与莫里斯当时预测的100个席位仍然相去甚远。而另一方面,民主党也有机会获得足够的席位以保住对众议院的控制权。
结果的广泛分布就是现实世界不确定性的真实体现。这个预测结果是在对435个席位中的每个席位分别进行预测之后得出的,其中多数席位的预测概率极为接近。尽管如此,仍有引人注目的77个席位的预测概率相互之间的差别大到个位数。如果当初民主党人在大部分有竞争力的地区能多赢得一些票数,哪怕是很少的一些,他们就能打败预测结果,轻松地保住对众议院的控制权。而如果共和党人采取了与他们的实际做法相反的做法,他们在众议院中的席位肯定也会低到让人大跌眼镜。政坛上,一颗小石子就会激起轩然大波,所以,预测时列出确切的数字肯定不是明智之举。
当我对某个竞选个案进行预测时,概率原则依然成立。比如,若民调显示某位候选人领先5个点,那他获胜的概率有多大?这就是538预测网站试图解决的问题。