政治选举预测总是被报道存在误差幅度,这让我们看到了其中的不确定性。大多数时候,经济预测都是以单一的数字呈现出来,比如,经济政策下月将会创造150 000个就业机会,2013年的国内生产总值(GDP)将会增长3%,原油价格将提高到每桶120美元,诸如此类。
这些数字会让人觉得这些经济预测惊人地准确。于是,各类报刊常会在报道中对经济预测出现的微小误差表现得大惊小怪:
“失业率意外剧增至9.2%,引发市场阵痛。”
《丹佛邮报》,2011年7月9日
如果你看过那篇字号超小的文章,就会发现这个“意外”的结果是,失业率的确达到了9.2%,而不是经济学家此前预测的9.1%。如果0.1%的误差就足以上头条新闻,看来这些预测通常必须做到非常可信才行。
然而,经济预测最多不过是一个生硬的工具,很少能提前几个月预知经济的转折点。实际上,更常见的情形是这些预测甚至连已经开始且正在进行中的经济衰退都无法“预言”。最近的3次经济衰退——1990年、2001年和2007年经济衰退——都是这样的情形,衰退明明已经开始,但大部分经济学家却不乐意承认,直到最后才确认这一点。
对美国经济这样复杂庞大的事物进行预测,是一项极具挑战性的工作。这些预测的实际表现和人们对它们的看法之间存在着巨大的差距。
一些经济预测者不愿意让人们知道这一点。与其他大多数学科的预测者一样,经济预测者将不确定性视作仇敌——威胁其名誉的仇敌。他们没有对不确定性做出准确的预测,而是武断地认为预测模型中的不确定性降低了,但在现实生活中,他们却无法提高预测的质量,这样做也无法改进真实世界中的预测。一旦洪水来袭,我们将毫无准备。
不可忽视预测中的不确定性
1997年4月,北达科他州大福克斯市的北雷德河河水泛滥,河水漫过了市镇的堤坝,涌进市内长达3.2公里。尽管没有人员伤亡,但该城市5万居民几乎都得撤离,清理工作的费用高达几十亿美元,城市中75%的房屋遭到了破坏或损毁。
与飓风和地震不同,大福克斯市的洪水本来是一场可以避免的灾难:这座城市的防洪石堤本该用沙袋加固,泛滥的洪水也本该被引流到人口稀少的地区——引流到农田里去,而非学校、教堂或住宅区。
大福克斯的居民其实在灾难发生的几个月前就意识到洪水的威胁了。那年冬天,平原地区的降雪格外多,美国国家气象局在积雪开始融化时就预计到会有径流,他们预言雷德河的河水最高会涨到14.9米深,接近历史最高纪录。
只是还有一个小问题,大福克斯的那些堤坝当初是按照可抵御深达15.5米的洪水的标准建设的,而这次的预测(14.9米)哪怕出现很小的失误,都会酿成大祸。
结果,雷德河的水位涨到了16.5米深。不管怎么说,美国国家气象局的预测都称不上完美,但是,提前两个月做出的预测,出现约1.6米的误差也是合情合理的,这样的预测在历史上比比皆是。结合美国国家气象局以往对洪水预测的准确率来看,预测中的误差幅度约为±2.7米,这便意味着堤坝被冲毁的概率为35%。
问题是,美国国家气象局明显是刻意对公众隐瞒了预测中的不确定性,只是一味地强调水深将达14.9米这一预测结果。负责此次洪灾预测工作的预测者后来告诉那些研究人员,如果自己的观点中传达出任何含有不确定性的信息,他们都担心公众会因此对预测失去信心。
实则不然,如果预测者这样做了,公众反而能准备得更充分——尽可能地加固堤坝、将洪水引流以抵御这次洪灾。然而,若是让民众自行决定,许多人就会深信根本没什么可担忧的(几乎没人购买洪水保险)。气象专家毫无保留地预测此次洪峰为14.9米,似乎是在暗示人们,此次洪水的最大深度就是14.9米,分毫不差,15.5米高的堤坝足以保护公众的安全。有些居民甚至将14.9米的预测值解读为洪峰可能达到的最大值。
有这样一个被引用了无数次的笑话:一位统计学家趟过一条平均水位不足1米深的河时,竟被淹死了。此次洪灾,美国国家气象局的预测模型给出的水位平均值是14.9米,但水位只要稍高一点,就会淹没整个城镇。
自此以后,美国国家气象局开始逐渐意识到向公众准确、诚实地传达不确定性的重要性。然而,其他领域的预测者几乎都没有秉持这种态度,在预测经济运行状况时尤其如此。
经济学家都是理性的吗?
现在,我们来回忆一下2007年11月都发生了什么事情。那是经济大衰退正式来临的前一个月,房地产市场已经出现明显的危机迹象:房产止赎率上涨了1倍,全美的抵押贷款机构全都濒临破产。信贷市场也出现了不祥的预兆。
费城联邦储备银行推出的一项关于“专业预测人员情况调查”(以下简称“调查”)的季度民调显示,很多经济学家认为经济衰退不大可能发生,相反,他们预期经济仍会缓慢增长,只不过略低于2008年2.4%的平均增长率。他们还认为,发生严重经济衰退的概率几乎为零,殊不知当时一场严峻的经济衰退即将上演。
这项“调查”的独特之处在于,它要求受访的经济学家明确地指出经济发展的方向及可能产生的结果。正如我在本书中一直强调的那样,概率性思考是科学预测必不可少的组成部分。假设在你掷两个骰子之前,我让你说出所有可能出现的情况,正确的答案绝不会是一个单一的数字,而是列举出所有可能出现的数字以及各个数字出现的概率,如图6–2所示。假设从长远来看,每个数字出现的概率都与你的预计一致,尽管掷出数字7的可能性最大,但也未见得就能始终掷出这个数字,掷出数字2或12的概率也是同样大的。
“调查”要求受访的经济学家对GDP和其他经济变量进行预测时,也要考虑到概率问题,比如,估算GDP的可能值是2%~3%还是3%~4%。图6–3显示的是2007年11月,经济学家对GDP做出的预测:
我在前面提到过,“调查”中受访的经济学家认为,2008年GDP最终会实现约2.4%的增长,略低于长期增势。这是一个非常糟糕的预测:2008年金融危机爆发后,美国的GDP非但未增,实际上还缩减了3.3%。更可笑的是,这些经济学家对其糟糕的预测竟然还满怀信心,他们认为,整个2008年经济出现缩水情况的概率不会超过3%, GDP缩减2%的概率也只有2‰,实际上,当年的GDP确实缩减了2%。
的确,长期以来,很多经济学家对于自己预测经济发展趋势的能力都太过自信。在图6–4中,我标出了1993~2010年这18年间所有“调查”对GDP增长率的预测值。图中的竖条代表的是经济学家给出的预测区间中90%的范围。
一个预测区间包含一系列由预测提供的有可能出现的结果,很像民调中的误差幅度。比如,90%的预测区间应该对现实生活中可能出现的结果实现90%的覆盖率,而剩下那10%的无关紧要的情况会被分配到预测区间的边缘位置。如果这些经济学家的预测如其所言,十分准确,那么预测区间里GDP增长率的实际数值十有八九是不会下跌的,或者说18年里只有两年GDP会出现下跌。
但实际上,GDP的实际数值在18年里6次跌出了这些经济学家的预测区间,可以说这些预测的错误率足有1/3。另一项研究将这些数据追溯到1968年,也就是这项“调查”的起始年,得到的结果更加糟糕:GDP增长率的实际数值有1/2都跌出了预测区间。这就不能说是那些经济学家的运气不好了,而是他们从根本上夸大了其预测的可信度。
在现实生活中,当一群经济学家预测GDP时, 90%的预测区间可以跨越约6.4%的真实GDP增长率(相当于误差幅度为±3.2%),这要基于预测的实际表现,而非经济学家的一面之词。
当你从新闻中得知,明年的GDP将会增长2.5%,这就意味着GDP很可能会以5.7%的高比率轻松增长,当然也有可能下降0.7%——一次严重的经济衰退。那些经济学家只能做到这种程度了,而且他们在预测方面似乎也没有什么进步。有这样一则笑话,经济学家对近期发生的6次经济衰退进行预测,结果正确预测的次数达到9次,这则老生常谈的笑话似乎有点儿道理。一项真实的统计数据表明,20世纪90年代,在全世界60次经济衰退中,经济学家提前一年预测到的衰退只有两次。
就这一点而言,经济学家并非特例。这样的做法已成为预测行业的行规:那些专家既不擅长诚实地描述预测中的不确定性,对这种做法也不大感兴趣。过度自信的预测体现出的这种特性在其他许多领域也显露出来,包括医学研究、政治科学、金融学以及心理学。不论是靠人的判断进行预测(如菲利普·特罗克等政治科学家的预测案例),还是用统计模型进行预测,似乎都能找到过度自信的影子。
但是经济学家犯了这种错误后,也许无法像其他领域的专家那样总能找到借口。首先,他们的预测不仅过度自信,而且现实意义也不大,比如在预测实际GDP增长率时,误差很大,即经济学意义上的回旋余地很大。其次,有组织地预测GDP增长率这类变量的活动已经持续好多年了,可以一直追溯到1946年的美国利文斯顿调查,这些结果保存完好,可供人们免费参阅。收集人们对我们所作预测的反馈信息是改进预测的一种方式,也许也是一种基本方式。与大多数其他行业的专家相比,经济预测者能得到更多的反馈,但他们却并没有以此矫正过度自信的倾向。
经济学难道不应该成为研究人类理性行为的领域吗?当然,你可能可以理解其他领域的专家,比如人类学家,在进行预测时会表现出偏向性,但绝不希望经济学家这样。
然而,这其实只是这个问题的一部分。那些经济学家相当了解理性,这意味着他们也相当了解我们的动机是如何发挥作用的。如果他们做出带有偏向性的预测,就说明他们没有多强烈的动机去做出好的预测。
相关的两个经济变量未必互为因果
考虑到上述预测者的跟踪记录,我最想找到的经济学家只有一种:他愿意坦承预测工作并非易事,而且坦承自己的预测很容易出错。而我恰好找到了一位——简·哈祖斯,他是全球性投资银行高盛集团的首席经济学家。
近几年来,可以说哈祖斯至少比他的竞争对手更可信。2007年11月,当大多数经济学家仍旧认为不可能出现经济衰退时,哈祖斯写了一份颇具挑衅意味的备忘录,标题为“举债经营带来的损失:抵押贷款违约为何事关重大”,这份备忘录警告人们,数百万名房产拥有者拖欠抵押贷款,引发信贷市场和金融市场的多米诺骨牌效应,造成数万亿美元的损失以及一场可能非常严重的经济衰退。事实证明,备忘录中提到的大部分情况都实实在在地发生了。同时,哈祖斯及其团队还迅速地降低了他们对危机后经济奇迹般复苏的可能性的估值。2009年1月,美国通过了经济刺激方案,一个月后,美国白宫宣称,截止到2009年年底,失业率将降至7.8%,而哈祖斯则预计,失业率会升至9.5%(十分接近实际数字9.9%)。
哈祖斯,一个成熟中略带忧伤的德国男人,在入职高盛8年后,于2005年成为公司首席经济学家,即使对大银行持怀疑态度的人,对他也会心存敬意。保罗·克鲁格曼曾经这样对我说:“(简·哈祖斯)为人友善,我希望高盛总裁劳埃德·布兰克费恩不要对简和他的团队横加干涉。”在谈到对美国经济走势的预测时,哈祖斯总是很谦逊。
我在纽约西街高盛公司明亮的办公室里与哈祖斯会面时,哈祖斯说:“说起这个问题,谁心里都没有底。商业世界的事极难预料,想要弄懂经济这种复杂的有机组织是非常难的。”
在哈祖斯看来,经济预测者面临着三大基本挑战。第一,单纯依靠经济统计数据,很难判断起因和结果。第二,经济始终都在变化,某一经济周期的经济运行状况无法被用来解释未来经济的发展。第三,经济学家以往的预测如此糟糕,那么他们作预测时所参照的数据也好不到哪里去。
美国政府每年公布的数据,与经济指标直接相关的有4.5万个,而私人数据提供者要追踪高达400万个统计数据。一些经济学家忍不住想要把所有数据都混合在一起,并给一般的数据穿上优质的“外衣”。第二次世界大战之后只出现了11次经济衰退的情况,如果一个统计模型试图解释这11次衰退带来的后果,就必须从400万个数据中选择数据,由此得出的许多相关性都将会带有欺骗性。(这是过度拟合的又一个经典例子——将噪声误认为是信号——在本书前面的内容中,这个问题发生在地震预测者身上。)
想象一下,当你拥有像电话簿一样厚的一摞经济数据时,自己会变得多么富有创造力。比如,美国橄榄球超级杯大赛的冠军队伍曾一度是经济预测中非常有名的“领先指标”。从1967年的第一届超级杯大赛到1997年的第31届超级杯大赛,当来自原美国国家橄榄球联盟(NFL)的队伍赢得比赛时,那么股市就会平均上涨14%,而如果是来自原美国职业橄榄球联盟的队伍赢得比赛时,那么股市就会平均下跌10%。
1997年之前的31年里,有28年该指标都正确地“预测”了股市的走向。从理论上来看,统计学标准测试可以表明这种相关关系绝非偶然,是偶然的可能性只有470万分之一。
然而事实上,这种关系的出现只是巧合。最终,这一指标的表现还是退步了。1998年,原美国职业橄榄球联盟的丹佛野马队赢得了美国橄榄球超级杯大赛,按照惯例,这应该是一个不好的预兆,然而,这次股市非但没有下跌,反而在网络公司的强势带动下上涨了28%。2008年,原美国国家橄榄球联盟的纽约巨人队奋力直追,外接手戴维·泰里大放异彩,打乱了新英格兰爱国者队夺冠大卫轮胎队的计划,然而,新英格兰爱国者队的失利并没能阻止房地产泡沫的破灭,这次房市崩溃导致股市暴跌了35%。事实上,自1998年以来,每次原美国橄榄球联盟的队伍赢得超级杯大赛时,股市非但不会下跌,反而会有约10%的上涨幅度,与传说中这一指标的预测走势截然相反。