10版 书评  查看版面PDF

2017年

12月28日

查看其他日期

面对各类数据
我们得多长个心眼

2017-12-28 来源:上海证券报
  《简单统计学》
  如何识破一本正经的胡说八道
  (美)加里·史密斯 著
  刘清山 译
  后浪出版策划
  江西人民出版社
  2018年1月出版

——《简单统计学》

⊙郑渝川

2010年,两位哈佛教授卡门·莱因哈特和罗·罗戈夫发表论文说,当政府债务与GDP总值之比超过90%时,国家经济增长会受到拖累。这听上去很符合常识和逻辑。这个结论在全球范围内广为传播,并被普遍应用于反对2008年金融危机及欧债危机后各国政府举债救助金融机构的行动。但也有质疑者看到了问题。政府债务即便很高,如果不是短期内必须清偿,就不必过于担忧。一个很简单的道理,我们购房贷款总额会大大超出我们目前及未来预期的年收入,但我们不会因此担忧。因为,只要我们付得起每月的月供,就足以确保不违反房贷合同。

为回应批评,两位哈佛教授公布了他们的结论,即20个发达国家1946年至2009年期间每年债务与GDP的比率,还有扣除通胀因素后的GDP增长率。从数据来看,的确呈现出他们所说的债务超过90%这样一个临界点,GDP增速下降的关系。但美国在上述时间内,出现债务与GDP比例超过90%的时间只有4年:1946年至1949年。在那4年中,美国经济转向民用,而政府需要处理大量的二战债务。而在1949年之后的20多年时间内,美国经济持续快速增长,很显然无法排除政府投资基础建设、补贴人才引进和尖端科技研发所起到的作用。

质疑者继续紧追,还发现莱因哈特和罗戈夫有意遗漏了5个发达国家的案例,这几个国家在拥有债务与GDP之比大于90%的时间段里,增长率都是正值。不仅如此,在被莱因哈特和罗戈夫列入计算范围的20个国家的数据样本中,有一部分不利于佐证其结论的数据被从样本中清除了出去。

耶鲁大学博士、畅销书作家加里·史密斯在其所著的《简单统计学》中分析认为,莱因哈特和罗戈夫选择性地采用数据,遗漏不利于证明其预设结论的其他数据,所以得出了至少非常不全面的结论。《简单统计学》出版后,获得了诺贝尔经济学奖得主罗伯特·希勒、哈佛大学政治经济学教授本杰明·弗里德曼等经济学大家的赞赏。他们觉得,通过这本书,可以让读者更好地认识统计学和数据分析,更为清楚地洞察生活中滥用、错误使用数据的方式,更加轻松地识破以科学分析、统计分析、数据分析为名的各种奇谈怪论。

人都渴望寻求各种确定性,以此对冲不确定性给内心带来的担忧,所以会出现比赛前穿上没洗过的“幸运袜”、掷骰子时如不断摇出某一点数则坚信手气很顺并将延续下去、看中的房产一定会大幅增值、购买虚假宣传的高价保健品等怪诞现象。人们甚至对“章鱼保罗”敬畏有加,听从其预测竞猜足球大赛的结果。而在加里·史密斯眼中,这无非是以后见之明,寻找与某次、某几次随机结果关联的结果,然后将之推定为规律的显现,希望借此规避风险。只是,这样的努力,在绝大多数时候都被证明是徒劳的。

消费者经常会通过媒体看到,酒店企业、电商企业宣称经过消费者调查,愿意再次选择这些企业的比例超过九成甚至更高的比例。这类调查极具迷惑性,事实上也是完全错误的(即便相关企业装模作样真采集和汇总了数据),因为面向已有客户所做的没有约束力的意向调查,其实是“幸存者偏差”。在商业图书市场上,我们也常可以看到很多陷入了“幸存者偏差”分析方式的图书,也就是根据过去一段时期内的成功企业的案例,找出符合先验结论的故事,然后梳理在一起。这样的经验总结,相当不靠谱。最为著名的例子,当属《从优秀到卓越》和《追求卓越》两本书里的成功企业范例,在书出版之后的几年内,已经有相当多陷入了困境,甚至走向了破产。

谁都知道,随机投掷硬币,只要次数够多,硬币朝上和朝下的概率会趋于相等。但这并不是说,当选择次数有限的情况下,一定会出现正面或背面平均分布的结果。在一些实验中,投掷硬币可获得一连串正面,或是多次连续的背面,而这些连续出现的相同选择,其实都是随机性的结果。这个道理并不难理解。然而在生活中,我们往往会低估巧合,漠视随机性,而将一些连续出现的巧合结果,解读为规律。比如,观看体育比赛时,连续罚中多个球的球员,会被认为该场比赛的球感极佳的队员,人们预料他将继续高质量完成罚球——这样的判断显然并不成立,除非极个别能完全克服失误的顶尖运动员,一般选手(无论足球、篮球还是其他运动类别的运动员)能否罚中,说到底还是随机性在起作用。

统计学中有个著名的名词“均值回归”,也跟概率有关。比如,在股市上做出了最佳选择的咨询师,会在来年变得相对平庸。但这一名词也被广泛地错误理解和应用。均值回归并不意味着每个投资者都会从股票投资、风险投资中获得相同回报,更不可能在某个投资失败后能带来盈利回报的对冲。“回归是双向的,因为它仅仅反映了随机波动。”

聚集数据,有时会造成假象并诱使人得出错误结论。加里·史密斯叙述说,20世纪70年代,流行病学家南希·韦特海默注意到了一个现象,即许多癌症受害者的家庭靠近大型输电设备,并因此得出结论,大型输电设施会造成癌症。韦特海默的报告让很多人对电力设施避而远之,造成很多国家和地区改善电力等基础设施面临民意抵制。加里·史密斯指出,韦特海默的研究形同“德克萨斯神枪手谬误”(向许多目标射出子弹,然后找到自己击中的一个目标,用油灰盖住其他弹孔,刷掉痕迹,宣称自己是神枪手)。实际上,在那之后的几十年里,各国科学家反复实验和观察,发现比输电设备生成的电磁场大得多的电磁场,对死亡率、癌症发病率、免疫系统、繁殖力、出生异常等没有影响。

数据的应用有助于深化我们对事物、现象的认知,购买到更合算的商品,有利于我们的投资管理。但因为认知错误,数据往往也会被利用来愚弄我们,打着统计学的旗号,诱使我们做出错误选择。就像前面所提到的那样,管理学家会根据已有的成功企业案例,得出并不全面和准确的管理秘诀,然后推动形成管理风潮,对中小企业形成误导。

为避免被这些常见的数据应用谬误所误导,我们真得多长个心眼。