36氪专门为读书设立了【36氪领读】栏目,筛选一些值得读的书,并提供一些书摘。希望你手边有一本称心的书,让读书这场运动继续下去。
这本书是美国统计专家达莱尔·哈夫的传世之作,该书引发的“编造虚假信息”话题受到美国社会持续普遍的关注和美国权威媒体的激烈争论。书里面大胆地揭露了至今仍然被销售员、广告撰稿人、记者甚至专家频频使用的大量的统计操纵技巧,同时还配有别具一格的风趣插图以及众多幽默的案例。神秘的统计学在这里被哈夫像讲故事一样一一道来,莞尔一笑中让你知晓深奥的统计学基本原理,掌握揭露“虚假数据”的最有力武器……
自50年代出版以来,此书不断再版,并被翻译成多种文字,在世界的影响力持久不衰,被誉为美国商业人士、研修人员的重要入门必修书之一。
达莱尔·哈夫,美国统计专家。1913年出生在美国爱荷华州,毕业于爱荷华州立大学(the State University of lowa),获得学士学位和硕士学位,在此期间他由于成绩优异加入了美国大学优等生的荣誉学会(Phi Beta Kappa),同时还参加了社会心理学、统计学以及智力测验等研究项目。
移动支付、线上交易、云上生活……在这个科技高速发达的时代里,我们享受到了物质生活的极大丰富、便捷。但与此同时,每个独立个体的交流与交互在大数据里,犹如一个个联结的散点,无处藏身,无处遁形。我们可能很自信地说我们熟练运用文字,但当面对数据时,我们就无法那么自信。
图表是如何说谎的
数据里有着某种让人畏惧的东西。矮胖子自信满满地告诉爱丽丝,他能熟练运用文字。但是当人们面对数据时,却无法继续展现像矮胖子那样的自信了。也许这就是小学算术留给我们的“创伤”。
不管是什么原因,数据的确会给人们带来麻烦,比如对那些渴望人们都能读自己著作的作家,希望文案能促进销售的广告商,以及希望书籍和杂志大卖的出版商。当把数据以表格形式呈现出来变成了人们的忌讳,文字也无能为力时,就只剩下了一个办法:画一张图。
统计图形或图表中最简单的当属各种直线类图表。这种图表适用于表示趋势。人们也乐于展示、了解、发现或预测趋势。我们就用图表来说明国民收入是如何在一年内增长10%的。
首先,我们在图纸上用相互垂直的直线画出方格。在底部标上月份,在左侧垂直的直线旁标上数据,并注明表示数据单位的“10亿美元”。然后,标出绘点,连接成线。你的图形就会像下页的图那样。
现在够清楚了。这张图展示了国民收入在这一年中每个月的变化。但是画图者会发现,由于这张图是按比例制成,最下面还有一条用于比较的基准线或零线。这10%看起来的确像是10%——虽然也是上升的趋势,但不够令人振奋。
如果你只是想传达某个信息,这张图已经足矣。但是假设你想赢得一场辩论,想要让读者大吃一惊,让某人马上行动,或是推销某种商品,那这张图的效果还不够夸张。你要做的是把图表底部截去。
现在它看起来就是这样的。(如果有哪个吹毛求疵的家伙抗议你的图表是误导人,你可以说这是节约纸张。)图上的数据和线条没有丝毫更改。图还是那张图,什么都没被篡改,除了它给人的整体印象。但是急性子的读者现在看见的表示国民收入的线条在一年之内从底部攀升到了半空中,这是因为图表的大部分都不见了。
这就好比你在语法课上会碰到一句话有省略现象,这都是“可以理解的”。当然,眼睛无须去“理解”被省略的部分,所以这细微的上升在视觉上就变成了大幅增长。
既然你在学着“骗人”,干吗还要把图表截短?你还有个比这强好几倍的办法,可以让这低调的10%看起来比100%还要生机勃勃。只需稍稍改变一下纵坐标和横坐标的比例。
这可不违反原则,但的确会让你的图表看着更漂亮。你要做的就是将纵坐标上代表美元的数据的递增量改为原来的1/10。
现在是不是令人振奋?凡是看到这幅图的人都会认为美国经济蓬勃向上。这就好比将标题从“国民收入增长10%”改为“国民收入大幅增长了10%”一样微妙。但是这种办法成效卓著,因为这里没有任何形容词或副词能够破坏客观性这一幻觉。因此,没有人会归咎于你。
那些操纵数据的人
一些知名公司也屡屡使用这一伎俩。1951年,《新闻周刊》(Newsweek)杂志曾运用这种方法来说明“股市创21年来新高”,图表底部的80个指数被截掉了。1952年,一家哥伦比亚的煤气公司在《时代》杂志上刊登了一张复制自“年度报表”的图表。如果你仔细看了图表上的小小数据并加以分析,你就会发现这十年间生活成本增长了60%,煤气价格下降了4%。
这张图表比较让人满意,但对这家哥伦比亚的煤气公司来说,显然还不够。该公司把图表的90%截去(没有留下空白或说明作为提示),这样就成了你所看见的:生活成本翻了两番,煤气价格却跌至原来的1/3!
为了罗列出不支持工资增长的公众意见,钢铁公司也曾利用过这种误导人的图表。但是这种方法并不是什么新鲜做法,它的不合理之处早被揭穿——还不只是在统计学家的专业书籍上。
1938年,一位《邓氏评论》(Dun’ Review)的社论作者从华盛顿的宣传广告上复制了一张图表,争论在于图表上方的标题——《政府支出剧增!》。图表中的线条与标题中的感叹号对应,而后面的数据却并非如此。它们表示的是政府支出从19,500,000美元增至20,200,000美元。
从底部急剧攀升至顶部的曲线本应描述的是不到4%的增长,但此刻却看着比400%还多!杂志编辑在旁边附上了同样数据绘成的另一张图表——用一条曲线客观地描述4%的增长,上面的标题是:《政府支出稳定》。
《科利尔》杂志也曾在报纸广告的柱形图中使用了相同的伎俩。但需要特别注意的是,这里截去的是图表的中间部分。
身处在大数据时代,面对着复杂多样的数据,我们每个人不可能成为每个领域的专家,但我们不得学会识得这些数据的“本原“面目和说谎真相。