统计数据会说谎 - (EPUB全文下载)
文件大小:7.87 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:统计数据会说谎
作者:[美]达莱尔·哈夫
译者:靳琰,武钰璟
ISBN:9787508682143
中信出版集团制作发行
版权所有·侵权必究
谨将此书献给我的妻子
世界上有三种谎言:谎言、弥天大谎和统计数据。
——迪斯雷利(Disraeli)
对讲求效率的公民而言,总有一天统计思维会和读写能力一样不可或缺。
——赫伯特·乔治·韦尔斯(H. G. Wells)
让我们陷入困境的并非我们不知道的东西,而是我们知道但并不正确的东西。
——阿蒂默斯·沃德(Artemus Ward)
整数总是有问题的。
——塞缪尔·约翰逊(Samuel Johnson)
对于统计这门学科我想写的东西很多,但是我深知如果非要把它说得准确而透彻,我的语言水平还远远不够。
——弗朗西斯·高尔顿爵士(Sir Francis Galton)
致谢
这本书里有许多看似高明的关于错误和欺诈的小故事。如果没有他人的帮助,我根本无法收集到如此广泛的例子。我通过美国统计学会发出呼吁,不少统计学家(相信我,他们就像所有人一样对滥用统计深恶痛绝)给我大方提供了他们搜集的事例。我想这些人不希望在这里提及他们的姓名。此外,我还在其他书中找到了不少有价值的事例。这些书主要有:马丁·布伦博(Martin A. Brumbaugh)和莱斯特·凯洛格(Lester S. Kellogg)合著的《商务统计学》,哈德利·坎特里尔(Hadley Cantril)所著的《公众舆论测定》,威拉德·科普·布林顿(Willard Cope Brinton)所著的《统计图表》,弗雷德里克·克罗克斯顿(Frederick E. Croxton)和达德利·考登(Dudley J. Cowden)合著的《实用统计学》,乔治·辛普森(George Simpson)和弗里茨·卡夫卡(Fritz Kafka)合著的《基础统计学》,以及海伦·沃克(Helen M. Walker)所著的《基本统计方法》。
引言
我的岳父从艾奥瓦州搬到加利福尼亚州没几天,就对我说:“这个地方的犯罪事件太多了!”他所读的报纸的确报道了许多犯罪事件。这份报纸从不放过报道当地的任何一起犯罪事件,而且以注重报道谋杀案闻名,其详尽程度超过了艾奥瓦州的任何一家大型报社。
我岳父的这一结论属于非正式统计。这个统计基于一个明显带有偏差的样本。与其他许多较为规范的统计一样,这个统计也存在虚假的成分。因为这个统计认为报纸上报道犯罪事件版面的大小是衡量犯罪率高低的标准。
几年前,十几位调查人员分别发表了一份关于抗组胺剂药物的报告。每份报告都表明,服用该药物后感冒会明显好转。紧接着就是各种各样的渲染,至少广告商是这么干的,于是这种药物被大量生产。造成这一结果的原因是人们一直对药物有着大量需求,也从未越过统计学去了解自己早已知道的事实。正如亨利·G·费尔森(Henry G. Felsen,他是一位幽默作家,但绝不是医学专家)很久以前所说的,适当的治疗可使感冒在七天之内痊愈,但如果任其自然发展,感冒则会持续一个星期。
那么,你读到和听到的事情大多也是如此。那些平均数、各种关系、趋势图以及图表并不总是一致。你所看见的未必是真实情况,事实上这些数据要么被过于夸大,要么被隐瞒。
在如今用事实说话的社会中,统计这种神秘的语言是如此诱人,但它却被人弄成了耸人听闻、华而不实、迷惑不清且过分简单的东西。在报道社会和经济趋势、商业状况、民意调查、普查时要用到大量数据,此时统计方法和术语就不可或缺。但是,如果作者们不能诚实报道甚至根本没有理解这些统计词汇,读者也就无法明白作者所说的内容,那么这些统计结果就只能是无稽之谈。
如今科普读物很受欢迎,但这些书籍往往滥用统计数据,这让人联想到这样一幅场景:灯光昏暗的实验室里,一个穿着白大褂的人忙得天昏地暗,还没有加班费,正如“加一点粉末,再加一点颜料”,这样的统计数据把许多重要的事实搞得面目全非。一个精心包装过的统计结果比希特勒的弥天大谎还要厉害,因为它虽然误导了你,但你还没法去指责它。
在教人如何用统计“行骗”的同类书籍中,这本书只能算是初级读本。它看起来像是一本“骗子指南”。也许我可以为这本书稍做辩解:这就好比一个洗手不干的窃贼出了一本回忆录,书中描述了如何能不出声地撬开门锁,其水平之高让研究生都佩服。既然“骗子”都已经熟练掌握了这些诡计,老实人又怎能不学来用于自卫呢?
在评论《纽约太阳报》(Sun)有关报道时,《时代》(Time)杂志曾特别指出:“耶鲁大学1924届毕业生平均年收入高达25 111美元。”
哇哦,他们实在太厉害了!
但稍等一下。这一令人惊叹的数据究竟意味着什么?它是否像表面看起来的那样,足以证明如果你将自己的孩子送进耶鲁大学,你就可以安享晚年,你的孩子也可衣食无忧了?
在充满怀疑地乍一看之后,我们发现这个数据有两个可疑之处:首先,它精确得让人吃惊;其次,它给人带来难以置信的好处。
把那些四处分散的人的平均年薪搞清楚并精确到个位数,这个可能性实在很小。就算你对自己去年的收入要做到一清二楚都不太可能,除非这些收入全部源自薪水。而25 111美元的年收入通常并非全部来自薪水,这部分耶鲁毕业生很可能还有零零散散的各种投资。
毫无疑问,这一令人羡慕的平均数是根据耶鲁毕业生自己报出的数据计算而来的。即便1924届毕业生在位于纽黑文市的耶鲁大学念书时谨遵其信用制度,我们也不能因此肯定多年之后,他们依然恪守该信用制度,他们口中的这些数据依然真实可靠。当被问及收入时,他们中的有些人难免会因虚荣或自负而有所虚报;有些人恐怕会尽量瞒报收入,特别在涉及所得税的问题上,他们也许会因担心与其他表单上的数据互相矛盾而犹豫不决,那些税务官们会不会看出什么端倪来呢?这两种倾向——虚报和瞒报——也许会互相抵消,但事实上这不可能。其中一种倾向也许会占上风,但究竟哪种占上风我们不得而知。
根据常识,这一数据绝对不真实,那么就让我们来分析一下。我们先来看看导致最大误差的原因,就是这个原因炮制出了某些人“平均年收入高达25 1 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 统计数据会说谎 - (EPUB全文下载)