大数据预测_告诉你谁会点击、购买、撒谎或死去 - (EPUB全文下载)

文件大小:9.34 mb。
文件格式:epub 格式。
书籍内容:

大数据预测
——告诉你谁会点击、购买、撒谎或死去
[美] 埃里克·西格尔 著
周大昕 译
中信出版社
目录
序言
前言 预测分析的职业风险
导论 预测效应
第一章 升空!预测开始发威
第二章 权力越大,责任越大:惠普、Target超市、警察和美国国家安全局会窥探你的秘密
第三章 数据效应:彩虹之后的饕餮
第四章 学习的机器:大通银行对房产抵押风险的预测分析
第五章 集团效应:Netflix、众包以及增压预测
第六章 “沃森”和《危险边缘》节目
第七章 用数字说话:挪威电信、美国合众银行和奥巴马竞选团队如何通过预测来施加影响
结语
序言
本书旨在通过量化方法来预测人类的行为。人类在此方面的最初实践是在第二次世界大战时期。1940年,“控制论之父”诺伯特·维纳开始尝试预测德国空军飞行员的行为,目的是消灭这些纳粹空中力量。其预测方法是,观测德国飞机运动的轨迹,推测飞行员可能采取的机动规避动作,由此推断飞机接下来所处的位置并用高射炮将其击落。然而,维纳只能推断出飞机下一秒的飞行轨迹,要想精确炮击飞机,必须预测飞机至少20秒内的飞行轨迹。
在埃里克·西格尔的书中,你将看到许多预测案例,这些案例与维纳预测德国飞机的案例相比要精准许多。与“二战”时期相比,目前计算机的运算性能有了极大的提升,数据的丰富程度也非维纳之时可比。因此,银行、零售商、政治团体、医院以及其他众多机构,都在通过计算机数据处理来预测某些特定人群的行为,进而赢取客户、赢得选举或治愈疾病。
在本人看来,这些预测行为总体上是有益于人类发展的。在疾病治疗、打击犯罪以及反恐等领域,预测能挽救生命;在商业广告领域,预测能让广告定位更加精准,从而保护森林(减少无效纸质广告和宣传册的发放)、节省受众的时间和精力;在政治领域,那些相信科学预测方法的政治候选人会有更大的胜算。
然而,正如西格尔在本书开篇坦诚指出的那样,这些方法也可能产生问题。西格尔引述了电影《蜘蛛侠》中的台词“力量越大,责任越大”来说明这一点。其引申意义是,人类必须谨慎运用预测模型,否则其效用和益处就会大打折扣。与其他重要发明或革命性创新成果相似,预测分析本身并无是非对错之分,但作为工具,它会带来或善或恶的结果。要想避免预测分析的不正当应用,我们首先必须知晓预测分析究竟都能做什么,随着对本书阅读的深入,相信你会对此问题形成自己的见解。
本书的重点是预测分析,这是诸多分析方法中的一种,是最有趣和最重要的分析方法。在我看来,纯粹的描述性分析已经过时了,因为它只是记录过去发生的事情,无法真正说明这些事情为何会发生。此外,我也经常在自己的书里提到第三种分析方法,即规范性分析,也就是通过控制实验或定向优化来告诉人们应该怎么做。但这些数理分析方法的应用范围较预测分析要小许多。
本书内容及其背后的思想与纳西姆·尼古拉斯·塔勒布的思想恰恰相反。塔勒布在《黑天鹅》
[1]

等书中提到,由于世界充满偶然性且复杂事物的发展总是具有内在的不可预测性,因此预测行为注定会有失误。毫无疑问,塔勒布的话是有道理的,世界上总会有不可预测的“黑天鹅事件”,但大部分人类行为都具有惯常性和可预测性。西格尔在本书中所给出的大量成功预测的案例表明,世界上大部分天鹅是白色的。
同时,西格尔也在试图避免陷入“大数据”的陈词滥调。尽管书中的某些案例具有“大数据”分析的特征,即数据量庞杂无序以致难以用传统关系数据库进行分析,但预测分析的关键点不在于数据的规模或繁复程度,而在于如何对待数据。我认为,通常,“大数据不过是小算术”,某些大数据领域从业者所做的不过是用宏大数据来装点门面。其价值与真正的预测模型相比,自然有云泥之别。
西格尔在本书中所阐述的理念复杂精巧,但其行文却浅显易懂,无论读者是否熟悉数理分析,都可读懂本书。书中包含了大量的实际案例和分析图表,笔触通俗诙谐。即便是非数理分析专业人士,也应该好好阅读本书,因为在现实生活中,任何人的行为都免不了成为他人分析和预测的对象。此外,非数理分析专业人士也免不了要在实践中学习预测模型、评估模型效果并根据预测模型的结果采取适当的行动。
总而言之,我们所处的是讲究预测的社会。要想在这样的社会中生存发展,最好的方法就是去理解预测模型的目标、方法以及限制,要想做到这一点,最好的方法莫过于阅读本书。
托马斯·H.达文波特
巴布森学院杰出教授
麻省理工学院数字业务中心成员,德勤分析高级顾问
国际数据分析研究所联合创始人
《数据分析竞争法》联合作者
[1]
《黑天鹅》中文版已于2008年5月由中信出版社出版。——编者注
前言
预测分析的职业风险
昨天已经过去,明天全然未知,我们能够把握的,只有今天。
——英国儿童文学作家米尔恩(A. A. Milne)、美国漫画家比尔·基恩以及《功夫熊猫》中乌龟大师的名言
每当我告诉别人我的职业时,他们总是用异样的眼光看我。这也算是职业危害吧。
信息时代其实存在着巨大的不确定性。这样的论断可能会使许多人感到惊讶,因为当前,我们几乎可以把世界上发生的每一件事情记录下来。如果说历史书上仅仅记载的是那些重大事件,那么现在的信息系统如此发达,以至于人类的每次点击、每次支付、每个电话、每次交通事故、每次犯罪行为以及每次求医问诊都会被记录在案。在如此完备的海量数据面前,数据爱好者即便没有觉得自己是天之骄子,至少也应该感到心满意足吧。
但如此巨大的信息库中所缺乏的恰恰是最值得人类知晓的事:未来之事。
人人都渴望拥有预知未来的能力,我们对预测几乎无法抗拒。我们对先知神明顶礼膜拜;我们为算命先生慷慨解囊;我们热衷于占卜问卦,崇拜占星之术,对那些“讨口彩”的食品甘之如饴。
在狂热追求超能力的同时,我们却又常常鄙夷科学。我们对科学的直接反应是“敬而远之”——科学看上去深奥而乏味。对于许多人而言,或许预测是只有凭借超能力才可以做到的事情。
美国喜剧《灵异妙探》(Psych
)中的故事颇能说明这一点,这部剧的主角是一位具有敏锐的数据推断力的侦探。这位现代福尔摩斯具有超强的观察力,他对事实的精准 ............

书籍插图:
书籍《大数据预测_告诉你谁会点击、购买、撒谎或死去》 - 插图1
书籍《大数据预测_告诉你谁会点击、购买、撒谎或死去》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » 大数据预测_告诉你谁会点击、购买、撒谎或死去 - (EPUB全文下载)