现实挖掘 - (EPUB全文下载)

文件大小:0.84 mb。
文件格式:epub 格式。
书籍内容:

现实挖掘
[美] 内森·伊格尔 [美] 凯特·格林 著
吕荟 陈菁菁 译
中信出版社
目录
序言
第一部分 从个体开始挖掘
第一章 智能手机、传感器和生命记录
麻省理工学院的数据追踪项目
手机——最佳人体传感器
更加精确的生物传感器
可以感知周围环境的机器学习
生命全记录
第二章 如何充分利用个人数据?
可以帮你戒烟的手机应用
老人走失、汽车被盗前预警
大数据,大隐患
健康激励是与非
车载感应功与过
无法回避的个人隐私
第二部分 数据驱动下的社区和组织
第三章 群体的数据获取
智能标识卡
科学地盯紧你的员工
建设更美好社区
声景监视
第四章 数据价值如何落地?
社交网络的介入
社区笔记的贡献
第三部分 大数据,让城市更美好
第五章 城市数据的大用途
交通数据
用数据预测犯罪
用视频监控犯罪
如何获得公众数据
监控的合法性讨论
第六章 将适合的资源放在适合的位置
交通预测和意外事件控制
道路资源配置
可追踪的病菌
预防犯罪
第四部分 大数据治国
第七章 当数据上升至国家层面
人口普查
通话记录
谷歌、脸谱网、推特
银行交易
第八章 让大数据发挥作用的最佳方法
人口快照
人口流动数据的重要意义
让广告更聪明
通过推文识别危机
挖掘金融的未来
第五部分 世界数据
第九章 大数据能为世界带来什么?
全球人口普查
航运和航海的足迹
谷歌“趋势”
社交网络的全球数据
现实挖掘的实际核查
第十章 明天会更好
航空线路数据和疫病传播
疾病预测
用数百万人的网页搜索预测感冒的活跃度
流行病网络
结语
版权页
序言
大数据正在席卷全球。这个话题如今频繁见诸各种会议、专著、论文和企业的讨论中。这当然是事出有因的:对以往深不可测的大量数据进行挖掘,从而发现趋势甚至预测未来,这样的想法的确非常具有吸引力。但是正如这些会议、专著、论文和商业计划中所阐述的,弄明白如何处理巨大体量的数据,并使其发挥更好的作用并不是一件简单的事情。
我们将大数据定义为人或物与数字网络世界之间相互作用而产生的信息集合。它可以是数年间采集的关于一个人的单一变量的数据,也可以是在某一瞬间采集的关于数亿人的多变量数据。大数据可能涉及的时间长、囊括的主题多或者涵盖的范畴广,也可能是这三种特征间的组合。
由于各种技术因素的汇集,大数据已经成为我们现代世界的一个特征。高性能的移动互联智能设备就在你的口袋中采集数据、进行运算,然后发送给远程服务器。云计算和日益增长的高密度数据存储设备,为一切信息提供了安身之所。并且,流处理范式使数据可以通过分布式设备进行处理。一些针对大规模数据集设计的编程模型,如MapReduce以及开源的Hadhoop的出现,使人们了解即将到来的信息流是可能的。
大数据被定义为我们日常活动产出的数字记录或留下的数字足迹,它是我们生活的元数据。一些人害怕这会带来一个没有隐私的世界:企业对我们的了解比我们自己还多,政府可以监控那些它们认为危险的人。另一些人则认为大数据是数据库这抹彩虹末端的一罐金子,是抓住下一波信息技术趋势的机遇。他们还相信,从这些全世界人们日常生活中产生的海量数据中可以获得有益的东西。
作为本书作者,我们是技术专家,属于后者。我们认为,如果从负责任的、审慎的以及对环境敏感的角度来看,大数据可以帮助改善公共卫生、引导个人更好地决策、促进知识的共享以及提升创新速度。大数据的时代已经来临,而且看起来也不会很快结束。因此,保证个人自由和隐私不被侵犯,告知消费者谁在什么时间、以什么为目的获得了他们的数据就很重要。我们相信,在小心谨慎进行数据采集的前提下,大数据就可以被用来设计成更好的系统,以及一个可能的更好的世界。我们采用了一个被称为“现实挖掘”(Reality Mining)的方式,不仅对大数据进行分析,而且确保分析能够反映参与人的现实状况,同时在整个过程中始终保持谨慎的数据采集态度。
本书的目标是探讨大数据可能的积极方面,特别是展现如何利用对现实的挖掘来设计更好的社会系统。这意味着本书所介绍的理念,将会超越那些简单的描述性分析,如计步数据的柱状图等。我们所探讨的是针对一些可视化的数据表达,比如犯罪行为或疾病暴发的空间分布图等,如何将其转化为具有实际操作意义的行动或政策。我们还考虑了可以使用全球的匿名数据系统的构想。提出诸如“如何在缺乏公共卫生资源的发展中国家,配置疾病传染的预警系统?”这样的问题。根本上,我们希望探寻如何利用大数据让人们的生活变得更加美好。
本书分为5个部分,每个部分分别关注不同的数据采集尺度,大数据的内在挑战和机遇。大致同查尔斯·伊姆斯和蕾·伊姆斯夫妇在1977年制作的电影短片《十的力量》中分别观察了宇宙的极大部分和极小部分一样,本书对大数据的讨论也是从小样本渐增到较大的样本。
本书的现实挖掘旅程将从个体层面开始,即单个人所产生的数据和应用于单个人的数据。接着,我们升级到邻里和组织层面,再扩展到城市层面,之后是国家层面,最后到达全球层面。诚然,这样的分层框架并不是绝对的,也无法囊括所有的场景类型。当然,在某一层面获取的大数据也可以应用于其他不同层面。我们适时地提及了一些这类多样化应用的例子。不过,5个层次的结构更易把握,也更有助于我们思考在大数据获取和利用过程中面临的种种挑战。
这5个部分又分别各有两章。每个部分的第一章详细描述了该层面的数据采集种类、数据采集方式,以及读者在可能的情况下可以如何获得这些数据;第二章则阐释在这些数据的基础上,已经建立或者我们相信可以建立的应用和系统。
因此,每部分的第一章作为向导,带领读者对可以挖掘的多种数据类型以及可能的获取途径进行思考。这些途径可能是编写一个手机应用程序来采集使用者的睡眠数据,或是订阅服务商提供的航班数据,又或是基于谷歌进行检索的数据分析。有些多数人不太容易获取的数据,比如移动电话的通话记录,我们也提供了如何有限获取或者寻找其他可能来替代实际数据的建议。
在充分理解哪些数据类型可以被挖掘之后,我们接着讨论可以使用这些数据进行现实挖掘的程序。有些系统较为成熟,一些则还处于早期阶 ............

书籍插图:
书籍《现实挖掘》 - 插图1
书籍《现实挖掘》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » 现实挖掘 - (EPUB全文下载)