可视化未来:数据透视下的人文大趋势 - (EPUB全文下载)
文件大小:8.7 mb。
文件格式:epub 格式。
书籍内容:
版权信息
COPYRIGHT
书名:可视化未来:数据透视下的人文大趋势
作者:【美】艾登【法】米歇尔
出版社:浙江人民出版社·湛庐文化
出版时间:2015年9月
ISBN:9787213068508
本书由天津湛庐图书有限公司授权得到APP电子版制作与发行
版权所有·侵权必究
[1]据市场咨询公司IDC估计,人类的数字足迹将从2005年的130千兆兆字节增加到2020年的4万千兆兆字节。这表明,大约每一年零10个月数据就会增加一倍。
[2]想要更多地了解巴拉巴西的观点,请阅读《爆发:大数据时代预见未来的新思维》一书,该书简体中文版已由湛庐文化策划、中国人民大学出版社出版。另请参见《链接:商业、科学与生活的新思维(10周年纪念版)》,本书简体中文版也已由湛庐文化策划、浙江人民出版社出版。——编者注
[3]你可以现在就动手试试,网址是http://books.google.com/ngrams。
[4]想要更多地了解诺瓦克的观点,请阅读《超级合作者》一书,本书简体中文版已由湛庐文化策划、浙江人民出版社出版。——编者注
[5]2000年,英文书中平均每100个词中出现4.6次“the”。
[6]22000年,英文书中平均每500万个词中出现两次“quiescence”。
[7]据美国2010年的普查,除去房屋净值,美国家庭净资产的中值是1.5万美元。2010年3月,福布斯榜估计,比尔·盖茨的净资产是530亿美元。因此,在我们分析的情况中,盖茨身高大约6007千米。比冥王星(直径2390千米)、水星(直径4879千米)和月亮(直径3474千米)要高出很多;和火星(直径6792千米)差不多高。如果将房屋净值算进来,美国家庭净资产的中值是66740美元,此时盖茨身高1350千米,仍然高于冥王星高度的一半。
[8]譬如,约公元前800年的《贝奥武夫》中使用的语言。
[9]2譬如,12世纪左右英国文学之父乔叟使用的语言。
[10]关于密歇根大学图书馆数字化所需的时间,500年仅仅是个估算出的数字;科尔曼所估计的1000年,也许包括了翻书之外的其他事情,当然她并没有假定只有一个人来翻书。假设有1.3亿本书,每本书的数字化需要40分钟时间,那么完成所有书的数字化则需要9900年。
[11]《美国传统词典》团队向我们提供了一个列表,此列表列出了该词典第4版中所有条目的153459个词目。有时候,同一个词在该列表上会出现多次。例如,console可以作为一个名词出现,也可以作为一个动词出现。我们除了这类重复词目,同时也删除了不是单个词的词目,譬如:mensroom。最终的词表包含116156个词。
[12]2ROFL为网络俚语,意为“笑得满地打滚”。——编者注
[13]我们计算了《美国传统词典》中116156个一元词组词目的出现频次,给出了频次的分布。在分布的10%处,这些词目的出现频次是每10亿个词中出现一次。过了此处,出现频次开始飙升。
[14]我们从词汇集合中抽出了1000个词,以界定有多少个词属于被排除掉的类别。实际上,我们并没有列出所有的英语物质。和宇宙中的物质类似,我们尚未确切地知道有哪些词汇暗物质,只是知道有很多。
[15]若想洞悉人类语言进化的奥秘,请阅读《语言本能》一书(已由湛庐文化策划、浙江人民出版社出版)。——编者注
[16]如果你知道这次登月任务中第三位宇航员的名字,请举手。在阿姆斯特朗和奥尔德林于月球表面漫步时,这位宇航员在围月球运转的指挥舱中,他的名字是迈克尔·柯林斯(Michael Collins)。
[17]亨利·马蒂斯是法国著名画家,野兽派的创始人和主要代表人物,也是一位雕塑家、版画家。他以鲜明、大胆的色彩运用而闻名。——编者注
[18]以色列对那些甘冒生命危险以拯救犹太人免遭屠杀的非犹太人的尊称。——编者注
[19]第二次世界大战期间,犹太少女安妮·弗兰克(Anne Frank)为躲避纳粹迫害,藏身于阿姆斯特丹的密室时所写的日记。该日记成为第二次世界大战期间纳粹德国屠杀犹太人的著名见证。——编者注
[20]关于德韦恩·罗伊的故事可详见《全面回忆》一书。该书已由湛庐文化策划、浙江人民出版社出版。——编者注
[21]想要更多地了解有关脑机接口的知识,请阅读《脑机穿越》,该书简体中文版已由湛庐文化策划、浙江人民出版社出版。——编者注
[22]了解有关社会物理学的更多信息,可阅读由湛庐文化策划、浙江人民出版社出版的大数据专家阿莱克斯·彭特兰的作品《智慧社会》。——编者注
推荐序
数据透镜,洞穿科学与人文之美
中国工程院院士,中国科学院大学计算机与控制学院院长
李国杰
近年来,全球掀起了一股“大数据”浪潮,波及社会的各行各业,深刻影响和改变着人们的思维和科学研究方式。在工业界,数据已成为企业核心竞争力之一;在学术界,数据密集型科学研究已上升到与科学实验、理论分析、计算模拟并列的科学研究“第四范式”。在这样的时代背景下,社会科学也面临着前所未有的发展机遇。对人类社会各种微观活动的记录和统计,为社会科学研究提供了宝贵的数据资源,开辟了社会科学研究的新途径。
展现在你面前的《可视化未来》一书以“谷歌图书”项目为背景,讲述了大数据在研究历史文化、人类语言、社会名望、群体记忆等方面的重要作用,大数据为我们提供了一面考察社会的透镜,其对社会科学的变革意义,与伽利略首次将望远镜指向太空对天文学的意义一样重大。为了应对数据隐私和数据共享等难题,作者巧妙地提出了数据投影的方法,设计了n元词组词频查看器这样一个透镜,让人人都可以轻松地通过人类历史上出版的图书集合来透视人类文化的历史。
《可视化未来》一书对从事科学研究的学者有很好的启发作用。作者从一个孩童式的问题开始,思考该问题蕴含的科学意义,并努力寻找场景和数据来探索该问题,不断思索将该问题的研究付诸实践的途径,最终成功完成了此项研究,并将研究成果发表到了《科学》杂志上。接 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 可视化未来:数据透视下的人文大趋势 - (EPUB全文下载)