Hadoop金融大数据分析 - (EPUB全文下载)
文件大小:3.09 mb。
文件格式:epub 格式。
书籍内容:
Handoop for Finance Essentials
Hadoop金融大数据分析
[美]Rajiv Tiwari 著
王小宁 译
電子工業出版社
·
Publishing House of Electronics Industry
北京·BEIJING
内容简介
随着数据的增长以及企业每天处理越来越多的数据,Hadoop作为一个数据平台已经变得很流行。金融行业想要最小化风险和最大化收益,Hadoop作为一个主宰大数据市场的工具,在其中起着很大的作用。
本书介绍了大数据和Hadoop的基础知识,让读者掌握项目管理、欺诈检测等TOP大数据金融项目,其中不仅包含行业参考和代码模板,同时包括实现中使用的多个Hadoop组件。
读完本书,读者会理解一些行业领先的架构模式、大数据管理经验、窍门和大数据最佳实践方案,以便基于Hadoop成功地开发出适合自己的解决方案。
Copyright © 2015 Packt Publishing. First published in the English language under the title‘Hadoop for Finance Essentials'.
本书简体中文版专有出版权由Packt Publishing授予电子工业出版社。未经许可,不得以任何方式复制或抄袭本书的任何部分。专有出版权受法律保护。
版权贸易合同登记号 图字:01-2015-6646
图书在版编目(CIP)数据
Hadoop金融大数据分析/(美)拉吉夫·蒂瓦里(Rajiv Tiwari)著;王小宁译.—北京:电子工业出版社,2017.5
书名原文:Hadoop for Finance Essentials
ISBN 978-7-121-31051-5
Ⅰ.①H… Ⅱ.①拉… ②王… Ⅲ.①金融-数据处理软件 Ⅳ.①F830.49
中国版本图书馆CIP数据核字(2017)第044538号
策划编辑:高洪霞
责任编辑:徐津平
特约编辑:赵树刚
印 刷:三河市鑫金马印装有限公司
装 订:三河市鑫金马印装有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱 邮编:100036
开 本:720×1000 1/16
印 张:10.75
字 数:172千字
版 次:2017年5月第1版
印 次:2017年5月第1次印刷
定 价:59.00元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010) 88254888,88258888。
质量投诉请发邮件至zlts@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn。
本书咨询联系方式:010-51260888-819, faq@phei.com.cn。
译者序
从2013年暑假接触Hadoop到现在已有3年,我清楚地记得第一个伪分布式弄了近10天才跑出来第一个WordCount,期间太多的Bug已经把我搞得神魂颠倒,好在最后“成功”了。至此,我与Hadoop结下了不解之缘。刚开始用中国人民大学数据挖掘中心的十几台机器搭建了第一个Hadoop集群,而后发展成两台服务器各包括20台机器的集群。Hadoop的版本也从1.2.0发展到2.6.0,随后帮助中国人民大学统计与调查中心搭建了自己的Hadoop集群。
“巧妇难为无米之炊”,再优秀的工具没有数据也只能是一个摆设,好在我们在做项目的过程中不时地有新的数据加入,也为我们进一步的学习和研究打下了基础。我们集群的组件也从单纯的Hadoop增加到Hive、HBase、Mahout和Spark。这几个组件都是比较流行的,我们在使用过程中也体会到了这些组件优于传统数据分析工具的特点。随着数据采集量的增多,也使得很多公司为我们提供了一些可进行分布式计算的平台环境,充分利用这些资源,会为我们的研究和工作锦上添花。
感谢电子工业出版社的编辑给了我一次这么好的机会,也希望本书能为金融行业的同仁带来一定的收获。金融行业的数据可以说是最有价值的数据,其数据量大、价值高,从这些数据中提取价值是提升业务收入的一个重要手段。面对日益增长的数据量,传统的数据分析工具已经很难满足这些需求,新的开源工具可为我们解决这些问题。文中列举了很多现实中的例子及实现方案,为我们进一步挖掘数据的价值提供了一种思路。鉴于译者水平有限,有些术语及语句可能理解有误,欢迎读者发邮件和我联系:sdwangxiaoning@foxmail.com。
王小宁
2016年
前言
数据正以惊人的速度增加,而公司要么疲于应付,要么急于利用这些数据进行分析。Hadoop是一个优秀的开源框架,可以应付这些大数据问题。
在过去的几年里,我一直在金融部门使用Hadoop,但在使用的过程中,一直没有发现有关Hadoop在金融应用中的任何案例资源或书籍。我遇到的关于Hadoop、Hive或一些MapReduce模式的书籍大都是用各种各样的方式统计单词数量或分析Twitter信息。
我写这本书旨在解释Hadoop和其他相关产品在处理金融案例大数据中的基本应用。在书中,介绍了很多案例并提供了一个非常实用的方法。
这本书包含什么
第1章,大数据回顾。本章包含大数据概览、前景和技术演变,也介绍了Hadoop架构的基本知识、组成部分和分布式框架。如果你之前已经了解Hadoop,这一章可以忽略。
第2章,金融服务中的大数据。本章将延伸到站在一个金融机构的角度去看大数据。主要介绍大数据在金融部门的演进故事,在项目落地时的一些挑战,以及利用相关工具和技术处理金融案例的应用。
第3章,在云端使用Hadoop。本章包含大数据在云端使用的概览,以及基于端到端数据处理的样本投资组合风险模拟项目。
第4章,使用Hadoop进行数据迁移。本章讨论了将历史数据从传统数据源迁到Hadoop上的几种常用项目。
第5章,入门。本章包含了一个非常大的企业数据平台的实施项目,以支持各种风险和监管要求。 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » Hadoop金融大数据分析 - (EPUB全文下载)