Hadoop技术内幕-董西成 - (EPUB全文下载)

文件大小:4.04 mb。
文件格式:epub 格式。
书籍内容:

大数据技术丛书
Hadoop技术内幕
——深入解析MapReduce架构设计与实现原理
董西成 著
ISBN:978-7-111-42226-6
本书纸版由机械工业出版社于2013年出版,电子版由华章分社(北京华章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @研发书局
腾讯微博 @yanfabook
目 录

前言
为什么要写这本书
读者对象
如何阅读本书
勘误和支持
致谢
第一部分 基础篇
第1章 阅读源代码前的准备
1.1 准备源代码学习环境
1.2 获取Hadoop源代码
1.3 搭建Hadoop源代码阅读环境
1.4 Hadoop源代码组织结构
1.5 Hadoop初体验
1.6 编译及调试Hadoop源代码
1.7 小结
第2章 MapReduce设计理念与基本架构
2.1 Hadoop发展史
2.2 Hadoop MapReduce设计目标
2.3 MapReduce编程模型概述
2.4 Hadoop基本架构
2.5 Hadoop MapReduce作业的生命周期
2.6 小结
第二部分 MapReduce编程模型篇
第3章 MapReduce编程模型
3.1 MapReduce编程模型概述
3.2 MapReduce API基本概念
3.3 Java API解析
3.4 非Java API解析
3.5 Hadoop工作流
3.6 小结
第三部分 MapReduce核心设计篇
第4章 Hadoop RPC框架解析
4.1 Hadoop RPC框架概述
4.2 Java基础知识
4.3 Hadoop RPC基本框架分析
4.4 MapReduce通信协议分析
4.5 小结
第5章 作业提交与初始化过程分析
5.1 作业提交与初始化概述
5.2 作业提交过程详解
5.3 作业初始化过程详解
5.4 Hadoop DistributedCache原理分析
5.5 小结
第6章 JobTracker内部实现剖析
6.1 JobTracker概述
6.2 JobTracker启动过程分析
6.3 心跳接收与应答
6.4 Job和Task运行时信息维护
6.5 容错机制
6.6 任务推测执行原理
6.7 Hadoop资源管理
6.8 小结
第7章 TaskTracker内部实现剖析
7.1 TaskTracker概述
7.2 TaskTracker启动过程分析
7.3 心跳机制
7.4 TaskTracker行为分析
7.5 作业目录管理
7.6 启动新任务
7.7 小结
第8章 Task运行过程分析
8.1 Task运行过程概述
8.2 基本数据结构和算法
8.3 Map Task内部实现
8.4 Reduce Task内部实现
8.5 Map/Reduce Task优化
8.6 小结
第四部分 MapReduce高级篇
第9章 Hadoop性能调优
9.1 概述
9.2 从管理员角度进行调优
9.3 从用户角度进行调优
9.4 小结
第10章 Hadoop多用户作业调度器
10.1 多用户调度器产生背景
10.2 HOD
10.3 Hadoop队列管理机制
10.4 Capacity Scheduler实现
10.5 Fair Scheduler实现
10.6 其他Hadoop调度器介绍
10.7 小结
第11章 Hadoop安全机制
11.1 Hadoop安全机制概述
11.2 基础知识
11.3 Hadoop安全机制实现
11.4 应用场景总结
11.5 小结
第12章 下一代MapReduce框架
12.1 第一代MapReduce框架的局限性
12.2 下一代MapReduce框架概述
12.3 Apache YARN
12.4 Facebook Corona
12.5 Apache Mesos
12.6 小结
附录A 安装Hadoop过程中可能存在的问题及解决方案
附录B Hadoop默认HTTP端口号以及HTTP地址
参考资料
前言
为什么要写这本书
突然之间,大数据一下子就“火”了,开源软件Hadoop也因此水涨船高。得益于一些国际领先厂商,尤其是FaceBook、Yahoo!以及阿里巴巴等互联网巨头的现身说法,Hadoop被看成大数据分析的“神器”。IDC在对中国未来几年的预测中就专门提到了大数据,其认为未来几年,会有越来越多的企业级用户试水大数据平台和应用,而这之中,Hadoop将成为最耀眼的“明星”。
尽管Hadoop整个生态系统是开源的,但是,由于它包含的软件种类过多,且版本升级过快,大部分公司,尤其是一些中小型公司,难以在有限的时间内快速掌握Hadoop蕴含的价值。此外,Hadoop自身版本的多样化也给很多研发人员带来了很大的学习负担。尽管当前市面上已有很多参考书籍,比如《Hadoop:The Definitive Guide》、《Hadoop in Action》、《Pro Hadoop》、《Hadoop Operations》等,但是,至今还没有一本书能够深入地剖析Hadoop内部的实现细节,比如JobTracker实现、作业调度器实现等。也正因如此,很多Hadoop初学者和研发人员只能参考网络上一些零星的源代码分析的文章,自己一点一点地阅读源代码,缓慢地学习Hadoop。而本书正是为了解决以上各种问题而编写的,它是国内第一本深入剖析Hadoop内部实现细节的书籍。
本书以Hadoop 1.0为基础,深入剖析了Hadoop MapReduce中各个组件的实现细节,包括RPC框架、JobTracker实现、TaskTracker实现、Task实现和作业调度器实现等。书中不仅详细介绍了MapReduce各个组件的内部实现原理,而且结合源代码进行了深入的剖析,使读者可以快速全面地掌握Hadoop MapR ............

书籍插图:
书籍《Hadoop技术内幕-董西成》 - 插图1
书籍《Hadoop技术内幕-董西成》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » Hadoop技术内幕-董西成 - (EPUB全文下载)