MapReduce设计模式 - (EPUB全文下载)
文件大小:3.49 mb。
文件格式:epub 格式。
书籍内容:
目 录
版权信息
内容提要
版权声明
O'Reilly Media,Inc.介绍
译者序
前言
第1章 设计模式与MapReduce
1.1 设计模式
1.2 MapReduce简史
1.3 MapReduce和Hadoop简介
1.4 Hadoop示例:单词计数
1.5 Pig和Hive
第2章 概要模式
2.1 数值概要
2.1.1 模式描述
2.1.2 数值概要示例
2.2 倒排索引概要
2.2.1 模式描述
2.2.2 倒排索引示例
2.3 计数器计数
2.3.1 模式描述
2.3.2 计数器计数示例
第3章 过滤模式
3.1 过滤
3.1.1 模式描述
3.1.2 过滤示例
3.2 布隆过滤
3.2.1 模式描述
3.2.2 布隆过滤器示例
3.3 Top 10
3.3.1 模式描述
3.3.2 Top 10示例
3.4 去重
3.4.1 模式描述
3.4.2 去重示例
第4章 数据组织模式
4.1 分层结构
4.1.1 模式描述
4.1.2 分层结构示例
4.2 分区
4.2.1 模式描述
4.2.2 分区示例
4.3 分箱
4.3.1 模式描述
4.3.2 分箱示例
4.4 全排序
4.4.1 模式描述
4.4.2 全排序示例
4.5 混排
4.5.1 模式描述
4.5.2 混排示例
第5章 连接模式
5.1 连接简介
5.2 reduce端连接
5.2.1 模式描述
5.2.2 reduce端连接示例
5.2.3 使用布隆过滤器的reduce端连接
5.3 复制连接
5.3.1 模式描述
5.3.2 复制连接示例
5.4 组合连接
5.4.1 模式描述
5.4.2 组合连接示例
5.5 笛卡儿积
5.5.1 模式描述
5.5.2 笛卡儿积示例
第6章 元模式
6.1 作业链
6.1.1 关于驱动程序
6.1.2 作业链示例
6.1.3 关于shell脚本
6.1.4 关于JobControl
6.2 链折叠
6.2.1 ChainMapper方法和ChainReducer方法
6.2.2 链折叠示例
6.3 作业归并
作业归并示例
第7章 输入和输出模式
7.1 在Hadoop中自定义输入和输出
7.1.1 InputFormat
7.1.2 RecordReader
7.1.3 OutputFormat
7.1.4 RecordWriter
7.2 生成数据
7.2.1 模式描述
7.2.2 生成数据示例
7.3 外部源输出
7.3.1 模式描述
7.3.2 外部源输出示例
7.4 外部源输入
7.4.1 模型描述
7.4.2 外部源输入示例
7.5 分区裁剪
7.5.1 模式描述
7.5.2 分区裁剪示例
第8章 最后的思考与设计模式的未来
8.1 数据的本质趋势
8.1.1 图像、音频和视频
8.1.2 流式数据
8.2 YARN的影响
8.3 作为库或者组件的模式
8.4 读者可以帮到什么
附录 布隆过滤器
A.1 综述
A.2 用例
A.2.1 表示一个数据集
A.2.2 减少外部数据库查询
A.2.3 谷歌BigTable
A.3 缺点
A.4 调整你的布隆过滤器
欢迎来到异步社区!
版权信息
书名:MapReduce设计模式
ISBN:978-7-115-36094-6
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
• 著 [美] Donald Miner Adam Shook
译 徐 钊 赵重庆
责任编辑 杨海玲
• 人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
• 读者服务热线:(010)81055410
反盗版热线:(010)81055315
内容提要
MapReduce作为一种分布式海量数据处理的编程框架,已经得到业界的广泛关注。随着Hadoop的普及,MapReduce目前已经成为海量数据处理的最基础但也是最重要的方法之一。
这是一本关于设计模式的书,为读者提供解决问题的模板或通用指南。书中主要介绍编程模式,即如何利用MapReduce框架解决一类问题,重在提供解决问题的方法和思路。作者花大量篇幅介绍各种模式的原理及实现机制,并给出相应的应用实例,让读者对每种模式能有更直观的理解。
由于本书不会过多涉及底层框架及MapReduce API,所以希望读者阅读本书之前,能够对Hadoop系统有所了解,知道如何编写MapReduce程序,并了解MapReduce程序框架的工作原理。本书面向中高级MapReduce开发者,涵盖了绝大部分MapReduce编程可能面对的场景,相信初学者和专家同样可以在本书中得到一些启示。
版权声明
Copyright ©2013 by O’Reilly Media, Inc.
Simplified Chinese Edition, jointly published by O’Reilly Media, Inc. and Posts & Telecom Press, 2014. Authorized translation of the English edition, 2014 O’Reilly Media, Inc., the owner of all rights to publish and sell the same.
All rights reserved including the rights of reproduction in whole or in part in any form.
本书中文简体 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » MapReduce设计模式 - (EPUB全文下载)