从零开始学Hadoop大数据分析(视频教学版) - (EPUB全文下载)
文件大小:0.86 mb。
文件格式:epub 格式。
书籍内容:
从零开始学Hadoop大数据分析(视频教学版)
第1篇 Hadoop基础知识
第1章 初识Hadoop
1.1 大数据初探
1.1.1 大数据技术
1.1.2 大数据技术框架
1.1.3 大数据的特点
1.1.4 大数据在各个行业中的应用
1.1.5 大数据计算模式
1.1.6 大数据与云计算、物联网的关系
1.2 Hadoop简介
1.2.1 Hadoop应用现状
1.2.2 Hadoop简介与意义
1.3 小结
第2章 Hadoop的安装与配置
2.1 虚拟机的创建
2.2 安装Linux系统
2.3 配置网络信息
2.4 克隆服务器
2.5 SSH免密码登录
2.6 安装和配置JDK
2.6.1 上传安装包
2.6.2 安装JDK
2.6.3 配置环境变量
2.7 Hadoop环境变量配置
2.7.1 解压缩Hadoop压缩包
2.7.2 配置Hadoop的bin和sbin文件夹到环境变量中
2.7.3 修改/etc/hadoop/hadoop-env.sh
2.8 Hadoop分布式安装
2.8.1 伪分布式安装
2.8.2 完全分布式安装
2.9 小结
第3章 Hadoop分布式文件系统
3.1 DFS介绍
3.1.1 什么是DFS
3.1.2 DFS的结构
3.2 HDFS介绍
3.2.1 HDFS的概念及体系结构
3.2.2 HDFS的设计
3.2.3 HDFS的优点和缺点
3.2.4 HDFS的执行原理
3.2.5 HDFS的核心概念
3.2.6 HDFS读文件流程
3.2.7 HDFS写文件流程
3.2.8 Block的副本放置策略
3.3 Hadoop中HDFS的常用命令
3.3.1 对文件的操作
3.3.2 管理与更新
3.4 HDFS的应用
3.4.1 基于Shell的操作
3.4.2 基于Java API的操作
3.4.3 创建文件夹
3.4.4 递归显示文件
3.4.5 文件上传
3.4.6 文件下载
3.5 小结
第4章 基于Hadoop 3的HDFS高可用
4.1 Hadoop 3.x的发展
4.1.1 Hadoop 3新特性
4.1.2 Hadoop 3 HDFS集群架构
4.2 Hadoop 3 HDFS完全分布式搭建
4.2.1 安装JDK
4.2.2 配置JDK环境变量
4.2.3 配置免密码登录
4.2.4 配置IP和主机名字映射关系
4.2.5 SSH免密码登录设置
4.2.6 配置Hadoop 3.1.0
4.3 什么是HDFS高可用
4.3.1 HDFS高可用实现原理
4.3.2 HDFS高可用实现
4.4 搭建HDFS高可用
4.4.1 配置ZooKeeper
4.4.2 配置Hadoop配置文件
4.4.3 将配置文件复制到其他节点上
4.4.4 启动JN节点
4.4.5 格式化
4.4.6 复制元数据到node2节点上
4.4.7 格式化ZKFC
4.4.8 启动集群
4.4.9 通过浏览器查看集群状态
4.4.10 高可用测试
4.5 小结
第2篇 Hadoop核心技术
第5章 Hadoop的分布式协调服务——ZooKeeper
5.1 ZooKeeper的核心概念
5.1.1 Session会话机制
5.1.2 数据节点、版本与Watcher的关联
5.1.3 ACL策略
5.2 ZooKeeper的安装与运行
5.3 ZooKeeper服务器端的常用命令
5.4 客户端连接ZooKeeper的相关操作
5.4.1 查看ZooKeeper常用命令
5.4.2 connect命令与ls命令
5.4.3 create命令——创建节点
5.4.4 get命令——获取数据与信息
5.4.5 set命令——修改节点内容
5.4.6 delete命令——删除节点
5.5 使用Java API访问ZooKeeper
5.5.1 环境准备与创建会话实例
5.5.2 节点创建实例
5.5.3 Java API访问ZooKeeper实例
5.6 小结
第6章 分布式离线计算框架——MapReduce
6.1 MapReduce概述
6.1.1 MapReduce的特点
6.1.2 MapReduce的应用场景
6.2 MapReduce执行过程
6.2.1 单词统计实例
6.2.2 MapReduce执行过程
6.2.3 Map Reduce的文件切片——Split
6.2.4 Map过程和Reduce过程
6.2.5 Shuffle过程
6.3 MapReduce实例
6.3.1 WordCount本地测试实例
6.3.2 ETL本地测试实例
6.4 温度排序实例
6.4.1 时间和温度的封装类MyKey.Java
6.4.2 Map任务MyMapper.java
6.4.3 数据分组类MyGroup.Java
6.4.4 温度排序类MySort.java
6.4.5 数据分区MyPartitioner.java
6.4.6 Reducer任务MyReducer.java
6.4.7 主函数RunJob.java
6.5 小结
第7章 Hadoop的集群资源管理系统——YARN
7.1 为什么要使用YARN
7.2 YARN的基本架构
7.2.1 ResourceManager进程
7.2.2 ApplicationMaster和NodeManager
7.3 YARN工作流程
7.4 YARN搭建
7.5 小结
第8章 Hadoop的数据仓库框架——Hive
8.1 Hive的理论基础
8.1.1 什么是Hive
8.1.2 Hive和数据库的异同
8.1.3 Hive设计的目的与应用
8.1.4 Hive的运行架构
8.1.5 Hive的执行流程
8.1.6 Hive服务
8.1.7 元数据存储Metastore
8.1.8 Embedded模式
8.1.9 Local模式
8.1.10 Remote模式
8.2 Hive的配置与安装
8.2.1 安装MySQL
............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 从零开始学Hadoop大数据分析(视频教学版) - (EPUB全文下载)