Greenplum:从大数据战略到实现 - (EPUB全文下载)
文件大小:0.72 mb。
文件格式:epub 格式。
书籍内容:
Greenplum:从大数据战略到实现
第1章 ABC:人工智能、大数据和云计算
1.1 再谈云计算
1.1.1 云计算由南向转为北向
1.1.2 P层云的精细化发展
1.1.3 大数据系统在云中部署不断朝南上移
1.2 大数据
1.2.1 从CRUD到CRAP
1.2.2 MPP(大规模并行计算)
1.2.3 大数据系统
1.2.4 当大数据遇到云计算
1.3 人工智能
1.3.1 模型化方法
1.3.2 AI的发展史
1.3.3 对AI应用的正确预期
1.4 ABC之间的关系
1.5 AI和人
1.5.1 经验与逻辑
1.5.2 公理化的逻辑系统
1.5.3 图灵机和可计算数
1.5.4 认知边界上的考量
第2章 建立基于大数据的高阶数字化战略
2.1 基于云原生应用的数字化战略
2.2 大数据和AI:企业未来的终极竞争点
2.3 大数据战略的落地
2.3.1 大数据和AI人才
2.3.2 AI驱动的开发方法和文化
2.3.3 大数据基础设施的建设
2.4 大数据和AI的展望
第二部分 大数据平台
第3章 数据处理平台的演进
3.1 前数据处理时代
3.2 早期的电子数据处理
3.2.2 软件
3.3 数据库
3.3.1 数据模型
3.3.2 数据独立性和高级数据处理语言
3.3.3 数据保护
3.3.4 数据库早期发展过程中的困境
3.4 NoSQL数据库
3.4.1 NoSQL出现的背景
3.4.2 NoSQL产品的共性
3.4.3 NoSQL的分类
3.5 SQL数据库的回归
3.5.2 Hadoop不等于大数据
3.5.3 SQL从未离开
3.6 集成数据处理和分析平台
3.6.1 数据类型
3.6.2 业务场景
3.6.3 集中还是分散
3.7 数据平台的选型
3.8 小结
第4章 Greenplum数据库快速入门
4.1 Greenplum数据库的发展和现状
4.2 Greenplum数据库的特性
4.3 Greenplum数据库的组成
4.4 Greenplum数据库的安装与部署
4.4.1 准备工作
4.4.2 安装Greenplum
4.4.3 初始化Greenplum数据库
4.5 Greenplum数据库的常用操作
4.6 Greenplum数据库的常用命令
4.6.1 gpstart
4.6.2 gpstop
4.6.3 gpstate
4.6.4 gpactivatestandby
4.6.5 gpconfig
4.6.6 gpdeletesystem
4.7 小结
第5章 Greenplum的架构和核心引擎
5.1 Greenplum的架构
5.1.1 Greenplum Master
5.1.2 Greenplum Segment
5.1.3 Greenplum Interconnect
5.1.4 Greenplum Standby Master
5.1.5 Greenplum Mirror Segment
5.2 Greenplum查询计划
5.2.1 单机查询计划
5.2.2 并行查询计划
5.3 Greenplum数据库查询处理的过程
5.3.1 Greenplum数据库的主要功能组件
5.3.2 Greenplum数据库查询的执行流程
5.4 小结
第6章 从ETL到数据联邦和数据虚拟化
6.1 Greenplum中的ETL
6.1.1 PostgreSQL的ETL工具箱
6.1.2 GPLOAD
6.2 Greenplum的数据联邦
6.2.1 dblink简介
6.2.2 外部表
6.2.3 GPFDIST外部表
6.2.4 可执行外部表
6.2.5 Greenplum的S3外部表
6.2.6 GPHDFS外部表
6.2.7 Spark连接器
6.2.8 Gemfire连接器
6.3 Greenplum的数据虚拟化框架
6.3.1 PXF的架构
6.3.2 PXF的环境配置
6.3.3 GPHDFS与PXF比较
6.4 小结
第7章 混合负载和资源管理
7.1 混合负载的机遇和挑战
7.2 混合负载的业务和技术要求
7.3 资源管理
7.4 并发管理
7.5 小结
第三部分 机器学习与数据分析
第8章 Greenplum中的过程化编程语言
8.1 PL/Python
8.1.1 PL/Python简介
8.1.2 受信任的过程化编程语言
8.1.3 安装Python包
8.1.4 安装Greenplum数据计算Python包集合
8.1.5 类型转换
8.1.6 PL/Python函数中的数据共享
8.2 PL/R
8.2.1 PL/R简介
8.2.2 安装R包
8.2.3 安装Greenplum数据计算R包集合
8.3 PL/Container
8.3.1 PL/Container简介
8.3.2 一个简单的例子
8.3.3 PL/Container的基本操作方法
8.3.4 PL/Container实践总结
8.3.5 关于PL/Container的开发
8.4 小结
第9章 MADlib机器学习库
9.1 MADlib入门
9.1.2 MADlib的特点
9.1.3 MADlib与其他机器学习算法库的比较
9.1.4 MADlib的快速安装
9.2 MADlib的架构
9.2.1 SQL用户接口
9.2.2 Python驱动函数
9.2.3 C++机器学习算法实现
9.2.4 C++数据库抽象层
9.3 MADlib应用
9.3.1 数据预处理
9.3.2 监督学习
9.3.3 非监督学习
9.3.4 时间序列
9.3.5 自定义机器学习算法
9.4 小结
第10章 Greenplum半结构化文本数据分析
10.1 GPText文本分析概述
10.1.1 GPText数据提取
10.1.2 GPText的文本处理、索引流程和高阶分析
10.2 GPText内置的全文检索引擎:Apache SolrCloud
10.3 GPText架构:高速并行索引和查询 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » Greenplum:从大数据战略到实现 - (EPUB全文下载)