利用Python进行数据分析(原书第2版) - (EPUB全文下载)
文件大小:0.66 mb。
文件格式:epub 格式。
书籍内容:
利用Python进行数据分析(原书第2版)
第1章 准备工作
1.1.1 什么类型的数据
1.2 为何利用Python进行数据分析
1.2.1 Python作为胶水
1.2.2 解决“双语言”难题
1.2.3 为何不使用Python
1.3 重要的Python库
1.3.1 NumPy
1.3.2 pandas
1.3.3 matplotlib
1.3.4 IPython与Jupyter
1.3.5 SciPy
1.3.6 scikit-learn
1.3.7 statsmodels
1.4 安装与设置
1.4.1 Windows
1.4.2 Apple(OS X和macOS)
1.4.3 GNU/Linux
1.4.4 安装及更新Python包
1.4.5 Python 2和Python 3
1.4.6 集成开发环境和文本编辑器
1.5 社区和会议
1.6 快速浏览本书
1.6.1 代码示例
1.6.2 示例数据
1.6.3 导入约定
1.6.4 术语
第2章 Python语言基础、IPython及Jupyter notebook
2.1 Python解释器
2.2 IPython基础
2.2.1 运行IPython命令行
2.2.2 运行Jupyter notebook
2.2.3 Tab补全
2.2.4 内省
2.2.5 %run命令
2.2.6 执行剪贴板中的程序
2.2.7 终端快捷键
2.2.8 关于魔术命令
2.2.9 matplotlib集成
2.3 Python语言基础
2.3.1 语言语义
2.3.2 标量类型
2.3.3 控制流
第3章 内建数据结构、函数及文件
3.1 数据结构和序列
3.1.1 元组
3.1.2 列表
3.1.3 内建序列函数
3.1.4 字典
3.1.5 集合
3.1.6 列表、集合和字典的推导式
3.2 函数
3.2.1 命名空间、作用域和本地函数
3.2.2 返回多个值
3.2.3 函数是对象
3.2.4 匿名(Lambda)函数
3.2.5 柯里化:部分参数应用
3.2.6 生成器
3.2.7 错误和异常处理
3.3 文件与操作系统
3.3.1 字节与Unicode文件
3.4 本章小结
第4章 NumPy基础:数组与向量化计算
4.1 NumPy ndarray:多维数组对象
4.1.1 生成ndarray
4.1.2 ndarray的数据类型
4.1.3 NumPy数组算术
4.1.4 基础索引与切片
4.1.5 布尔索引
4.1.6 神奇索引
4.1.7 数组转置和换轴
4.2 通用函数:快速的逐元素数组函数
4.3 使用数组进行面向数组编程
4.3.1 将条件逻辑作为数组操作
4.3.2 数学和统计方法
4.3.3 布尔值数组的方法
4.3.4 排序
4.3.5 唯一值与其他集合逻辑
4.4 使用数组进行文件输入和输出
4.5 线性代数
4.6 伪随机数生成
4.7 示例:随机漫步
4.7.1 一次性模拟多次随机漫步
4.8 本章小结
第5章 pandas入门
5.1 pandas数据结构介绍
5.1.1 Series
5.1.2 DataFrame
5.1.3 索引对象
5.2 基本功能
5.2.1 重建索引
5.2.2 轴向上删除条目
5.2.3 索引、选择与过滤
5.2.4 整数索引
5.2.5 算术和数据对齐
5.2.6 函数应用和映射
5.2.7 排序和排名
5.2.8 含有重复标签的轴索引
5.3 描述性统计的概述与计算
5.3.1 相关性和协方差
5.3.2 唯一值、计数和成员属性
5.4 本章小结
第6章 数据载入、存储及文件格式
6.1 文本格式数据的读写
6.1.1 分块读入文本文件
6.1.2 将数据写入文本格式
6.1.3 使用分隔格式
6.1.4 JSON数据
6.1.5 XML和HTML:网络抓取
6.2 二进制格式
6.2.1 使用HDF5格式
6.2.2 读取Microsoft Excel文件
6.3 与Web API交互
6.4 与数据库交互
6.5 本章小结
第7章 数据清洗与准备
7.1 处理缺失值
7.1.1 过滤缺失值
7.1.2 补全缺失值
7.2 数据转换
7.2.1 删除重复值
7.2.2 使用函数或映射进行数据转换
7.2.3 替代值
7.2.4 重命名轴索引
7.2.5 离散化和分箱
7.2.6 检测和过滤异常值
7.2.7 置换和随机抽样
7.2.8 计算指标/虚拟变量
7.3 字符串操作
7.3.1 字符串对象方法
7.3.2 正则表达式
7.3.3 pandas中的向量化字符串函数
7.4 本章小结
第8章 数据规整:连接、联合与重塑
8.1 分层索引
8.1.1 重排序和层级排序
8.1.2 按层级进行汇总统计
8.1.3 使用DataFrame的列进行索引
8.2 联合与合并数据集
8.2.1 数据库风格的DataFrame连接
8.2.2 根据索引合并
8.2.3 沿轴向连接
8.2.4 联合重叠数据
8.3 重塑和透视
8.3.1 使用多层索引进行重塑
8.3.2 将“长”透视为“宽”
8.3.3 将“宽”透视为“长”
8.4 本章小结
第9章 绘图与可视化
9.1 简明matplotlib API入门
9.1.1 图片与子图
9.1.2 颜色、标记和线类型
9.1.3 刻度、标签和图例
9.1.4 注释与子图加工
9.1.5 将图片保存到文件
9.1.6 matplotlib设置
9.2 使用pandas和seaborn绘图
9.2.1 折线图
9.2.2 柱状图
9.2.3 直方图和密度图
9.2.4 散点图或点图
9.2.5 分面网格和分类数据
9.3 其他Python可视化工具
9.4 本章小结
第10章 数据聚合与分组操作
10.1 GroupBy机制
10.1.1 遍历各分组
10.1.2 选择一列或所有列的子集
10.1.3 使用字典和Series分组
10.1.4 使用 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 利用Python进行数据分析(原书第2版) - (EPUB全文下载)