数据科学入门 - (EPUB全文下载)
文件大小:3.36 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:数据科学入门
作者:[美] Joel Grus
译者:高蓉 韩波
ISBN:978-7-115-41741-1
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
图灵社区会员 人民邮电出版社(zhanghaichuan@ptpress.com.cn) 专享 尊重版权
版权声明
O'Reilly Media, Inc. 介绍
业界评论
前言
数据科学
从零开始
本书排版约定
示例代码的使用
Safari® Books Online
联系我们
致谢
第 1 章 导论
1.1 数据的威力
1.2 什么是数据科学
1.3 激励假设:DataSciencester
1.3.1 寻找关键联系人
1.3.2 你可能知道的数据科学家
1.3.3 工资与工作年限
1.3.4 付费账户
1.3.5 兴趣主题
1.4 展望
第 2 章 Python 速成
2.1 基础内容
2.1.1 Python获取
2.1.2 Python之禅
2.1.3 空白形式
2.1.4 模块
2.1.5 算法
2.1.6 函数
2.1.7 字符串
2.1.8 异常
2.1.9 列表
2.1.10 元组
2.1.11 字典
2.1.12 集合
2.1.13 控制流
2.1.14 真和假
2.2 进阶内容
2.2.1 排序
2.2.2 列表解析
2.2.3 生成器和迭代器
2.2.4 随机性
2.2.5 正则表达式
2.2.6 面向对象的编程
2.2.7 函数式工具
2.2.8 枚举
2.2.9 压缩和参数拆分
2.2.10 args和kwargs
2.2.11 欢迎来到DataSciencester
2.3 延伸学习
第 3 章 可视化数据
3.1 matplotlib
3.2 条形图
3.3 线图
3.4 散点图
3.5 延伸学习
第 4 章 线性代数
4.1 向量
4.2 矩阵
4.3 延伸学习
第 5 章 统计学
5.1 描述单个数据集
5.1.1 中心倾向
5.1.2 离散度
5.2 相关
5.3 辛普森悖论
5.4 相关系数其他注意事项
5.5 相关和因果
5.6 延伸学习
第 6 章 概率
6.1 不独立和独立
6.2 条件概率
6.3 贝叶斯定理
6.4 随机变量
6.5 连续分布
6.6 正态分布
6.7 中心极限定理
6.8 延伸学习
第 7 章 假设与推断
7.1 统计假设检验
7.2 案例:掷硬币
7.3 置信区间
7.4 P-hacking
7.5 案例:运行A/B测试
7.6 贝叶斯推断
7.7 延伸学习
第 8 章 梯度下降
8.1 梯度下降的思想
8.2 估算梯度
8.3 使用梯度
8.4 选择正确步长
8.5 综合
8.6 随机梯度下降法
8.7 延伸学习
第 9 章 获取数据
9.1 stdin和stdout
9.2 读取文件
9.2.1 文本文件基础
9.2.2 限制的文件
9.3 网络抓取
9.3.1 HTML和解析方法
9.3.2 案例:关于数据的O'Reilly图书
9.4 使用API
9.4.1 JSON(和XML)
9.4.2 使用无验证的API
9.4.3 寻找API
9.5 案例:使用Twitter API
获取证明文件
9.6 延伸学习
第 10 章 数据工作
10.1 探索你的数据
10.1.1 探索一维数据
10.1.2 二维数据
10.1.3 多维数据
10.2 清理与修改
10.3 数据处理
10.4 数据调整
10.5 降维
10.6 延伸学习
第 11 章 机器学习
11.1 建模
11.2 什么是机器学习
11.3 过拟合和欠拟合
11.4 正确性
11.5 偏倚-方差权衡
11.6 特征提取和选择
11.7 延伸学习
第 12 章 k 近邻法
12.1 模型
12.2 案例:最喜欢的编程语言
12.3 维数灾难
12.4 延伸学习
第 13 章 朴素贝叶斯算法
13.1 一个简易的垃圾邮件过滤器
13.2 一个复杂的垃圾邮件过滤器
13.3 算法的实现
13.4 测试模型
13.5 延伸学习
第 14 章 简单线性回归
14.1 模型
14.2 利用梯度下降法
14.3 最大似然估计
14.4 延伸学习
第 15 章 多重回归分析
15.1 模型
15.2 最小二乘模型的进一步假设
15.3 拟合模型
15.4 解释模型
15.5 拟合优度
15.6 题外话:Bootstrap
15.7 回归系数的标准误差
15.8 正则化
15.9 延伸学习
第 16 章 逻辑回归
16.1 问题
16.2 Logistic函数
16.3 应用模型
16.4 拟合优度
16.5 支持向量机
16.6 延伸学习
第 17 章 决策树
17.1 什么是决策树
17.2 熵
17.3 分割之熵
17.4 创建决策树
17.5 综合运用
17.6 随机森林
17.7 延伸学习
第 18 章 神经网络
18.1 感知器
18.2 前馈神经网络
18.3 反向传播
18.4 实例:战胜CAPTCHA
18.5 延伸学习
第 19 章 聚类分析
19.1 原理
19.2 模型
19.3 示例:聚会
19.4 选择聚类数目k
19.5 示例:对色彩进行聚类
19.6 自下而上的分层聚类
19.7 延伸学习
第 20 章 自然语言处理
20.1 词云
20.2 n-grams模型
20.3 语法
20.4 题外话:吉布斯采样
20.5 主题建模
20.6 延伸学习
第 21 章 网络分析
21.1 中介中心度
21.2 特征向量中心度
21.2.1 矩阵乘法
21.2.2 中心度
21.3 有向图与PageRank
21.4 延伸学习
第 22 章 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 数据科学入门 - (EPUB全文下载)