精通机器学习:基于R - (EPUB全文下载)
文件大小:4.93 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:精通机器学习:基于R(第2版)
作者:[美] Cory Lesmeister
译者:陈光欣
ISBN:978-7-115-47778-1
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
图灵社区会员 那口虫(wt92328@gmail.com) 专享 尊重版权
前言
本书内容
准备工作
目标读者
排版约定
读者反馈
客户支持
下载示例代码
勘误
反盗版
问题
电子书
第1版前言
定义机器学习
机器学习注意事项
失败的特征工程
过拟合与欠拟合
因果关系
本书内容
准备工作
目标读者
排版约定
读者反馈
客户支持
下载示例代码
勘误
反盗版
问题
第 1 章 成功之路
1.1 流程
1.2 业务理解
1.2.1 确定业务目标
1.2.2 现状评估
1.2.3 确定分析目标
1.2.4 建立项目计划
1.3 数据理解
1.4 数据准备
1.5 建模
1.6 评价
1.7 部署
1.8 算法流程图
1.9 小结
第 2 章 线性回归:机器学习基础技术
2.1 单变量回归
业务理解
2.2 多变量线性回归
2.2.1 业务理解
2.2.2 数据理解和数据准备
2.2.3 模型构建与模型评价
2.3 线性模型中的其他问题
2.3.1 定性特征
2.3.2 交互项
2.4 小结
第 3 章 逻辑斯蒂回归与判别分析
3.1 分类方法与线性回归
3.2 逻辑斯蒂回归
3.2.1 业务理解
3.2.2 数据理解和数据准备
3.2.3 模型构建与模型评价
3.3 判别分析概述
判别分析应用
3.4 多元自适应回归样条方法
3.5 模型选择
3.6 小结
第 4 章 线性模型中的高级特征选择技术
4.1 正则化简介
4.1.1 岭回归
4.1.2 LASSO
4.1.3 弹性网络
4.2 商业案例
4.2.1 业务理解
4.2.2 数据理解和数据准备
4.3 模型构建与模型评价
4.3.1 最优子集
4.3.2 岭回归
4.3.3 LASSO
4.3.4 弹性网络
4.3.5 使用glmnet进行交叉验证
4.4 模型选择
4.5 正则化与分类问题
逻辑斯蒂回归示例
4.6 小结
第 5 章 更多分类技术:K最近邻与支持向量机
5.1 K最近邻
5.2 支持向量机
5.3 商业案例
5.3.1 业务理解
5.3.2 数据理解和数据准备
5.3.3 模型构建与模型评价
5.3.4 模型选择
5.4 SVM中的特征选择
5.5 小结
第 6 章 分类回归树
6.1 本章技术概述
6.1.1 回归树
6.1.2 分类树
6.1.3 随机森林
6.1.4 梯度提升
6.2 商业案例
6.2.1 模型构建与模型评价
6.2.2 模型选择
6.2.3 使用随机森林进行特征选择
6.3 小结
第 7 章 神经网络与深度学习
7.1 神经网络介绍
7.2 深度学习简介
深度学习资源与高级方法
7.3 业务理解
7.4 数据理解和数据准备
7.5 模型构建与模型评价
7.6 深度学习示例
7.6.1 H2O背景介绍
7.6.2 将数据上载到H2O平台
7.6.3 建立训练数据集和测试数据集
7.6.4 模型构建
7.7 小结
第 8 章 聚类分析
8.1 层次聚类
距离的计算
8.2 K均值聚类
8.3 果瓦系数与围绕中心的划分
8.3.1 果瓦系数
8.3.2 PAM
8.4 随机森林
8.5 业务理解
8.6 数据理解与数据准备
8.7 模型构建与模型评价
8.7.1 层次聚类
8.7.2 K均值聚类
8.7.3 果瓦系数和PAM
8.7.4 随机森林与PAM
8.8 小结
第 9 章 主成分分析
9.1 主成分简介
主成分旋转
9.2 业务理解
数据理解与数据准备
9.3 模型构建与模型评价
9.3.1 主成分抽取
9.3.2 正交旋转与解释
9.3.3 根据主成分建立因子得分
9.3.4 回归分析
9.4 小结
第 10 章 购物篮分析、推荐引擎与序列分析
10.1 购物篮分析简介
10.2 业务理解
10.3 数据理解和数据准备
10.4 模型构建与模型评价
10.5 推荐引擎简介
10.5.1 基于用户的协同过滤
10.5.2 基于项目的协同过滤
10.5.3 奇异值分解和主成分分析
10.6 推荐系统的业务理解
10.7 推荐系统的数据理解与数据准备
10.8 推荐系统的建模与评价
10.9 序列数据分析
序列分析应用
10.10 小结
第 11 章 创建集成多类分类
11.1 集成模型
11.2 业务理解与数据理解
11.3 模型评价与模型选择
11.4 多类分类
11.5 业务理解与数据理解
11.6 模型评价与模型选择
11.6.1 随机森林
11.6.2 岭回归
11.7 MLR集成模型
11.8 小结
第 12 章 时间序列与因果关系
12.1 单变量时间序列分析
理解格兰杰因果关系
12.2 业务理解
数据理解与数据准备
12.3 模型构建与模型评价
12.3.1 单变量时间序列预测
12.3.2 检查因果关系
12.4 小结
第 13 章 文本挖掘
13.1 文本挖掘框架与方法
13.2 主题模型
其他定量分析
13.3 业务理解
数据理解与数据准备
13.4 模型构建与模型评价
13.4.1 词频分析与主题模型
13.4.2 其他定量分析
13.5 小结
第 14 章 在云上使用R语言
14.1 创建AWS账户
14.1.1 启动虚拟机
14.1.2 启动Rstudio
14.2 小结
附录 R语言基础
前言
“应该给人第二次机会,但一定要留个心眼儿。”
——约翰·韦恩
人生中,能得到第二次机会可不常见。我还记得完成本书第1版的编辑工作之后,我不停地 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 精通机器学习:基于R - (EPUB全文下载)