机器学习实战 - (EPUB全文下载)
文件大小:3.84 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:机器学习实战
作者:Peter Harrington
译者:李锐, 李鹏, 曲亚东, 王斌
ISBN:978-7-115-31795-7
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
目录
版权声明
献词
译者序
前言
致谢
关于本书
关于作者
关于封面
第一部分 分类
第1章 机器学习基础
1.1 何谓机器学习
1.1.1 传感器和海量数据
1.1.2 机器学习非常重要
1.2 关键术语
1.3 机器学习的主要任务
1.4 如何选择合适的算法
1.5 开发机器学习应用程序的步骤
1.6 Python语言的优势
1.6.1 可执行伪代码
1.6.2 Python比较流行
1.6.3 Python语言的特色
1.6.4 Python语言的缺点
1.7 NumPy函数库基础
1.8 本章小结
第2章 k-近邻算法
2.1 k-近邻算法概述
2.1.1 准备:使用Python导入数据
2.1.2 实施kNN分类算法
2.1.3 如何测试分类器
2.2 示例:使用k近邻算法改进约会网站的配对效果
2.2.1 准备数据:从文本文件中解析数据
2.2.2 分析数据:使用Matplotlib创建散点图
2.2.3 准备数据:归一化数值
2.2.4 测试算法:作为完整程序验证分类器
2.2.5 使用算法:构建完整可用系统
2.3 示例:手写识别系统
2.3.1 准备数据:将图像转换为测试向量
2.3.2 测试算法:使用k近邻算法识别手写数字
2.4 本章小结
第3章 决策树
3.1 决策树的构造
3.1.1 信息增益
3.1.2 划分数据集
3.1.3 递归构建决策树
3.2 在Python中使用Matplotlib注解绘制树形图
3.2.1 Matplotlib注解
3.2.2 构造注解树
3.3 测试和存储分类器
3.3.1 测试算法:使用决策树执行分类
3.3.2 使用算法:决策树的存储
3.4 示例:使用决策树预测隐形眼镜类型
3.5 本章小结
第4章 基于概率论的分类方法:朴素贝叶斯
4.1 基于贝叶斯决策理论的分类方法
4.2 条件概率
4.3 使用条件概率来分类
4.4 使用朴素贝叶斯进行文档分类
4.5 使用Python进行文本分类
4.5.1 准备数据:从文本中构建词向量
4.5.2 训练算法:从词向量计算概率
4.5.3 测试算法:根据现实情况修改分类器
4.5.4 准备数据:文档词袋模型
4.6 示例:使用朴素贝叶斯过滤垃圾邮件
4.6.1 准备数据:切分文本
4.6.2 测试算法:使用朴素贝叶斯进行交叉验证
4.7 示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向
4.7.1 收集数据:导入RSS源
4.7.2 分析数据:显示地域相关的用词
4.8 本章小结
第5章 Logistic回归
5.1 基于Logistic回归和Sigmoid函数的分类
5.2 基于最优化方法的最佳回归系数确定
5.2.1 梯度上升法
5.2.2 训练算法:使用梯度上升找到最佳参数
5.2.3 分析数据:画出决策边界
5.2.4 训练算法:随机梯度上升
5.3 示例:从疝气病症预测病马的死亡率
5.3.1 准备数据:处理数据中的缺失值
5.3.2 测试算法:用Logistic回归进行分类
5.4 本章小结
第6章 支持向量机
6.1 基于最大间隔分隔数据
6.2 寻找最大间隔
6.2.1 分类器求解的优化问题
6.2.2 SVM应用的一般框架
6.3 SMO高效优化算法
6.3.1 Platt的SMO算法
6.3.2 应用简化版SMO算法处理小规模数据集
6.4 利用完整Platt SMO算法加速优化
6.5 在复杂数据上应用核函数
6.5.1 利用核函数将数据映射到高维空间
6.5.2 径向基核函数
6.5.3 在测试中使用核函数
6.6 示例:手写识别问题回顾
6.7 本章小结
第7章 利用AdaBoost元算法提高分类性能
7.1 基于数据集多重抽样的分类器
7.1.1 bagging:基于数据随机重抽样的分类器构建方法
7.1.2 boosting
7.2 训练算法:基于错误提升分类器的性能
7.3 基于单层决策树构建弱分类器
7.4 完整AdaBoost算法的实现
7.5 测试算法:基于AdaBoost的分类
7.6 示例:在一个难数据集上应用AdaBoost
7.7 非均衡分类问题
7.7.1 其他分类性能度量指标:正确率、召回率及ROC曲线
7.7.2 基于代价函数的分类器决策控制
7.7.3 处理非均衡问题的数据抽样方法
7.8 本章小结
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
8.1 用线性回归找到最佳拟合直线
8.2 局部加权线性回归
8.3 示例:预测鲍鱼的年龄
8.4 缩减系数来“理解”数据
8.4.1 岭回归
8.4.2 lasso
8.4.3 前向逐步回归
8.5 权衡偏差与方差
8.6 示例:预测乐高玩具套装的价格
8.6.1 收集数据:使用Google购物的API
8.6.2 训练算法:建立模型
8.7 本章小结
第9章 树回归
9.1 复杂数据的局部性建模
9.2 连续和离散型特征的树的构建
9.3 将CART算法用于回归
9.3.1 构建树
9.3.2 运行代码
9.4 树剪枝
9.4.1 预剪枝
9.4.2 后剪枝
9.5 模型树
9.6 示例:树回归与标准回归的比较
9.7 使用Python的Tkinter库创建GUI
9.7.1 用Tkinter创建GUI
9.7.2 集成Matplotlib和Tkinter
9.8 本章小结
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 机器学习实战 - (EPUB全文下载)