机器学习实战:基于ScikitLearn和TensorFlow - (EPUB全文下载)
文件大小:0.67 mb。
文件格式:epub 格式。
书籍内容:
机器学习实战:基于ScikitLearn和TensorFlow
第一部分 机器学习基础
什么是机器学习
为什么要使用机器学习
机器学习系统的种类
机器学习的主要挑战
测试与验证
练习
第2章 端到端的机器学习项目
使用真实数据
观察大局
获取数据
从数据探索和可视化中获得洞见
机器学习算法的数据准备
选择和训练模型
微调模型
网格搜索
启动、监控和维护系统
试试看
练习
第3章 分类
MNIST
训练一个二元分类器
性能考核
多类别分类器
错误分析
多标签分类
多输出分类
练习
第4章 训练模型
线性回归
梯度下降
多项式回归
学习曲线
正则线性模型
练习
第5章 支持向量机
线性SVM分类
非线性SVM分类
SVM回归
工作原理
训练目标
练习
第6章 决策树
决策树训练和可视化
做出预测
估算类别概率
CART训练算法
计算复杂度
基尼不纯度还是信息熵
正则化超参数
回归
不稳定性
练习
第7章 集成学习和随机森林
投票分类器
bagging和pasting
Random Patches和随机子空间
随机森林
提升法
堆叠法
练习
第8章 降维
数据降维的主要方法
PCA
核主成分分析
局部线性嵌入
其他降维技巧
练习
第二部分 神经网络和深度学习
安装
创建一个计算图并在会话中执行
管理图
节点值的生命周期
TensorFlow中的线性回归
实现梯度下降
给训练算法提供数据
保存和恢复模型
用TensorBoard来可视化图和训练曲线
命名作用域
模块化
共享变量
练习
第10章 人工神经网络简介
从生物神经元到人工神经元
用TensorFlow的高级API来训练MLP
使用纯TensorFlow训练DNN
微调神经网络的超参数
练习
第11章 训练深度神经网络
梯度消失/爆炸问题
重用预训练图层
快速优化器
通过正则化避免过度拟合
实用指南
练习
第12章 跨设备和服务器的分布式TensorFlow
一台机器上的多个运算资源
多设备跨多服务器
在TensorFlow集群上并行化神经网络
练习
第13章 卷积神经网络
视觉皮层的组织结构
卷积层
池化层
CNN架构
练习
第14章 循环神经网络
循环神经元
TensorFlow中的基本RNN
训练RNN
深层RNN
LSTM单元
GRU单元
自然语言处理
练习
第15章 自动编码器
高效的数据表示
使用不完整的线性自动编码器实现PCA
栈式自动编码器
使用堆叠的自动编码器进行无监控的预训练
去噪自动编码器
稀疏自动编码器
变分自动编码器
其他自动编码器
练习
第16章 强化学习
学习奖励最优化
策略搜索
OpenAI gym介绍
神经网络策略
评估行为:信用分配问题
策略梯度
马尔可夫决策过程
时间差分学习与Q学习
使用深度Q学习玩吃豆人游戏
练习
致谢
附录A 练习答案
附录B 机器学习项目清单
附录C SVM对偶问题
附录D 自动微分
附录E 其他流行的ANN架构
作者介绍
封面介绍
第一部分 机器学习基础
第1章 机器学习概览
大多数人听到“机器学习”这个词,脑海中会浮现出一个机器人:可能是一个可靠的管家,也可能是一个致命的终结者形象,这取决于你问的对象是谁。但是,机器学习已经不仅仅只是一个未来幻想了,它已经存在了。事实上,在某些专门领域的应用中,例如光学字符识别(OCR),它甚至已经存在了几十年。但是,第一个真正成为主流并改善了亿万人民生活的机器学习应用,是20世纪90年代席卷了全世界的垃圾邮件过滤器。它不算是一个有自我意识的天网(Skynet),但从技术上来讲,它确实有资格称为一种机器学习(事实上它也学得很好,我们几乎不需要再手动标记垃圾邮件了)。随后便是数以百计的机器学习应用,默默地为那些我们定期使用的产品和功能提供支持,从更好的推荐系统到语音搜索。
机器学习始于何处,又将终于何方?对机器而言,学习到底意味着什么?如果我下载一份维基百科的副本在我的电脑上,它就真的学到了么?会突然变得更聪明吗?在本章中,我们将首先澄清什么是机器学习,以及我们为什么要使用它。
在我们开始探索机器学习的新大陆之前,先来看看地图,了解一下主要地区和最显著的地标:监督式与无监督式学习,在线学习与批量学习,基于实例的与基于模型的学习。然后,我们将介绍一个典型的机器学习项目的工作流程,讨论你可能会面临的主要挑战,并介绍如何对机器学习系统进行评估和微调。
本章会介绍许多基本的概念(和术语),每一个数据科学家都应该对此烂熟于心。本章是一个高度概括性的介绍(唯一没有太多代码的章节),所述知识也都很简单,但是在你阅读本书的其余部分之前,一定要确保清晰透彻地理解了本章的内容。所以,拿上一杯咖啡,让我们开始吧!
如果你已经知道所有机器学习的基础知识,可以直接跳到第2章。如果不确定,可以尝试回答本章末尾列出的所有问题,然后再继续。
什么是机器学习
机器学习是一门能够让编程计算机从数据中学习的计算机科学(和艺术)。
这里有一个略微笼统的定义:
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。
——Arthur Samuel,1959
还有一个更偏工程化的定义:
一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E的增加而增加,可以称其为学习。
——Tom Mitchell,1997
举例来说,垃圾邮件过滤器就是一个机器学习的程序,它通过垃圾邮件(比如用户手动标记的垃圾邮件)以及常规邮件(非垃圾邮件)的示例,来学习标记垃圾邮件。系统用来学习的这些示例,我们称之为训练集。每一个训练示例称为训练实例或者是训练样本。在本例中,任务T就是给新邮件标记垃圾邮件,经验E则是训练数据,那么衡量性能表现的指标P则需要我们来定义,例如,我们可以使用被正确分类的邮件的比率来衡量。这个特殊的性能衡量标准称为精度,经常用于衡量分类任务。
所以,如果你只是下载了维基百科的副本,你的电脑得到了更多的数据,这并不会给任何任务带来提升。因此,它不是机器学 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 机器学习实战:基于ScikitLearn和TensorFlow - (EPUB全文下载)