机器学习实践指南 - (EPUB全文下载)

文件大小:0.4 mb。
文件格式:epub 格式。
书籍内容:

机器学习实践指南
第1章 机器学习引言
1.1 什么是机器学习
1.2 分类方法概述
1.3 聚类方法概述
1.4 监督学习概述
1.5 无监督学习概述
1.6 增强学习概述
1.7 结构化预测概述
1.8 神经网络概述
1.9 深度学习概述
第2章 分类
2.1 引言
2.2 判别函数分析:地下卤水地质化学测量
2.3 多元逻辑回归:理解学生的课程计划选择
2.4 Tobit回归:评估学生的学术能力
2.5 泊松回归:理解加拉帕戈斯群岛现存物种
第3章 聚类
3.1 引言
3.2 层次聚类:世界银行样本数据集
3.3 层次聚类:1999~2010年亚马逊雨林的烧毁情况
3.4 层次聚类:基因聚类
3.5 二进制聚类:数学测验
3.6 k均值聚类:欧洲各国蛋白质消耗量
3.7 k均值聚类:食品
第4章 模型选择和正则化
4.1 引言
4.2 压缩方法:每天消耗的卡路里
4.3 降维方法:Delta航空公司航空队
4.4 主成分分析:理解世界菜肴
第5章 非线性
5.1 广义加性模型:衡量新西兰的家庭收入
5.2 平滑样条:理解汽车和速度
5.3 局部回归:理解干旱警告和影响
第6章 监督学习
6.1 引言
6.2 决策树学习:对胸痛患者的预先医疗护理指示
6.3 决策树学习:基于收入的房地产价值分布
6.4 决策树学习:预测股票走势方向
6.5 朴素贝叶斯:预测股票走势方向
6.6 随机森林:货币交易策略
6.7 支持向量机:货币交易策略
6.8 随机梯度下降:成人收入
第7章 无监督学习
7.1 引言
7.2 自组织映射:可视化热图
7.3 矢量量化:图像聚类
第8章 增强学习
8.1 引言
8.2 马尔可夫链:股票区制转移模型
8.3 马尔可夫链:多渠道归因模型
8.4 马尔可夫链:汽车租赁代理服务
8.5 连续马尔可夫链:加油站的车辆服务
8.6 蒙特卡罗模拟:校准Hull-White短期利率
第9章 结构化预测
9.1 引言
9.2 隐马尔可夫模型:欧元和美元
9.3 隐马尔可夫模型:区制检测
第10章 神经网络
10.1 引言
10.2 为S&P 500建模
10.3 衡量失业率
第11章 深度学习
11.1 引言
11.2 循环神经网络:预测周期信号
第12章 案例研究:探索世界银行数据
12.2 探索世界银行数据
第13章 案例研究:再保险合同定价
13.2 再保险合同定价
第14章 案例研究:用电量预测
14.2 用电量测量
第1章 机器学习引言
本章将介绍机器学习及其涵盖的多个话题。你将了解以下内容:
·什么是机器学习
·分类方法概述
·聚类方法概述
·模型的选择和正则化概述
·非线性方法概述
·监督学习概述
·无监督学习概述
·增强学习概述
·结构化预测概述
·神经网络概述
·深度学习概述
1.1 什么是机器学习
人类自出生起就暴露在各种数据中。眼睛、耳朵、鼻子、皮肤、舌头不断收集着各种形式的数据,然后大脑将其转换成视觉、听觉、嗅觉、触觉和味觉。大脑处理各种形式的感觉器官收到的原始数据,并将其转换成语音,进而用语音表达对于这些原始数据的观点。
当今世界,我们用与机器相连的传感器收集数据。从各式各样的网站和社交网络收集数据。之前的手写材料也在电子化、数字化后被加入数据集中。这些形式丰富、从不同数据源中采集的数据需要经过处理才能得到更有洞察力的、更有意义的结果。
机器学习算法有助于从不同数据源收集数据,转换富数据集的形式,并基于分析结果,帮助我们采取明智的行动。机器学习算法是高效、准确的方法,并提供通用的学习方法来解决以下问题:
·处理大规模问题
·做出准确的预测
·解决各种不同的学习问题
·学习哪些结果可以得出,以及在何种条件下这些问题能够学习
机器学习算法的一些应用领域如下:
·基于销售数据的价格预测
·预测药物的分子反应
·检测汽车保险欺诈
·分析股市回报
·识别高风险贷款
·预测风力发电厂产量
·跟踪和监测医疗保健设备的利用率和位置
·计算能源有效利用率
·分析智能城市交通运输增长趋势
·估算采矿业矿产储量
1.2 分类方法概述
线性回归模型本质上进行量化的响应,但是这样的响应本质上是定性的。就像态度(强烈不同意,不同意,中立,同意和强烈同意)这样的响应,其本质上就是定性的。对于一个观察来说,预测一个定性的响应可以视作对这个观察进行分类,因为这涉及把这个观察分配给一个类别或种类。分类器对于今天的许多问题(如药物或基因组学预测、垃圾邮件检测、面部识别和财务问题)来说是非常重要的工具。
1.3 聚类方法概述
聚类是将相似对象聚合成一簇的过程。每一个簇由彼此之间相似并且与其他类的对象不相似的对象组成。聚类的目标是确定一组未标记数据的内在分组。聚类可用于数据挖掘(DNA分析、营销研究、保险研究等),文本挖掘,信息检索,统计计算语言学,以及基于语料库的计算词典学等不同应用领域。聚类算法必须满足如下要求:
·可扩展性
·处理各种类型的属性
·发现任意形状的簇
·处理噪音和异常值的能力
·可解释性和可用性
右图是聚类的一个示例。
1.4 监督学习概述
监督学习需要学习一组输入变量(通常为向量)和输出变量(也称为监控信号)之间的映射,并应用此映射来预测未知数据的输出。监督学习的方法尝试发现输入变量和目标变量之间的关系。发现的关系在称为“模型”的结构中表示。通常隐藏在数据集中的模型描述和现象解释,在知道输入属性的值后,这些模型可以用于预测目标属性的值。
监督学习是从监督的训练数据(训练样本集)推测函数的机器学习任务。训练数据由一组训练样本组成。在监督学习中,每个例子是一组,它由一个输入对象和一个期望的输出值组成。监督学习算法分析训练数据并学习出预测函数。
为了解决监督学习问题,必须执行以下步骤:
1)确定训练样本的类型。
2)收集训练集。
3)确定预测函数的输入变量。
4)确定预测函数的结构和相应的学习算法。
5)完成设计。
6)评估预测函数的准确性。
监督学习的方法可以应用在各个领域,如市场 ............

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » 机器学习实践指南 - (EPUB全文下载)