《机器学习系统设计》Willi Richert - (EPUB全文下载)

文件大小:3.6 mb。
文件格式:epub 格式。
书籍内容:

版权信息书名:机器学习系统设计
作者:Willi Richert, Luis Pedro Coelho
译者:刘峰
ISBN:978-7-115-35682-6
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
目录版权声明译者序作者致谢关于作者关于审校者前言第1章 Python机器学习入门1.1 梦之队:机器学习与Python1.2 这本书将教给你什么(以及不会教什么)1.3 遇到困难的时候怎么办1.4 开始1.4.1 NumPy、SciPy和Matplotlib简介1.4.2 安装Python1.4.3 使用NumPy和SciPy智能高效地处理数据1.4.4 学习NumPy1.4.5 学习SciPy1.5 我们第一个(极小的)机器学习应用1.5.1 读取数据1.5.2 预处理和清洗数据1.5.3 选择正确的模型和学习算法1.6 小结第2章 如何对真实样本分类2.1 Iris数据集2.1.1 第一步是可视化2.1.2 构建第一个分类模型2.2 构建更复杂的分类器2.3 更复杂的数据集和更复杂的分类器2.3.1 从Seeds数据集中学习2.3.2 特征和特征工程2.3.3 最邻近分类2.4 二分类和多分类2.5 小结第3章 聚类:寻找相关的帖子3.1 评估帖子的关联性3.1.1 不应该怎样3.1.2 应该怎样3.2 预处理:用相近的公共词语个数来衡量相似性3.2.1 将原始文本转化为词袋3.2.2 统计词语3.2.3 词语频次向量的归一化3.2.4 删除不重要的词语3.2.5 词干处理3.2.6 停用词兴奋剂3.2.7 我们的成果和目标3.3 聚类3.3.1 K均值3.3.2 让测试数据评估我们的想法3.3.3 对帖子聚类3.4 解决我们最初的难题换个角度看噪声3.5 调整参数3.6 小结第4章 主题模型4.1 潜在狄利克雷分配(LDA)构建主题模型4.2 在主题空间比较相似度对整个维基百科建模4.3 选择主题个数4.4 小结第5章 分类:检测劣质答案5.1 路线图概述5.2 学习如何区分出优秀的答案5.2.1 调整样本5.2.2 调整分类器5.3 获取数据5.3.1 将数据消减到可处理的程度5.3.2 对属性进行预选择和处理5.3.3 定义什么是优质答案5.4 创建第一个分类器5.4.1 从k邻近(kNN)算法开始5.4.2 特征工程5.4.3 训练分类器5.4.4 评估分类器的性能5.4.5 设计更多的特征5.5 决定怎样提升效果5.5.1 偏差-方差及其折中5.5.2 解决高偏差5.5.3 解决高方差5.5.4 高偏差或低偏差5.6 采用逻辑回归5.6.1 一点数学和一个小例子5.6.2 在帖子分类问题上应用逻辑回归5.7 观察正确率的背后:准确率和召回率5.8 为分类器瘦身5.9 出货5.10 小结第6章 分类II:情感分析6.1 路线图概述6.2 获取推特(Twitter)数据6.3 朴素贝叶斯分类器介绍6.3.1 了解贝叶斯定理6.3.2 朴素6.3.3 使用朴素贝叶斯进行分类6.3.4 考虑未出现的词语和其他古怪情况6.3.5 考虑算术下溢6.4 创建第一个分类器并调优6.4.1 先解决一个简单问题6.4.2 使用所有的类6.4.3 对分类器的参数进行调优6.5 清洗推文6.6 将词语类型考虑进去6.6.1 确定词语的类型6.6.2 用SentiWordNet成功地作弊6.6.3 我们第一个估算器6.6.4 把所有东西融合在一起6.7 小结第7章 回归:推荐7.1 用回归预测房价7.1.1 多维回归7.1.2 回归里的交叉验证7.2 惩罚式回归7.2.1 L1和L2惩罚7.2.2 在Scikit-learn中使用Lasso或弹性网7.3 P大于N的情形7.3.1 基于文本的例子7.3.2 巧妙地设置超参数(hyperparameter)7.3.3 评分预测和推荐7.4 小结第8章 回归:改进的推荐8.1 改进的推荐8.1.1 使用二值推荐矩阵8.1.2 审视电影的近邻8.1.3 组合多种方法8.2 购物篮分析8.2.1 获取有用的预测8.2.2 分析超市购物篮8.2.3 关联规则挖掘8.2.4 更多购物篮分析的高级话题8.3 小结第9章 分类III:音乐体裁分类9.1 路线图概述9.2 获取音乐数据转换成音频格式9.3 观察音乐将音乐分解成正弦波形成分9.4 用FFT构建第一个分类器9.4.1 增加实验敏捷性9.4.2 训练分类器9.4.3 在多分类问题中用混淆矩阵评估正确率9.4.4 另一种方式评估分类器效果:受试者工作特征曲线(ROC)9.5 用梅尔倒频谱系数(MFCC)提升分类效果9.6 小结第10章 计算机视觉:模式识别10.1 图像处理简介10.2 读取和显示图像10.2.1 图像处理基础10.2.2 加入椒盐噪声10.2.3 模式识别10.2.4 计算图像特征10.2.5 设计你自己的特征10.3 在更难的数据集上分类10.4 局部特征表示10.5 小结第11章 降维11.1 路线图11.2 选择特征11.2.1 用筛选器检测冗余特征11.2.2 用封装器让模型选择特征11.3 其他特征选择方法11.4 特征抽取11.4.1 主成分分析(PCA)11.4.2 PCA的局限性以及LDA会有什么帮助11.5 多维标度法(MDS)11.6 小结第12章 大数据12.1 了解大数据12.2 用Jug程序包把你的处理流程分解成几个任务12.2.1 关于任务12.2.2 复用部分结果12.2.3 幕后的工作原理12.2.4 用Jug分析数据12.3 使用亚马逊Web服务(AWS)12.3.1 构建你的第一台机器12.3.2 用starc ............

书籍插图:
书籍《机器学习系统设计》 - 插图1
书籍《机器学习系统设计》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » 《机器学习系统设计》Willi Richert - (EPUB全文下载)