白话机器学习算法 - (EPUB全文下载)
文件大小:2.68 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:白话机器学习算法
作者:[新加坡] 黄莉婷 苏川集
译者:武传海
ISBN:978-7-115-50664-1
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
图灵社区会员 蓝色的秋风(qiufenghyf@163.com) 专享 尊重版权
版权声明
序
前言
电子书
为何需要数据科学
第 1 章 基础知识
1.1 准备数据
1.1.1 数据格式
1.1.2 变量类型
1.1.3 变量选择
1.1.4 特征工程
1.1.5 缺失数据
1.2 选择算法
1.2.1 无监督学习
1.2.2 监督学习
1.2.3 强化学习
1.2.4 注意事项
1.3 参数调优
1.4 评价模型
1.4.1 分类指标
1.4.2 回归指标
1.4.3 验证
1.5 小结
第 2 章 k 均值聚类
2.1 找出顾客群
2.2 示例:影迷的性格特征
2.3 定义群组
2.3.1 有多少个群组
2.3.2 每个群组中有谁
2.4 局限性
2.5 小结
第 3 章 主成分分析
3.1 食物的营养成分
3.2 主成分
3.3 示例:分析食物种类
确定主成分数量
3.4 局限性
3.5 小结
第 4 章 关联规则
4.1 发现购买模式
4.2 支持度、置信度和提升度
4.3 示例:分析杂货店的销售数据
4.4 先验原则
4.4.1 寻找具有高支持度的项集
4.4.2 寻找具有高置信度或高提升度的关联规则
4.5 局限性
4.6 小结
第 5 章 社会网络分析
5.1 展现人际关系
5.2 示例:国际贸易
5.3 Louvain 方法
5.4 PageRank 算法
5.5 局限性
5.6 小结
第 6 章 回归分析
6.1 趋势线
6.2 示例:预测房价
6.3 梯度下降法
6.4 回归系数
6.5 相关系数
6.6 局限性
6.7 小结
第 7 章 k 最近邻算法和异常检测
7.1 食品检测
7.2 物以类聚,人以群分
7.3 示例:区分红白葡萄酒
7.4 异常检测
7.5 局限性
7.6 小结
第 8 章 支持向量机
8.1 医学诊断
8.2 示例:预测心脏病
8.3 勾画最佳分界线
8.4 局限性
8.5 小结
第 9 章 决策树
9.1 预测灾难幸存者
9.2 示例:逃离泰坦尼克号
9.3 生成决策树
9.4 局限性
9.5 小结
第 10 章 随机森林
10.1 集体智慧
10.2 示例:预测犯罪行为
10.3 集成模型
10.4 自助聚集法
10.5 局限性
10.6 小结
第 11 章 神经网络
11.1 建造人工智能大脑
11.2 示例:识别手写数字
11.3 神经网络的构成
11.4 激活规则
11.5 局限性
11.6 小结
第 12 章 A/B测试和多臂老虎机
12.1 初识 A/B 测试
12.2 A/B 测试的局限性
12.3 epsilon 递减策略
12.4 示例:多臂老虎机
12.5 胜者为先
12.6 epsilon 递减策略的局限性
12.7 小结
附录 A 无监督学习算法概览
附录 B 监督学习算法概览
附录 C 调节参数列表
附录 D 更多评价指标
D.1 分类指标
D.2 回归指标
术语表
关于作者
版权声明
Authorized translation from the English language edition, titled Numsense! Data Science for the Layman: No Math Added
(ISBN 9789811110689) by Annalyn Ng & Kenneth Soo, Copyright © 2017.
All rights reserved. This book or any portion thereof may not be reproduced, transmitted or used in any manner whatsoever without the express written permission of the authors, except for the use of brief quotations in a book review.
Simplified Chinese language edition published by Posts & Telecom Press, Copyright © 2019.
本书中文简体字版由黄莉婷与苏川集授权人民邮电出版社独家出版。未经出版者书面许可,不得以任何方式复制或抄袭本书内容。
版权所有,侵权必究。
序
如今,大数据已经成为一大产业。随着数据逐渐主导我们的生活,“炼数成金”几乎成为每个机构都关注的焦点,各种模式识别和预测技术也成为提升业务能力的新手段。比如,商品推荐系统对消费者和商家都有好处,它会提醒消费者关注自己可能感兴趣的商品,同时也会帮助商家赚取更多的利润。
然而,大数据并非数据科学的全貌。数据科学是分析和利用数据的一门综合性学科,其范围涵盖机器学习、统计学和相关的数学分支。其中,机器学习占据首要位置,它是驱动模式识别和预测技术的主动力。机器学习算法是数据科学的力量之源,它和数据一起产生极其宝贵的知识,并且帮助我们以新的方式利用已有信息。
对于外行而言,要想理解数据科学如何推动当前的数据革命,就需要对这个领域有更好的认识。尽管现在对数据素养的需求很大,但是由于担心缺乏相关技能,一些人对数据科学领域敬而远之。
这正是莉婷和川集写作本书的缘由所在。我对两位作者的写作风格较为熟悉;在拜读本书之后,我发现这的确是专为外行写的数据科学书,两位作者特意省略了复杂的数学内容,从较高的层次讲 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 白话机器学习算法 - (EPUB全文下载)