机器学习:实用案例解析 - (EPUB全文下载)
文件大小:6.7 mb。
文件格式:epub 格式。
书籍内容:
机器学习
——实用案例解析
[美]Drew Conway
[美]Jobn Myles Wbite 著
ISBN:978-7-111-41731-6
本书纸版由机械工业出版社于2013年出版,电子版由华章分社(北京华章图文信息有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @研发书局
腾讯微博 @yanfabook
目 录
作者介绍
译者介绍
封面介绍
O'Reilly Media, Inc.介绍
业界评论
译者序
前言
致机器学习的黑客们
本书的组织结构
本书约定
示例代码的使用
联系我们
致谢
第1章 使用R语言
R与机器学习
下载和安装R
集成开发环境和文本编辑器
安装和加载R程序包
机器学习中的R基础
深入学习R的参考书目
第2章 数据分析
分析与验证
什么是数据
推断数据的类型
推断数据的含义
数值摘要表
均值、中位数、众数
分位数
标准差和方差
可视化分析数据
列相关的可视化
第3章 分类:垃圾过滤
非此即彼:二分类
漫谈条件概率
试写第一个贝叶斯垃圾分类器
定义分类器并用不易识别的正常邮件进行测试
用所有邮件类型测试分类器
效果改进
第4章 排序:智能收件箱
次序未知时该如何排序
按优先级给邮件排序
邮件优先级的特征
实现一个智能收件箱
用于抽取特征集合的函数
设计用于排序的权重计算策略
邮件线程活跃度的权重计算
训练和测试排序算法
第5章 回归模型:预测网页访问量
回归模型简介
基准模型
使用虚拟变量的回归模型
线性回归简介
预测网页流量
定义相关性
第6章 正则化:文本回归
数据列之间的非线性关系:超越直线
多项式回归简介
避免过拟合的方法
使用正则化来避免过拟合
文本回归
逻辑回归来帮忙
第7章 优化:密码破译
优化简介
岭回归
密码破译优化问题
第8章 PCA:构建股票市场指数
无监督学习
主成分分析
第9章 MDS:可视化地研究参议员相似性
基于相似性聚类
距离度量与多维定标简介
如何对美国参议员做聚类
分析参议员记名投票数据
第10章 kNN:推荐系统
k近邻算法
R语言程序包安装数据
第11章 分析社交图谱
社交网络分析
以图的方式进行思考
用黑客的方法研究Twitter的社交关系图数据
使用Google社交关系图API进行工作
分析Twitter社交网络
区域圈子结构
使用Gephi可视化Twitter聚类网络
建立“感兴趣的人”引擎
第12章 模型比较
SVM:支持向量机
算法比较
参考文献
图书
论文
作者介绍
Drew Conway 机器学习专家,拥有丰富的数据分析与处理工作经验。目前主要利用数学、统计学和计算机技术研究国际关系、冲突和恐怖主义等。他曾作为研究员在美国情报和国防部门供职数年。他拥有纽约大学政治系博士学位,曾为多种杂志撰写文章,是机器学习领域的著名学者。
John Myles White 机器学习专家,拥有丰富的数据分析与处理工作经验。目前主要从理论和实验的角度来研究人类如何做出决定,同时还是几个流行的R语言程序包的主要维护者,包括ProjectTemplate和log4r。他拥有普林斯顿大学哲学系博士学位,曾为多家技术杂志撰稿,发表过许多关于机器学习的论文,并在众多国际会议上发表演讲。
译者介绍
罗森林 博士,教授,博导。现任北京理工大学信息系统及安全对抗实验中心主任、专业责任教授。国防科技工业局科学技术委员会成员;《中国医学影像技术杂志》、《中国介入影像与治疗学》编委会委员;全国大学生信息安全技术专题邀请赛专家组副组长;中国人工智能学会智能信息安全专业委员会委员等。主要研究方向为信息安全、数据挖掘、媒体计算、中文信息处理等。负责或参加完成国家自然科学基金、国家科技支撑计划、863计划、国家242计划等省部级以上项目40余项。已发表学术论文90余篇,出版著作8部,出版译著1部,获授权专利3项。
陈开江 新浪微博搜索部研发工程师,曾独立负责微博内容反垃圾系统、微博精选内容挖掘算法、自助客服系统(包括自动回复、主动挖掘、舆情监测)等项目,目前主要从事社交挖掘、推荐算法研究、机器学习、自然语言处理相关工作,研究兴趣是社交网络的个性化推荐。
刘逸哲 阿里巴巴,CBU基础平台部搜索与推荐团队核心技术与query分析方向负责人,机器学习技术领域及圈子负责人。曾任中国雅虎相关性团队、自然语言处理团队算法工程师;AvePoint.inc开发工程师,从事企业级搜索引擎开发。研究兴趣是机器学习、自然语言处理及个性化推荐等算法在大规模数据上的应用。
孟晓楠 一淘广告技术,阿里非搜索广告算法负责人,负责用户行为分析、建模与细分,RTB竞价算法,展示广告CTR预估与SEM优化。曾工作于网易杭州研究院,参与过分布式全文检索系统和网易博客产品的数据挖掘算法开发。研究兴趣是计算广告技术、机器学习、大数据技术、信息检索等。
封面介绍
本书封面动物是兀鹫(griffon vulture,鹰科)。这种庞然大鸟分布在旧大陆(即欧、亚、非)较暖和的地区,也就是说地中海附近。
这类鸟头部的羽毛呈白色且稀少,翅膀宽大,尾巴短小。成年兀鹫——身高在0.9~1.1m、翅宽平均在2.3~2.8m——通常身体羽毛呈黄棕色,间杂黑色,颈部周围羽毛呈白色。兀鹫是一种食腐动物,只捕食死尸。
兀鹫最长寿命现存记录是41.4年(养殖场记录)。它们广泛分布在欧洲南部、非洲北部山区,以及亚洲。每次产蛋仅一枚。
O'Reilly Media, Inc.介绍
O'Reilly Media通过图书、杂志、在线服务、调查研究和会议等方式传播创新知识。自1978年开始,O'Reilly一直都是前沿发展的见证者和推动者。超级极客们正在开创着未来,而我们关注真正重要的技术趋势——通过放大那些“细微的信号”来刺激社会对新科技的应用。作为技术社区中活跃的参与者,O'Reilly的发展充满了 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 机器学习:实用案例解析 - (EPUB全文下载)