Python数据挖掘入门与实践 - (EPUB全文下载)

文件大小:2.09 mb。
文件格式:epub 格式。
书籍内容:

版权信息
书名:Python数据挖掘入门与实践
作者:[澳] Robert Layton
译者:杜春晓
ISBN:978-7-115-42710-6
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
图灵社区会员 憨豆战神(vikecom@163.com) 专享 尊重版权
版权声明
译者序
前言
本书主要内容
本书的阅读前提
本书的目标读者
排版约定
读者反馈
客户支持
下载示例代码
下载配套PDF文件
勘误表
侵权
问题
第 1 章 开始数据挖掘之旅
1.1 数据挖掘简介
1.2 使用Python和IPython Notebook
1.2.1 安装Python
1.2.2 安装IPython
1.2.3 安装scikit-learn库
1.3 亲和性分析示例
1.3.1 什么是亲和性分析
1.3.2 商品推荐
1.3.3 在NumPy中加载数据集
1.3.4 实现简单的排序规则
1.3.5 排序找出最佳规则
1.4 分类问题的简单示例
1.5 什么是分类
1.5.1 准备数据集
1.5.2 实现OneR算法
1.5.3 测试算法
1.6 小结
第 2 章 用scikit-learn估计器分类
2.1 scikit-learn估计器
2.1.1 近邻算法
2.1.2 距离度量
2.1.3 加载数据集
2.1.4 努力实现流程标准化
2.1.5 运行算法
2.1.6 设置参数
2.2 流水线在预处理中的应用
2.2.1 预处理示例
2.2.2 标准预处理
2.2.3 组装起来
2.3 流水线
2.4 小结
第 3 章 用决策树预测获胜球队
3.1 加载数据集
3.1.1 采集数据
3.1.2 用pandas加载数据集
3.1.3 数据集清洗
3.1.4 提取新特征
3.2 决策树
3.2.1 决策树中的参数
3.2.2 使用决策树
3.3 NBA比赛结果预测
组装起来
3.4 随机森林
3.4.1 决策树的集成效果如何
3.4.2 随机森林算法的参数
3.4.3 使用随机森林算法
3.4.4 创建新特征
3.5 小结
第 4 章 用亲和性分析方法推荐电影
4.1 亲和性分析
4.1.1 亲和性分析算法
4.1.2 选择参数
4.2 电影推荐问题
4.2.1 获取数据集
4.2.2 用pandas加载数据
4.2.3 稀疏数据格式
4.3 Apriori算法的实现
4.3.1 Apriori算法
4.3.2 实现
4.4 抽取关联规则
评估
4.5 小结
第 5 章 用转换器抽取特征
5.1 特征抽取
5.1.1 在模型中表示事实
5.1.2 通用的特征创建模式
5.1.3 创建好的特征
5.2 特征选择
选择最佳特征
5.3 创建特征
主成分分析
5.4 创建自己的转换器
5.4.1 转换器API
5.4.2 实现细节
5.4.3 单元测试
5.4.4 组装起来
5.5 小结
第 6 章 使用朴素贝叶斯进行社会媒体挖掘
6.1 消歧
6.1.1 从社交网站下载数据
6.1.2 加载数据集并对其分类
6.1.3 Twitter数据集重建
6.2 文本转换器
6.2.1 词袋
6.2.2 N元语法
6.2.3 其他特征
6.3 朴素贝叶斯
6.3.1 贝叶斯定理
6.3.2 朴素贝叶斯算法
6.3.3 算法应用示例
6.4 应用
6.4.1 抽取特征
6.4.2 将字典转换为矩阵
6.4.3 训练朴素贝叶斯分类器
6.4.4 组装起来
6.4.5 用F1值评估
6.4.6 从模型中获取更多有用的特征
6.5 小结
第 7 章 用图挖掘找到感兴趣的人
7.1 加载数据集
7.1.1 用现有模型进行分类
7.1.2 获取Twitter好友信息
7.1.3 构建网络
7.1.4 创建图
7.1.5 创建用户相似度图
7.2 寻找子图
7.2.1 连通分支
7.2.2 优化参数选取准则
7.3 小结
第 8 章 用神经网络破解验证码
8.1 人工神经网络
神经网络简介
8.2 创建数据集
8.2.1 绘制验证码
8.2.2 将图像切分为单个的字母
8.2.3 创建训练集
8.2.4 根据抽取方法调整训练数据集
8.3 训练和分类
8.3.1 反向传播算法
8.3.2 预测单词
8.4 用词典提升正确率
8.4.1 寻找最相似的单词
8.4.2 组装起来
8.5 小结
第 9 章 作者归属问题
9.1 为作品找作者
9.1.1 相关应用和使用场景
9.1.2 作者归属
9.1.3 获取数据
9.2 功能词
9.2.1 统计功能词
9.2.2 用功能词进行分类
9.3 支持向量机
9.3.1 用SVM分类
9.3.2 内核
9.4 字符N元语法
抽取字符N元语法
9.5 使用安然公司数据集
9.5.1 获取安然数据集
9.5.2 创建数据集加载工具
9.5.3 组装起来
9.5.4 评估
9.6 小结
第 10 章 新闻语料分类
10.1 获取新闻文章
10.1.1 使用Web API获取数据
10.1.2 数据资源宝库reddit
10.1.3 获取数据
10.2 从任意网站抽取文本
10.2.1 寻找任意网站网页中的主要内容
10.2.2 组装起来
10.3 新闻语料聚类
10.3.1 k-means算法
10.3.2 评估结果
10.3.3 从簇中抽取主题信息
10.3.4 用聚类算法做转换器
10.4 聚类融合
10.4.1 证据累积
10.4.2 工作原理
10.4.3 实现
10.5 线上学习
10.5.1 线上学习简介
10.5.2 实现
10.6 小结
第 11 章 用深度学习方法为图像中的物体进行分类
11.1 物体分类
11.2 应用场景和目标
使用场景 ............

书籍插图:
书籍《Python数据挖掘入门与实践》 - 插图1
书籍《Python数据挖掘入门与实践》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » Python数据挖掘入门与实践 - (EPUB全文下载)