scikit-learn机器学习:常用算法原理及编程实战 - (EPUB全文下载)
文件大小:0.75 mb。
文件格式:epub 格式。
书籍内容:
scikit-learn机器学习:常用算法原理及编程实战
第1章 机器学习介绍
1.1 什么是机器学习
1.2 机器学习有什么用
1.3 机器学习的分类
1.4 机器学习应用开发的典型步骤
1.4.1 数据采集和标记
1.4.2 数据清洗
1.4.3 特征选择
1.4.4 模型选择
1.4.5 模型训练和测试
1.4.6 模型性能评估和优化
1.4.7 模型使用
1.5 复习题
第2章 Python机器学习软件包
2.1 开发环境搭建
2.2 IPython简介
2.2.1 IPython基础
2.2.2 IPython图形界面
2.3 Numpy简介
2.3.1 Numpy数组
2.3.2 Numpy运算
2.4 Pandas简介
2.4.1 基本数据结构
2.4.2 数据排序
2.4.3 数据访问
2.4.4 时间序列
2.4.5 数据可视化
2.4.6 文件读写
2.5 Matplotlib简介
2.5.1 图形样式
2.5.2 图形对象
2.5.3 画图操作
2.6 scikit-learn简介
2.6.1 scikit-learn示例
2.6.2 scikit-learn一般性原理和通用规则
2.7 复习题
2.8 拓展学习资源
第3章 机器学习理论基础
3.1 过拟合和欠拟合
3.2 成本函数
3.3 模型准确性
3.3.1 模型性能的不同表述方式
3.3.2 交叉验证数据集
3.4 学习曲线
3.4.1 实例:画出学习曲线
3.4.2 过拟合和欠拟合的特征
3.5 算法模型性能优化
3.6 查准率和召回率
3.7 F1 Score
3.8 复习题
第4章 k-近邻算法
4.1 算法原理
4.1.1 算法优缺点
4.1.2 算法参数
4.1.3 算法的变种
4.2 示例:使用k-近邻算法进行分类
4.3 示例:使用k-近邻算法进行回归拟合
4.4 实例:糖尿病预测
4.4.1 加载数据
4.4.2 模型比较
4.4.3 模型训练及分析
4.4.4 特征选择及数据可视化
4.5 拓展阅读
4.5.1 如何提高k-近邻算法的运算效率
4.5.2 相关性测试
4.6 复习题
第5章 线性回归算法
5.1 算法原理
5.1.1 预测函数
5.1.2 成本函数
5.1.3 梯度下降算法
5.2 多变量线性回归算法
5.2.1 预测函数
5.2.2 成本函数
5.2.3 梯度下降算法
5.3 模型优化
5.3.1 多项式与线性回归
5.3.2 数据归一化
5.4 示例:使用线性回归算法拟合正弦函数
5.5 示例:测算房价
5.5.1 输入特征
5.5.2 模型训练
5.5.3 模型优化
5.5.4 学习曲线
5.6 拓展阅读
5.6.1 梯度下降迭代公式推导
5.6.2 随机梯度下降算法
5.6.3 标准方程
5.7 复习题
第6章 逻辑回归算法
6.1 算法原理
6.1.1 预测函数
6.1.2 判定边界
6.1.3 成本函数
6.1.4 梯度下降算法
6.2 多元分类
6.3 正则化
6.3.1 线性回归模型正则化
6.3.2 逻辑回归模型正则化
6.4 算法参数
6.5 实例:乳腺癌检测
6.5.1 数据采集及特征提取
6.5.2 模型训练
6.5.3 模型优化
6.5.4 学习曲线
6.6 拓展阅读
6.7 复习题
第7章 决策树
7.1 算法原理
7.1.1 信息增益
7.1.2 决策树的创建
7.1.3 剪枝算法
7.2 算法参数
7.3 实例:预测泰坦尼克号幸存者
7.3.1 数据分析
7.3.2 模型训练
7.3.3 优化模型参数
7.3.4 模型参数选择工具包
7.4 拓展阅读
7.4.2 决策树的构建算法
7.5 集合算法
7.5.1 自助聚合算法Bagging
7.5.2 正向激励算法boosting
7.5.3 随机森林
7.5.4 ExtraTrees算法
7.6 复习题
第8章 支持向量机
8.1 算法原理
8.1.1 大间距分类算法
8.1.2 松弛系数
8.2 核函数
8.2.1 最简单的核函数
8.2.2 相似性函数
8.2.3 常用的核函数
8.2.4 核函数的对比
8.3 scikit-learn里的SVM
8.4 实例:乳腺癌检测
8.5 复习题
第9章 朴素贝叶斯算法
9.1 算法原理
9.1.1 贝叶斯定理
9.1.2 朴素贝叶斯分类法
9.2 一个简单的例子
9.3 概率分布
9.3.1 概率统计的基本概念
9.3.2 多项式分布
9.3.3 高斯分布
9.4 连续值的处理
9.5 实例:文档分类
9.5.1 获取数据集
9.5.2 文档的数学表达
9.5.3 模型训练
9.5.4 模型评价
9.6 复习题
第10章 PCA算法
10.1 算法原理
10.1.1 数据归一化和缩放
10.1.2 计算协方差矩阵的特征向量
10.1.3 数据降维和恢复
10.2 PCA算法示例
10.2.1 使用Numpy模拟PCA计算过程
10.2.2 使用sklearn进行PCA降维运算
10.2.3 PCA的物理含义
10.3 PCA的数据还原率及应用
10.3.1 数据还原率
10.3.2 加快监督机器学习算法的运算速度
10.4 实例:人脸识别
10.4.1 加载数据集
10.4.2 一次失败的尝试
10.4.3 使用PCA来处理数据集
10.4.4 最终结果
10.5 拓展阅读
10.6 复习题
第11章 k-均值算法
11.1 算法原理
11.1.1 k-均值算法成本函数
11.1.2 随机初始化聚类中心点
11.1.3 选择聚类的个数
11.2 scikit-learn里的k-均值算法
11.3 使用k-均值对文档进行聚类分析
11.3.1 准备数据集
11.3.2 加载数据集
11.3.3 文本聚类分析
11.4 聚类算法性能评估
11.4.1 Adjust Rand Index
11.4.2 齐次性和完整性
11.4.3 轮廓系数
11.5 复习题
后记 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » scikit-learn机器学习:常用算法原理及编程实战 - (EPUB全文下载)