LDA漫游指南 - (EPUB全文下载)

文件大小:4.58 mb。
文件格式:epub 格式。
书籍内容:

目    录
版权信息
作品简介
作者简介
前言
第1章 背景
第2章 前置知识
2.1 gamma函数
2.2 二项分布(Binomial distribution)
2.3 Beta分布(Beta distribution)
两种证明方法
Beta分布的期望
2.4 多项分布(multinomial distribution)
多项分布的极大似然估计
2.5 狄利克雷分布(Dirichlet Distribution)
2.6 共轭先验分布(conjugacy prior)
2.6.1 从二项分布到Beta分布
求证:Beta分布确实是二项分布的共轭先验分布。
2.6.2 从多项分布到Dirichlet分布
求证:Dirichlet分布确实是多项分布的共轭先验分布。
2.7 总结
参考文献
第3章 LDA的Gibbs Sampling推导
3.1 unigram假设
3.2 Latent Dirichlet Allocation介绍
3.3 马尔可夫链→Metropolis-Hasting→Gibbs Sampling
3.3.1 马尔可夫链(markov chain)
3.3.2 Metropolis-Hasting算法
3.3.3 Gibbs Sampling
3.4 伟大的采样公式: Collapsed Gibbs Sampling采样公式推导
3.5 总结
参考文献
第4章 实现与应用
4.1 实现
4.2 应用
4.2.1 相似文档发现
4.2.2 自动打标签
4.2.3 LDA与LR(逻辑斯蒂回归)结合做新闻个性化推荐系统
4.2.4 topic rank
4.2.5 word rank
4.2.6 文章质量评分算法
4.3 总结
参考文献
第5章 并行化
5.1 AD-LDA
5.2 spark-LDA
5.2.1 切分块
5.2.2 选择
5.2.3 计算和合并
5.3 总结
参考文献
第6章 变分贝叶斯的启蒙
6.1 前置知识
6.1.1 指数分布族(exponential family)
6.1.2 再谈数学期望
6.1.3 进一步观察指数分布族
6.1.4 拉格朗日的杰作——拉格朗日乘数法
6.1.5 指数分布族的一点深入思考
6.1.6 Jensen不等式
6.2 补充材料:变分法的启蒙
6.2.1 改变世界的方程:欧拉—拉格朗日方程
6.2.2 E-L方程的两种降阶形式
6.2.3 E-L方程与拉格朗日乘数法的联姻
参考文献
第7章 LDA的变分贝叶斯法
7.1 Latent Dirichlet Allocation的另一个视角
7.2 分析模型
7.3 推导
7.3.1 启蒙
7.3.2 变分目标函数
7.3.3 下界(lower bound)
7.3.4 下界展开
7.3.5 变分推断
7.3.6 参数估计
7.4 误差讨论
参考文献
第8章 LDA变分EM实现
8.1 伪代码
8.2 工程优化分析
8.3 Blei的变分LDA(C语言版)源代码剖析
8.3.1 源代码下载
8.3.2 使用命令与配置
8.3.3 源代码情况一览
8.3.4 Variational EM代码剖析
8.3.5 预测推断新文档
8.3.6 load model
8.3.7 运行效果与终止条件
附录
值得一读的参考文献
欢迎来到异步社区!
版权信息
书名:LDA算法漫游指南 v2.0
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
作品简介
LDA模型是著名的主题模型,自从发明以来,一直得到学术界和工业界的广泛重视。因此LDA以其经典性,其实用性是学习机器学习时不得不学的技术,但是LDA本身也涉及了概率论和数理统计的背景,使得这个技术本身不是那么浅显易懂,非得拿出搞研究学习的劲头,下一番功夫,才能尝到甜头。这本书完整而细致地解剖了LDA主题模型主流的Gibbs Sampling方法和变分推断法。
这个技术由于使用了概率论和数理统计的知识,考虑到了有些读者数学基础不是很扎实,因此会先将前置知识和背景知识介绍给读者,以打好读者的基础,在推导过程中,作者会写出很多技术细节部分,以不放弃任何一名潜在的读者的态度帮助理解。本书面向的读者应该是有一定数学基础的大学生,应该接触过简单的一元微积分知识,阅读本书,体验算法之美,是需要一定的毅力的,我不会将本书推荐给一位没有毅力的读者。
书中的独特之处与创新之处在于解决了以下几个问题:
1.在国内的LDA资料都缺乏工业界实际应用时,这本书以实用为导向,精选了LDA的几个应用给大家介绍,使数学算法理论不再阳春白雪,而真正落地。
2.着重帮助初学者, 为了争取到每一位读者,作者写作时特意考虑了只有大学微积分水平的读者如何读懂,因此每一条公式都不厌其烦地细致解释,力求贴近读者。
3.介绍了代码实现的方法以及并行化。这是其他LDA资料里总是缺少的内容,理论只有实现为真真实实运行的代码才可以真正落地,这也是搞理论研究和搞应用之间难以跨越的鸿沟。
关于本书有任何疑问,请在异步社区上答疑帖子提问:http://www.epubit.com.cn/article/502
作者简介
马晨,清华大学在读博士。
硕士毕业于北京邮电大学,曾就职于新浪、暴风影音等知名互联网公司,主要任互联网数据挖掘算法研究工程师,主攻机器学习领域算法,对算法的原理推导和互联网环境下机器学习的算法落地应用非常感兴趣。在暴风影音工作期间,开发设计了开源作品cronhub调度系统,至今仍在GitHub上供使用者下载。还发表了相当多的技术文章,目前主要活跃在异步社区上。本书QQ读书交流群:152583630。
“小马哥机器学习”的微信公众号(xiaomage-m ............

书籍插图:
书籍《LDA漫游指南》 - 插图1
书籍《LDA漫游指南》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » LDA漫游指南 - (EPUB全文下载)