概率图模型:基于R语言 - (EPUB全文下载)
文件大小:0.26 mb。
文件格式:epub 格式。
书籍内容:
概率图模型:基于R语言
第1章 概率推理
第2章 精确推断
第3章 学习参数
第4章 贝叶斯建模——基础模型
第5章 近似推断
第6章 贝叶斯建模——线性模型
第7章 概率混合模型
附录
欢迎来到异步社区!
第1章 概率推理
在有关21世纪的所有预测中,最不希望的一个也许是我们需要每天收集世界上任何地方、关于任何事情的海量数据。近几年来,人们见证了关于世界、生活和技术方面难以置信的数据爆炸,这也是我们确信引发变革的源动力。虽然我们生活在信息时代,但是仅仅收集数据而不发掘价值和抽取知识是没有任何意义的。
在20世纪开始的时候,随着统计学的诞生,世界都在收集数据和生成统计。那个时候,唯一可靠的工具是铅笔和纸张,当然还有观察者的眼睛和耳朵。虽然在19世纪取得了长足的发展,但是科学观察依然处在新生阶段。
100多年后,我们有了计算机、电子感应器以及大规模数据存储。我们不但可以持续地保存物理世界的数据,还可以通过社交网络、因特网和移动电话保存我们的生活数据。而且,存储技术水准的极大提高也使得以很小的容量存储月度数据成为可能,甚至可以将其放进手掌中。
但是存储数据不是获取知识。存储数据只是把数据放在某个地方以便后用。同样,随着存储容量的快速演化,现代计算机的容量甚至在以难以置信的速度提升。在读博士期间,我记得当我收到一个崭新、耀眼的全功能PC来开展科研工作时,我在试验室是多么的骄傲。而今天,我口袋里老旧的智能手机,还要比当时的PC快20倍。
在本书中,你会学到把数据转化为知识的最先进的技术之一:机器学习。这项技术用在当今生活的方方面面,从搜索引擎到股市预测,从语音识别到自动驾驶。而且,机器学习还用在了人们深信不疑的领域,从产品链的质量保障到移动手机网络的天线阵列优化。
机器学习是计算机科学、概率论和统计学相互融合的领域。机器学习的核心问题是推断问题或者说是如何使用数据和例子生成知识或预测。这也给我们带来了机器学习的两个基础问题:从大量数据中抽取模以及高层级知识的算法设计,和使用这些知识的算法设计——或者说得更科学一些:学习和推断。
皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace,1749—1827),法国数学家,也是有史以来最伟大的科学家之一,被认为是第一批理解数据收集重要性的人:他发现了数据不可靠,有不确定性,也就是今天说的有噪声。他也是第一个研究使用概率来处理不确定性等问题,并表示事件或信息信念度的人。
在他的论文《概率的哲学》(Essai philosophique sur les probabilités,1814)中,拉普拉斯给出了最初的支持新老数据推理的数学系统,其中的用户信念会在新数据可用的时候得到更新和改进。今天我们称之为贝叶斯推理。事实上,托马斯·贝叶斯确实是第一个、早在18世纪末就发现这个定理的人。如果没有贝叶斯工作的铺垫,皮埃尔-西蒙·拉普拉斯就需要重新发现同一个定理,并形成贝叶斯理论的现代形式。有意思的是,拉普拉斯最终发现了贝叶斯过世之后发表的文章,并承认了贝叶斯是第一个描述归纳推理系统原理的人。今天,我们会提及拉普拉斯推理,而不是贝叶斯推理,并称之为贝叶斯-普莱斯-拉普拉斯定理(Bayes-Price-Laplace Theorem)。
一个多世纪以后,这项数学技术多亏了计算概率论的新发现而得到重生,并诞生了机器学习中一个最重要、最常用的技术:概率图模型。
从此刻开始,我们需要记住,概率图模型中的术语图指的是图论,也就是带有边和点的数学对象,而不是图片或者图画。众所周知,当你想给别人解释不同对象或者实体之间的关系时,你需要拿纸画出带有连线或箭头的方框。这是一种简明易懂的方法,可以来介绍任何不同元素之间的关系。
确切地说,概率图模型(Probabilistic Graphical Models,PGM)是指:你想描述不同变量之间的关系,但是,你又对这些变量不太确定,只有一定程度的相信或者一些不确定的知识。现在我们知道,概率是表示和处理不确定性的严密的数学方法。
概率图模型是使用概率来表示关于事实和事件的信念和不确定知识的一种工具。它也是现在最先进的机器学习技术之一,并有很多行业成功的案例。
概率图模型可以处理关于世界的不完整的知识,因为我们的知识总是有限的。我们不可能观察到所有的事情,不可能用一台计算机表示整个宇宙。和计算机相比,我们作为人类从根本上是受限的。有了概率图模型,我们可以构建简单的学习算法,或者复杂的专家系统。有了新的数据,我们可以改进这些模型,尽全力优化模型,也可以对未知的局势和事件做出推断或预测。
在第1章中,你会学到关于概率图模型的基础知识,也就是概率知识和简单的计算规则。我们会提供一个概率图模型的能力概览,以及相关的R程序包。这些程序包都很成功,我们只需要探讨最重要的R程序包。
我们会看到如何一步一步地开发简单模型,就像方块游戏一样,以及如何把这行模型连接在一起开发出更加复杂的专家系统。我们会介绍下列概念和应用。每一部分都包含几个可以直接用R语言上手的示例:
机器学习。
使用概率表示不确定性。
概率专家系统的思想。
使用图来表示知识。
概率图模型。
示例和应用。
1.1 机器学习
本书是关于机器学习领域的书籍,或者更广义地叫作人工智能。为了完成任务,或者从数据中得出结论,计算机以及其他生物需要观察和处理自然世界的各种信息。从长期来看,我们一直在设计和发明各种算法和系统,来非常精准地并以非凡的速度解决问题。但是所有的算法都受限于所面向的具体任务本身。另外,一般生物和人类(以及许多其他动物)展现了在通过经验、错误和对世界的观察等方式取得适应和进化方面令人不可思议的能力。
试图理解如何从经验中学习,并适应变化的环境一直是科学界的伟大课题。自从计算机发明之后,一个主要的目标是在机器上重复生成这些技能。
机器学习是关于从数据和观察中学习和适应的算法研究,并实现推理和借助学到的模型和算法来执行任务。由于我们生活的世界本身就是不确定的,从这个意义上讲,即便是最简单的观察, ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » 概率图模型:基于R语言 - (EPUB全文下载)