openelib.org 计算机技术

强化学习精要：核心算法与TensorFlow实现 - (EPUB全文下载)

文件大小：0.66 mb。
文件格式：epub 格式。
书籍内容：

内容简介
《强化学习精要：核心算法与TensorFlow实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现，为读者构建了一个完整的强化学习知识体系，同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程，到各种复杂的强化学习算法，读者都可以从本书中学习到。本书除了介绍这些算法的原理，还深入分析了算法之间的内在联系，可以帮助读者举一反三，掌握算法精髓。书中介绍的代码可以帮助读者快速将算法应用到实践中。
《强化学习精要：核心算法与TensorFlow实现》内容翔实，语言简洁易懂，既适合零基础的人员入门学习，也适合相关科研人员研究参考。

　
未经许可，不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有，侵权必究。
图书在版编目（CIP）数据
强化学习精要：核心算法与TensorFlow实现/冯超著.—北京：电子工业出版社，2018.6 （博文视点AI系列）
ISBN 978-7-121-34000-0
I.①强…II.①冯…III.①机器学习-算法-研究IV.①TP181
中国版本图书馆CIP数据核字（2018）第068910号

　
策划编辑：郑柳洁
责任编辑：郑柳洁
印刷：天津嘉恒彩色印刷有限公司
装订：天津嘉恒彩色印刷有限公司
出版发行：电子工业出版社
北京市海淀区万寿路173信箱邮编：100036
开本：720×1000 1/16 印张：24 字数：470千字
版次：2018年6月第1版
印次：2018年6月第1次印刷
定价：80.00元
凡所购买电子工业出版社图书有缺损问题，请向购买书店调换。若书店售缺，请与本社发行部联系，联系及邮购电话：（010）88254888，88258888。
质量投诉请发邮件至zlts@phei.com.cn，盗版侵权举报请发邮件至dbqq@phei.com.cn。
本书咨询联系方式：（010）51260888-819 faq@phei.com.cn。
前言
从你拿起本书的那一刻起，我们就一起踏上了这段有关强化学习的冒险之旅。本书中有简单直白的叙述，也有复杂冗长的证明；有诙谐幽默，也有深刻的思考。所有的一切，都是为了帮助你更轻松地对强化学习有更多了解、更多感悟。
一年之前，我在拙作《深度学习轻松学：核心算法与视觉实践》中，同样以这段话作为开篇，唯一不同的是这一次书的主题换成了强化学习。近年来，强化学习领域有了很大的发展，基于强化学习开发的智能体也被人们熟知。于是越来越多的人开始关注强化学习，了解这个领域，并使用强化学习的方法解决问题。随着深度学习的发展，强化学习也逐渐发挥出了自己的实力，凭借更灵活的问题定义方式，解决了很多其他方法难以解决的问题。
虽然强化学习这个领域已经有了多年的积累与发展，但是与深度学习相比，国内外与此相关的书籍与课程偏少。同时，由于强化学习融合了很多领域的知识，本身的技术难度较大，学习起来比较困难。两者叠加，使得强化学习仍然是一个令很多人感到困惑的概念。
为了学习强化学习中的各种知识，作为本书的作者，我也花费了很多的精力。在阅读了很多经典的书籍、论文和博客之后，我开始对强化学习有了自己的理解和体会。同时也积累了不少关于强化学习的“学习笔记”，其中的一部分已经在一些公开场合，例如我的知乎专栏《无痛的机器学习》（https：//zhuanlan.zhihu.com/hsmyy）中与读者分享过。在交流的过程中，我能感受到读者对强化学习的浓厚兴趣，同时自己也在分享中得到了提高。
经过长时间的积累，这些心得与体会最终凝结成了本书。在这个过程中我重新回顾了自己所学的知识，也进一步思考了强化学习各部分知识点之间的联系。我希望可以给大家呈现一个尽可能完整而丰富的强化学习世界，与大家共同探讨强化学习中的无限可能。
为了使更多的人能够从本书中得到收获，我选择强化学习中比较经典的算法进行了介绍，这些都是强化学习中十分重要的内容，对不了解强化学习的读者来说，可以帮助你快速了解强化学习的知识体系，对这个领域有一个全面的认识；对正在学习强化学习的读者来说，本书中的知识同样可以帮助你梳理强化学习的核心要点，加深对这些基本问题的理解。
在编写这本书的过程中，我又一次体会到求知的艰辛。获取知识的道路总是充满荆棘，除了自身不断地努力，更少不了身边人对我的支持鼓励。感谢家人对我的理解与支持，感谢编辑郑柳洁女士再次成为我的伯乐，为我提供了很多帮助，感谢刘晓鸣先生为本书绘制了大量插图。我相信我们的努力付出会使更多的人享受获得知识的快乐。由于本人才疏学浅，行文间难免有所纰漏，望各位读者多多包涵，不吝赐教。
作者
读者服务
轻松注册成为博文视点社区用户（www.broadview.com.cn），扫码直达本书页面。
· 下载资源：本书提供示例代码资源文件，可在【下载资源】处下载。
· 提交勘误：您对书中内容的修改意见可在【提交勘误】处提交，若被采纳，将获赠博文视点社区积分（在您购买电子书时，积分可用来抵扣相应金额）。
· 与读者交流：在页面下方【读者评论】处留下您的疑问或观点，与其他读者一同学习交流。
页面入口：http：//www.broadview.com.cn/34000
目录
前言
第一部分强化学习入门与基础知识
1 引言
1.1 强化学习的概念
1.1.1 巴浦洛夫的狗
1.1.2 俄罗斯方块
1.2 站在被实验者的角度看问题
1.3 强化学习效果的评估
1.3.1 不断试错
1.3.2 看重长期回报
1.4 强化学习与监督学习
1.4.1 强化学习与监督学习的本质
1.4.2 模仿学习
1.5 强化学习的实验环境
1.5.1 Arcade Learning Environment
1.5.2 Box2D
1.5.3 MuJoCo
1.5.4 Gym
1.6 本书的主要内容
1.7 参考资料
2 数学与机器学习基础
2.1 线性代数基础
2.2 对称矩阵的性质
2.2.1 特征值与特征向量
2.2.2 对称矩阵的特征值和特征向量
2.2.3 对称矩阵的对 ............

书籍插图：
书籍《强化学习精要：核心算法与TensorFlow实现》 - 插图1

以上为书籍内容预览，如需阅读全文内容请下载EPUB源文件，祝您阅读愉快。

版权声明：书云(openelib.org)是世界上最大的在线非盈利图书馆之一，致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权，如您认为书云侵犯了您的合法权益，请参考版权保护声明，通过邮件openelib@outlook.com联系我们，我们将及时处理您的合理请求。数研咨询流芳阁研报之家 AI应用导航研报之家
 书云 Open E-Library » 强化学习精要：核心算法与TensorFlow实现 - (EPUB全文下载)

分享到：

相关推荐