R并行编程实战 (高性能计算技术丛书) - (EPUB全文下载)
文件大小:8.78 mb。
文件格式:epub 格式。
书籍内容:
高性能计算技术丛书
R并行编程实战
Mastering Parallel Programming with R
(美)西蒙 R.查普尔(Simon R.Chapple) 等著
张茂军 李洪成 文益民 译
ISBN:978-7-111-57637-2
本书纸版由机械工业出版社于2017年出版,电子版由华章分社(北京华章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @华章数媒
微信公众号 华章电子书(微信号:hzebook)
目录译者序前言关于作者第1章 简单的R并行性1.1 亚里士多德数谜1.1.1 求解程序的实现1.1.2 改进求解程序1.1.3 将问题分解为多个任务1.2 R的并行包1.2.1 使用mclapply()1.2.2 使用parLapply()1.2.3 并行负载均衡1.3 segue包1.3.1 安装segue1.3.2 设置AWS账户1.3.3 运行segue1.3.4 求解亚里士多德数谜1.4 总结第2章 消息传递入门2.1 为MPI设置系统环境2.1.1 为MPI选择R包2.1.2 选择MPI子系统2.1.3 安装OpenMPI2.2 MPI标准2.2.1 MPI的世界2.2.2 安装Rmpi2.2.3 安装pbdMPI2.3 MPI API2.3.1 点对点阻塞通信2.3.2 点对点非阻塞通信2.3.3 集体通信2.4 总结第3章 高级消息传递3.1 网格并行性3.1.1 创建网格集群3.1.2 边界数据交换3.1.3 中值滤波3.1.4 平铺分配图像3.1.5 中值滤波网格程序3.2 检查和管理通信3.3 lapply()的函数变体3.4 总结第4章 开发SPRINT—超级计算机的基于MPI的R包4.1 关于ARCHER4.2 从R中调用MPI代码4.2.1 MPI Hello World4.2.2 从R中调用C4.3 建立一个MPI R包—SPRINT4.3.1 简单的并行R接口(SPRINT)包4.3.2 SPRINT包的体系结构4.4 将一个新函数添加到SPRINT包中4.4.1 下载SPRINT源代码4.4.2 在R中创建一个存根—phello.R4.4.3 添加接口函数—phello.c4.4.4 添加实现函数—hello.c4.4.5 连接存根、接口和实现4.4.6 编译并运行SPRINT代码4.5 基因组学分析案例研究4.5.1 基因组学4.5.2 基因组数据4.6 基因组学与超级计算机4.6.1 目标4.6.2 ARCHER超级计算机4.6.3 随机森林4.6.4 基因组分析案例研究的数据4.6.5 ARCHER中的随机森林性能4.6.6 排名产品4.6.7 ARCHER中的排名产品性能4.6.8 结论4.7 总结第5章 笔记本中的超级计算机5.1 OpenCL5.2 ROpenCL包5.2.1 ROpenCL编程模型5.2.2 距离矩阵示例5.3 总结第6章 并行程序设计的艺术6.1 理解并行效率6.1.1 加速比6.1.2 阿姆达尔定律6.1.3 并行或者不并行6.2 数值逼近6.3 随机数6.4 死锁6.5 减少并行开销6.6 自适应负载均衡6.6.1 任务场6.6.2 有效的网格处理6.6.3 成功并行化的3个步骤6.6.4 未来将会怎样6.6.5 混合并行性6.7 总结
译者序
并行计算是一种通过执行多条指令来解决大型复杂计算问题的有效算法,可以显著提高计算机系统的计算速度和处理能力。R语言是目前非常流行的一种开源程序语言,在统计学和生物学等学科中得到了广泛应用。本书成功地借助于R语言实现了并行计算的多种有效算法,并且通过案例分析了如何运用R语言执行并行计算。同时详细介绍了并行计算中的R程序包的使用,如SPRINT包提供了一套从R中调用并行计算的MPI函数。全书案例简单易懂,程序翔实,叙述清晰。本书4位作者都是计算机专业的资深专家和学者,从事并行计算多年,发表了众多优秀成果。本书的引进有益于读者运用R语言进行并行计算的研究,读者可以结合实际应用来学习本书中讨论的算法和模型。
本书的翻译得到了国家自然科学基金(项目编号71461005)和广西高校数据分析与计算重点实验室的资助。特别感谢桂林电子科技大学研究生姚家进、郭梦菲、秦文哲在翻译本书中所做的出色工作。
由于时间和水平所限,难免会有不当之处,希望同行和读者多加指正和批评。
前言
我们正处于信息爆炸时代。从个人到全世界,生活中的一切都变得越来越与物联网实时关联。据预测,到2020年,世界上的数据将超过现在的10倍,达到惊人的44泽字节(1泽字节相当于2500亿张DVD)。为了解决大数据的规模和速度问题,我们需要巨大的计算、内存和磁盘资源,而为此就需要并行计算。
尽管使用的时间不长,但R作为一种开源统计编程语言,逐渐成为人们分析数据的关键基础技术之一。我敢说R现在是“数据科学家”的主流编程语言之一。
当然,数据科学家可能会部署许多其他工具来处理大数据的一些困难问题,如Python、SAS、SPSS或MATLAB。然而,自从1997年以来,随着开源语言的深入发展,R语言非常流行,在20年中开发了许多存放于CRAN镜像站点的R添加包,这些添加包适用于几乎所有形式的数据分析,从小型数值矩阵到庞大的符号数据集,如生物分子DNA。事实上,我认为R语言正成为“事实上”的数据科学脚本语言,它可以融合许多不同类型的高度复杂数据的分析方法。
R语言自身总是按照单线程来实现的,而且其原有的程序设计并没有应用并行机制。然而,为了达到某些功能的并行目的以及使用并行处理框架,R语言需要借助于某些特别开发的外部添加包。我们将重点关注一些目前技术范围内可用的最好的并行算法。
在本书中,我们将介绍并行计算的各个方面,从单程序多数据(SPMD)到单指 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » R并行编程实战 (高性能计算技术丛书) - (EPUB全文下载)