科学计算与企业级应用的并行优化 - (EPUB全文下载)

文件大小:1.82 mb。
文件格式:epub 格式。
书籍内容:

高性能计算技术丛书
科学计算与企业级应用的并行优化
刘文志 著
ISBN:978-7-111-50628-7
本书纸版由机械工业出版社于2015年出版,电子版由华章分社(北京华章图文信息有限公司,北京奥维博世图书发行有限公司)全球范围内制作与发行。
版权所有,侵权必究
客服热线:+ 86-10-68995265
客服信箱:service@bbbvip.com
官方网址:www.hzmedia.com.cn
新浪微博 @华章数媒
腾讯微博 @yanfabook
微信公众号 华章电子书(微信号:hzebook)
目录

前言
第1章 多核向量处理器架构
1.1 众核系统结构
1.2 众核架构的一致性
1.3 多核向量处理器架构
1.3.1 Intel Haswell CPU架构
1.3.2 ARM A15多核向量处理器架构
1.3.3 AMD GCN GPU架构
1.3.4 NVIDIA Kepler和Maxwell GPU架构
1.4 Intel MIC架构
1.4.1 整体架构
1.4.2 计算单元
1.4.3 存储器单元
1.4.4 MIC架构上一些容易成为瓶颈的设计
1.5 OpenCL程序在多核向量处理器上的映射
1.5.1 OpenCL程序在多核向量CPU上的映射
1.5.2 OpenCL程序在NVIDIA GPU上的映射
1.5.3 OpenCL程序在AMD GCN上的映射
1.6 OpenCL程序在各众核硬件上执行的区别
1.7 众核编程模式
1.8 众核性能优化
1.9 MIC和GPU编程比较
1.10 本章小结
第2章 常见线性代数算法优化
2.1 稀疏矩阵与向量乘法
2.1.1 稀疏矩阵的存储格式
2.1.2 CSR格式稀疏矩阵与向量乘法
2.1.3 ELL格式稀疏矩阵与向量乘
2.2 对称矩阵与向量乘积
2.2.1 串行代码
2.2.2 向量化对称矩阵与向量乘积
2.2.3 OpenMP并行化
2.2.4 CUDA代码
2.3 三角线性方程组的解法
2.3.1 串行算法
2.3.2 串行算法优化
2.3.3 AVX优化实现
2.3.4 NEON优化实现
2.3.5 如何提高并行度
2.3.6 CUDA算法实现
2.4 矩阵乘法
2.4.1 AVX指令计算矩阵乘法
2.4.2 NEON指令计算矩阵乘法
2.4.3 GPU计算矩阵乘法
2.5 本章小结
第3章 优化偏微分方程的数值解法
3.1 热传递问题
3.1.1 C代码及性能
3.1.2 OpenMP代码及性能
3.1.3 OpenACC代码及性能
3.1.4 CUDA代码
3.2 简单三维Stencil
3.2.1 串行实现
3.2.2 Stencil在X86处理器上实现的困境
3.2.3 CUDA实现
3.3 本章小结
第4章 优化分子动力学算法
4.1 简单搜索的实现
4.1.1 串行代码
4.1.2 向量化实现分析
4.1.3 OpenMP实现
4.1.4 CUDA实现
4.2 范德华力计算
4.2.1 串行实现
4.2.2 向量化实现分析
4.2.3 OpenMP实现
4.2.4 CUDA实现
4.2.5 如何提高缓存的利用
4.3 键长伸缩力计算
4.3.1 串行实现
4.3.2 向量化实现
4.3.3 OpenMP实现
4.3.4 CUDA实现
4.4 径向分布函数计算
4.4.1 串行实现
4.4.2 向量化实现
4.4.3 OpenMP实现
4.4.4 CUDA实现
4.5 本章小结
第5章 机器学习算法
5.1 k-means算法
5.1.1 计算流程
5.1.2 计算元素所属分类
5.1.3 更新分类中心
5.1.4 入口函数
5.2 KNN算法
5.2.1 计算步骤
5.2.2 相似度计算
5.2.3 求前k个相似度最大元素
5.2.4 统计所属分类
5.3 二维卷积
5.3.1 X86实现
5.3.2 ARM实现
5.3.3 CUDA实现
5.4 四维卷积
5.4.1 X86实现
5.4.2 ARM实现
5.4.3 CUDA实现
5.5 多GPU并行优化深度学习软件Caffe
5.5.1 为什么要使用多GPU并行Caffe
5.5.2 AlexNet示例
5.5.3 Caffe的主要计算流程
5.5.4 多GPU并行卷积神经网络的方式
5.5.5 多GPU并行Caffe实践
5.6 本章小结

到这里,终于可以松一口气了,一个持续多年的工作总算可以告一段落了。本系列起源于我2012年想写的《并行乱弹》一书,乱弹是乱弹琴的意思。按我的本意,并不想把它写成一本非常严谨的著作,当时更无意出版,因此并不是非常注意全书逻辑的严密性,虽然经过我和编辑的多次修改,但想必问题依旧难以避免,在此诚恳地请求读者谅解。
本系列的3本书相互之间有联系,也有其独立性:《并行算法设计与性能优化》介绍常见的串行代码优化方法和并行算法的设计;《并行编程方法与优化实践》介绍常见的向量化和并行编程环境及一些实例;《科学计算与企业级应用的并行优化》则介绍领域相关的算法与应用的性能优化。
如果说要写一本简短的武侠小说来描写主角是如何学习这3本“秘笈”的话,我想故事是这样的:在2015年,主角是某位内向宅男码农hpc,因为程序速度太慢天天被产品经理骂,受项目经理白眼,每天工作到晚上10点,遭到家人埋怨。在某个月黑风高的晚上,某条街道上那位江湖人称“风辰”的“HPC帮”护法长老收hpc为不记名弟子,并传授给hpc《并行算法设计与性能优化》《并行编程方法与优化实践》及《科学计算与企业级应用的并行优化》3本“秘笈”,“风辰”临走时收了传功费用1024万元。hpc如获至宝,休假一月潜心修炼。一月后出关,容光焕发,程序速度大幅度提升,产品经理天天请吃大餐,项目经理忙着加项目奖金。此后,hpc每天下午5点即下班回家,修身养性,陪家人一起吃饭、购物。
愿这3本书能够真正成为改变读者生活的良师益友!
风辰
2015年5月17日于深圳 ............

书籍插图:
书籍《科学计算与企业级应用的并行优化》 - 插图1
书籍《科学计算与企业级应用的并行优化》 - 插图2

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » 科学计算与企业级应用的并行优化 - (EPUB全文下载)