Spark 深度学习指南 - (EPUB全文下载)
文件大小:1.85 mb。
文件格式:epub 格式。
书籍内容:
Spark 深度学习指南
1 为深度学习开发设置Spark
2 在Spark中创建神经网络
3 卷积神经网络的难点
4 循环神经网络的难点
5 用Spark机器学习预测消防部门呼叫
6 在生成网络中使用LSTM
7 使用TF-IDF进行自然语言处理
8 使用XGBoost进行房地产价值预测
9 使用长短期记忆单元预测苹果公司股票市场价格
10 使用深度卷积网络进行人脸识别
11 使用Word2Vec创建和可视化单词向量
12 使用Keras创建电影推荐引擎
13 使用TensorFIow在Spark中进行图像分类
反侵权盗版声明
1 为深度学习开发设置Spark
本章将涵盖以下步骤:
·下载Ubuntu桌面映像
·在macOS中使用VMWare Fusion安装和配置Ubuntu
·在Windows中使用Oracle VirtualBox安装和配置Ubuntu
·为谷歌云平台安装和配置Ubuntu桌面端
·在Ubuntu桌面端安装和配置Spark
·集成Jupyter Notebook与Spark
·启动和配置Spark集群
·停止Spark集群
介绍
深度学习是机器学习算法的研究重点,它将神经网络作为主要的学习方法。在过去几年中,深度学习爆发式地发展并进入人们的视野。微软、谷歌、脸书、亚马逊、苹果、特斯拉和其他公司都在他们的应用程序、网站和产品中使用深度学习模型。在同一时间,Spark作为一个运行在大数据源上的内存计算引擎,使得用创纪录般的速度处理大量信息变得容易可行。事实上,Spark现已成为数据工程师、机器学习工程师和数据科学家使用的主要的大数据开发工具。
由于深度学习模型在拥有更多数据的情况下表现得更好,因此 Spark 和深度学习协同使用效果更佳。能够实现最佳开发的工作环境与用于执行深度学习算法的代码几乎同样重要。许多有才华的人都渴望建立神经网络来帮助他们回答研究中的重要问题。不幸的是,深度学习模型发展的最大障碍之一是获取大数据所需的必要技术资源。本章的目的是为Spark创建一个用于深度学习的理想虚拟开发环境。
下载Ubuntu桌面映像
Spark可以在所有类型的操作系统上进行设置,无论它们是在本地还是在云端。为了方便,我们选择将 Spark 安装在基于 Linux 的虚拟机上,并以 Ubuntu 作为操作系统。使用Ubuntu作为移动虚拟机有几个优点,其中最重要的是成本低。由于它们是基于开源的软件,因此Ubuntu操作系统可以免费使用,不需要许可。成本始终是一种考虑因素,本书的主要目标之一是最大程度地减少在Spark框架上进行深度学习所需的经济支出。
准备
这里有一些关于下载的映像文件所需最低要求的建议:
·至少2 GHz的双核处理器
·至少2 GB的系统内存
·至少25 GB的可用硬盘空间
实现
按照以下步骤下载Ubuntu桌面映像。
1.为了创建Ubuntu桌面端虚拟机,首先要从官方网站下载文件:
链接6
2.在撰写本书时,Ubuntu桌面端的最新版本是16.04.3。
3.下载完成后,以.iso格式访问以下文件:
说明
虚拟环境通过隔离与物理或主机的关系来提供最佳的开发工作环境。开发人员可以使用各种类型的设备来运行主机环境,例如运行 macOS 的 MacBook,运行 Windows 的Microsoft Surface,甚至是使用Microsoft Azure或AWS的云虚拟机。但是,为了确保执行代码输出的一致性,在这里将部署可以在各种主机平台之间使用和共享的Ubuntu桌面端的虚拟环境。
扩展
桌面虚拟化软件有多种选择,具体取决于主机环境是 Windows 还是 macOS。使用macOS时,有两种常见的虚拟化软件应用程序:
· VMWare Fusion
· Parallels
其他
要了解有关Ubuntu桌面端的更多信息,你可以访问链接7。
在macOS中使用VMWare Fusion安装和配置Ubuntu
本节将重点介绍如何使用带有VMWare Fusion的Ubuntu操作系统构建虚拟机。
准备
你的系统需要先安装好 VMWare Fusion。如果你目前没有安装此虚拟机,可以从VMWare官网下载试用版。
实现
按照以下步骤在macOS上使用VMWare Fusion配置Ubuntu:
1.启动并运行 VMWare Fusion 后,单击左上角的“+”按钮开始配置过程,并选择New...项,如下图所示:
2.完成以上选择后,再选择Install from disc or image选项,如下图所示:
3.选择从Ubuntu网站下载的操作系统的iso文件,如下图所示:
4.下一步将询问是否要选择Linux Easy InstaII。建议选择,同时填写包括Ubuntu环境的显示名称/密码组合,如下图所示:
5.配置过程基本完成。完成后将显示虚拟机摘要(Virtual Machine Summary),其中包含自定义设置(Customize Settings)选项,可用来增加内存和硬盘容量值,如下图所示:
6.20GB 到 40GB 的硬盘空间足以满足虚拟机的需求。但是,在后续章节执行 Spark代码时,将内存增加到2GB甚至4GB将有助于提升虚拟机的性能。更新内存可以通过选择虚拟机设置中的Processors和Memory,将内存容量增加到所需的量,如下图所示:
说明
该设置允许手动配置在VMWare Fusion上成功运行Ubuntu桌面端所需的设置。可以根据主机的需求和可用性来增加或减少内存和硬盘驱动器的容量。
扩展
剩下的就是首次启动虚拟机,从而启动将系统安装到虚拟机上的过程。完成所有设置并且登录后,Ubuntu虚拟机便可用于开发了,如下图所示:
其他
除了VMWare Fusion,还有另一款产品在macOS上提供类似的功能,它就是Parallels Desktop for Mac。要了解有关VMWare和Parallels的更多信息,并确定哪个程序更适合你的开发,请访 ............
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » Spark 深度学习指南 - (EPUB全文下载)