Python 3 爬虫、数据清洗与可视化实战(第2版) - (EPUB全文下载)

文件大小:0.15 mb。
文件格式:epub 格式。
书籍内容:

Python 3 爬虫、数据清洗与可视化实战(第2版)
第1章 Python语言基础
第2章 数据采集的基本知识
第3章 用API爬取天气预报数据
第4章 大型爬虫案例:抓取某电商网站的商品数据
第5章 采集手机App数据
第6章 Scrapy爬虫
第7章 Selenium爬虫
第8章 爬虫案例集锦
第9章 数据库连接和查询
第10章 NumPy数组操作
第11章 pandas数据清洗
第12章 综合应用实例
第13章 数据可视化
专业服务
第1章 Python语言基础
1.1 安装Python环境
1.1.1 Python 3.6.2安装与配置
根据Windows版本(64位/32位)从Python官网上下载对应的版本,如图1-1所示。
图1-1
下载完成后,双击文件以运行安装程序安装Python,如图1-2所示。
图1-2
STEP 1:勾选“Add Python 3.6 to PATH”选项后单击“Customize installation”选项。
“Add Python 3.6 to PATH”选项用于将Python 3.6加入系统路径,勾选该选项会使日后的操作非常方便;如果没有勾选这个选项,就需要手动为系统的环境变量添加路径。
STEP 2:在弹出的界面中勾选所有的选项,并单击“Next”按钮,如图1-3所示。
选项“Documentation”表示安装Python的帮助文档;选项“pip”表示安装Python的第三方包管理工具;选项“tcl/tk and IDLE”表示安装Python的集成开发环境;选项“Python test suite”表示安装Python的标准测试套件;最后两个选项则表示允许版本更新。
图1-3
STEP 3:保持默认勾选状态,单击“Browse”按钮,选择安装路径,如图1-4所示。
图1-4
STEP 4:单击“Install”按钮,直至完成安装。
完成安装后,调出命令提示符,输入“python”,检查是否安装成功。如果Python安装成功,则将出现如图1-5所示的界面,即输入“python”后会看到“>>>”符号。
图1-5
1.1.2 使用IDE工具——PyCharm
安装好环境后,还需要配置一个程序员专属工具,即PyCharm,它是一个适合用于开发的多功能IDE(集成开发环境),下载社区版(免费版)。
笔者使用的版本是2017.2.2,发行日期是2017年8月24日,可以从PyCharm官网上下载,如图1-6所示。
图1-6
PyCharm非常好用,通过PyCharm可以下载、安装和管理库。
1.1.3 使用IDE工具——Anaconda
Anaconda是一个专门用于统计和机器学习的IDE,它集成了Python和许多基础的库,如果业务场景是统计和机器学习,那么只要安装一个Anaconda就可以了,从而省去许多复杂的配置过程。
Anaconda可以通过官网下载,如图1-7所示。
这里默认下载的是64位的版本,如果需要下载32位的版本,则可以单击“Download”按钮下的文字链接。
使用Anaconda不需要提前安装Python,安装后即可运行:使用快捷键【Windows+R】打开“运行”对话框,在“打开”文本框中输入“ipython jupyter”,然后单击“确定”按钮,如图1-8所示。
图1-7
图1-8
1.2 Python操作入门
1.2.1 编写第一个Python代码
运行PyCharm后,需要先新建计划(Project),单击“Create New Project”选项,如图1-9所示。
图1-9
设置Location(路径)和Interpreter(翻译器),笔者同时安装了Python和Anaconda,所以图1-10中的翻译器有两个可选项,二者的区别在于Anaconda中有许多预置好的库,不用再配置库了。这里选择Python原版的翻译器,然后单击右下角的“Create”按钮。
图1-10
新建计划后,在左侧的项目窗口中右击鼠标,在弹出的快捷菜单中选择“New”g“Python File”命令,新建Python文件(见图1-11)。
图1-11
设置Name(文件名),然后单击右下角的“OK”按钮(见图1-12)。
图1-12
新建Python文件后,右侧的空白区域就是代码编辑区(见图1-13)。
从“Hello,World!”(你好,世界!)开始吧!在代码编辑区中输入“print('Hello, World! ')”,print()是一个打印函数,表示将括号中的文本打印在即时窗口中。然后将鼠标光标停留在括号右侧,右击鼠标,在弹出的快捷菜单中选择“Run 'test'”命令,其中单引号中的test是当前的文件名,一定要注意运行的文件名和要运行的文件名保持一致。运行后可以观察到即时窗口中打印出“Hello,World!”,如图1-14所示。
图1-13
图1-14
1.2.2 Python基本操作
1.Python注释
注释的目的是让阅读者能够轻松读懂每一行代码的意义,同时也为后期代码维护提供便利。在Python中,单行注释以#号开头,如下所示。
Python的多行注释用两个三引号(''')包含起来,如下所示。
2.Python的行缩进
Python最具特色的就是使用缩进来表示代码块,不需要使用大括号。缩进的空格数是可变的,但是同一个代码块的语句必须包含相同的缩进空格数,缩进不一致会导致代码运行错误。
正确缩进的示例如下。
错误缩进的示例如下。
3.多行语句
Python通常是一行写完一条语句,但如果语句很长,则可以通过反斜杠(\)来实现多行语句。
这里的输出结果为“Little Robert asked his mother for two cents.'What did you do with the money I gave you yesterday?&apos ............

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » Python 3 爬虫、数据清洗与可视化实战(第2版) - (EPUB全文下载)