Python数据分析(第2版) - (EPUB全文下载)

文件大小:0.22 mb。
文件格式:epub 格式。
书籍内容:

Python数据分析(第2版)
第1章 Python程序库入门
第2章 NumPy数组
第3章 Pandas入门
第4章 统计学与线性代数
第5章 数据的检索、加工与存储
第6章 数据可视化
第7章 信号处理与时间序列
第8章 应用数据库
第9章 分析文本数据和社交媒体
第10章 预测性分析与机器学习
第11章 Python生态系统的外部环境和云计算
第12章 性能优化、性能分析与并发性
附录A 重要概念
附录B 常用函数
第1章 Python程序库入门
欢迎来到Python数据分析的世界!如今,Python已成为数据分析和数据科学事实上的标准语言和标准平台之一。我们将为读者展示一张思维导图,图1-1中将给出Python生态系统为数据分析师和数据科学家提供的各种程序库。NumPy、SciPy、Pandas和Matplotlib库共同构成了Python数据分析的基础,当前它们已经成为SciPy Stack 1.0的组成部分。在本章中,我们不仅会学习如何安装SciPy Stack 1.0和Jupyter Notebook,还将编写一些简单的数据分析代码,为后面的学习做好热身。
下面是Python生态系统为数据分析师和数据科学家提供的常用程序库。
NumPy:这是一个通用程序库,不仅支持常用的数值数组,同时提供了用于高效处理这些数组的函数。
SciPy:这是Python的科学计算库,对NumPy的功能进行了大量扩充,同时也有部分功能是重合的。Numpy和SciPy曾经共享基础代码,后来分道扬镳了。
Pandas:这是一个用于数据处理的程序库,不仅提供了丰富的数据结构,同时为处理数据表和时间序列提供了相应的函数。
Matplotlib:这是一个2D绘图库,在绘制图形和图像方面提供了良好的支持。当前,Matplotlib已经并入SciPy中并支持NumPy。
IPython:这个库为Python提供了强大的交互式Shell,也为Jupyter提供了内核,同时还支持交互式数据可视化功能。我们将在本章稍后介绍IPython shell。
Jupyter Notebook:它提供了一个基于Web的交互式shell,可以创建和共享支持可实时代码和可视化的文档。Jupyter Notebook通过IPython提供的内核支持多个版本的Python。本章稍后将会为读者进一步介绍Jupyter Notebook。 
对于本书而言,当需要安装软件时,我们会在恰当的时机给出相应的安装说明。在安装软件的过程中遇到困难或者不能断定最佳方案时,读者可以参考图1-1,这里提供了寻找解决问题所需辅助信息的指南。
图1-1
本章将涉及以下主题。
安装Python 3
将IPython用作shell
阅读手册页
Jupyter Notebook
NumPy数组
一个简单的应用
何处寻找帮助和参考资料
列出Python库中的模块
利用matplotlib可视化数据
1.1 安装Python 3
本书所用软件都是基于Python 3的,所以必须首先安装Python 3。不过,对于某些操作系统而言,Python 3是默认安装的。Python具有多种实现,其中包括具有商业版权的实现和发行版。在本书中,我们只关注标准Python实现,因为它与NumPy完全兼容。
 提示
读者可以从https://www.python.org/download/页面下载Python 3.5.x。在这个网站上,我们可以找到为Windows和Mac OS X系统开发的安装程序,以及为Linux、UNIX和Mac OS X系统提供的源码包。我们可以从https://docs.python.org/3/using/index.html上找到在各种操作系统上安装和使用Python的相关说明。
本章需要安装的软件,在Windows、各种Linux发行版本和Mac OS X系统上都有相应的二进制安装程序。当然,如果读者愿意,也可以使用相应的源代码发行包。对于Python,要求其版本为3.5.x或更高。Python 2.7版本的支持与维护工作已经从2015年延续至2020年,之后,我们不得不迁移到Python 3。
1.1.1 安装数据分析程序库
下面开始介绍如何在Windows、Linux和Mac OS X上安装和设置NumPy、SciPy、Pandas、Matplotlib、IPython和Jupyter Notebook。下面来详细了解一下这个过程。在本书中,我们将使用pip3来安装这些库。因为从3.4版本起,pip3已经默认包含在Python的安装程序中了。
1.1.2 Linux平台或Mac OS X平台
为了安装这些基础的程序库,可以运行以下命令。
$ pip3 install numpy scipy pandas matplotlib jupyter notebook
如果当前登录的账户没有足够权限,则需要在上面的命令行前面添加sudo。
1.1.3 Windows平台
在撰写本书时,我们在Windows 10虚拟机上安装了以下软件,作为安装这些程序库的先决条件。
Python 3.6。
Microsoft Visual C++ Build Tools 2015。
下载并安装适用于Windows平台的、预编译好的NumPy和SciPy二进制文件。
我们下载了numpy-1.12.0 + mkl-cp36-cp36m-win_amd64.whl和scipy-0.18.1-cp36- cp36m-win_amd64.whl。
下载完成后,执行命令pip3 install Downloads\numpy-1.12.0 + mkl-cp36-cp36m-win_amd64.whl和pip3 install Downloads\scipy-0.18.1-cp36-cp36m-win_amd64.whl。
安装上述软件后,为了安装其余的基础程序库,可以运行以下命令。
$ pip3 inst ............

以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。

版权声明:书云(openelib.org)是世界上最大的在线非盈利图书馆之一,致力于让每个人都能便捷地了解我们的文明。我们尊重著作者的知识产权,如您认为书云侵犯了您的合法权益,请参考版权保护声明,通过邮件openelib@outlook.com联系我们,我们将及时处理您的合理请求。 数研咨询 流芳阁 研报之家 AI应用导航 研报之家
书云 Open E-Library » Python数据分析(第2版) - (EPUB全文下载)