Python数据科学入门 - (EPUB全文下载)
文件大小:1.82 mb。
文件格式:epub 格式。
书籍内容:
版权信息
书名:Python数据科学入门
作者:[俄] Dmitry Zinoviev
译者:熊子源
ISBN:978-7-115-47060-7
本书由北京图灵文化发展有限公司发行数字版。版权所有,侵权必究。
您购买的图灵电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
091507240605ToBeReplacedWithUserId
版权声明
前言
关于本书
关于读者
关于软件
关于引号
关于本书的论坛
轮到你了
致谢
第 1 章 什么是数据科学
第1单元 数据分析步骤
第2单元 数据获取途径
第3单元 报告的结构
轮到你了
第 2 章 数据科学的Python核心
第4单元 理解基本的字符串函数
第5单元 选择合适的数据结构
第6单元 通过列表推导式理解列表
第7单元 使用计数器
第8单元 使用文件
第9单元 上网
第10单元 使用正则表达式实现模式匹配
理解正则表达式语言
使用模块re进行搜索、拆分和替换
第11单元 globbing7文件名与其他字符串
第12单元 Pickling和Unpickling数据
轮到你了
第 3 章 使用文本数据
第13单元 处理HTML文件
第14单元 处理CSV文件
第15单元 读取JSON文件
第16单元 处理自然语言中的文本
NLTK语料库
规范化
其他文本处理程序
轮到你了
第 4 章 使用数据库
第17单元 设置MySQL数据库
第18单元 使用MySQL数据库:命令行
插入
删除
变更
选择
连接
第19单元 使用MySQL数据库:pymysql
第20单元 改善文档存储:MongoDB
轮到你了
第 5 章 使用表格形式的数值数据
第21单元 创建数组
第22单元 转置和重排
第23单元 索引和切片
第24单元 广播
第25单元 揭秘通用函数
第26单元 理解条件函数
第27单元 数组的聚合与排序
第28单元 将数组用作集合
第29单元 数组的保存和读取
第30单元 生成合成正弦波
轮到你了
第 6 章 使用series和frame
第31单元 pandas数据结构
series
frame
第32单元 数据重塑
索引
重建索引
分层索引
堆叠和旋转
第33单元 处理缺失数据
删除缺失数据
插补缺失数据
替换数据
第34单元 组合数据
合并
连接
删除重复行
第35单元 数据的排序和描述
排序和分级
描述性统计量
唯一性、计数、会员资格
第36单元 数据转换
算术运算
数据聚合
离散化
映射
交叉表
第37单元 掌握pandas的文件读写功能
读取CSV和表格文件
分块
读取其他文件
轮到你了
第 7 章 使用网络数据
第38单元 概念剖析
图的元素、类型和密度
图的结构
中心性
第39单元 网络分析序列
第40单元 使用networkx
构建和修改网络
探索和分析网络
管理属性
团和社区结构
输入和输出
轮到你了
第 8 章 绘图
第41单元 使用PyPlot进行基本绘图
第42单元 了解其他绘图类型
第43单元 精通绘图装饰
第44单元 用pandas绘图
轮到你了
第 9 章 概率与统计
第45单元 回顾概率分布
均匀分布
正态分布
二项分布
第46单元 回顾统计度量
第47单元 以Python的方式完成统计
生成随机数
计算统计度量
轮到你了
第 10 章 机器学习
第48单元 设计预测实验
第49单元 线性回归拟合
普通最小二乘回归
脊回归
逻辑回归
第50单元 用k均值聚类实现数据分组
第51单元 在随机决策森林中生存
轮到你了
附录 1 扩展阅读
附录 2 单星项目的解决方案
参考文献
版权声明
Copyright © 2016 The Pragmatic Programmers, LLC. Original English language edition, entitled Data Science Essentials in Python
.
Simplified Chinese-language edition copyright © 2017 by Posts & Telecom Press. All rights reserved.
本书中文简体字版由The Pragmatic Programmers, LLC.授权人民邮电出版社独家出版。未经出版者书面许可,不得以任何方式复制或抄袭本书内容。
版权所有,侵权必究。
献给我集美丽与智慧于一身的妻子安娜。献给我们的孩子们:优雅的芭蕾舞演员尤金妮亚和浪漫的游戏玩家罗曼。也献给2015年夏天我的第一门数据科学课。
我现在必须给你一个小小的科学指引,来扰乱你的思路。
——英国小说家Marie Corelli
前言
2015年夏天,我在位于美国波士顿的萨福克大学使用Python教授数据科学入门课程,授课对象是一组经过选拔的本科生,本书的创作灵感正来源于这门课程。该课程是两个系列课程中的第一门课程,重点是数据的获取、清洗、组织和可视化,涉及统计学、机器学习和网络分析等相关内容。
数据的处理涉及庞大的体系和众多的Python模块(例如数据库、自然语言处理框架、JSON和HTML解析器,以及高性能数值数据结构,等等)。我很快意识到,不仅是本科生,甚至是经验丰富的专业人士,也很容易被这些浩瀚的知识所淹没。事实上,不得不承认,与我熟悉的领域相比,在进行数据科学和网络分析领域的研究时,我需要花更多时间去使用help()
函数和浏览大量Python网络论坛。另外,我有时在课堂上会因为想不起某个函数名或可选参数而尴尬不已。
作为课程的一部分,我针对多类主题编辑了一套极具参考价值的备忘单。这些备忘单最终演变成了这本书。希望本书能够使你从大量函数名和可选参数中解脱出来,专注于数据科学和数据分析本身。
关于本书
本书涵 ............
书籍插图:
以上为书籍内容预览,如需阅读全文内容请下载EPUB源文件,祝您阅读愉快。
书云 Open E-Library » Python数据科学入门 - (EPUB全文下载)