《利用Python进行数据分析》.(Wes McKinney).[PDF].pdf

下载地址:网盘下载

内容简介  · · · · · ·

【名人推荐】

“科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法。本书在未来几年里肯定会成为Python领域中技术计算的权威指南。”

——Fernando Pérez 加州大学伯克利分校 研究科学家, IPython的创始人之一

【内容简介】

还在苦苦寻觅用python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。

由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

?将IPython这个交互式Shell作为你的首要开发环境。

?学习NumPy(Numerical Python)的基础和高级知识。

?从pandas库的数据分析工具开始。

?利用高性能工具对数据进行加载、清理、转换、合并以及重塑。

?利用matplotlib创建散点图以及静态或交互式的可视化结果。

?利用pandas的groupby功能对数据集进行切片、切块和汇总操作。

?处理各种各样的时间序列数据。

?通过详细的案例学习如何解决Web分析、社会科学、金融学以及经?济学等领域的问题。

作者简介  · · · · · ·

Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。

目录  · · · · · ·

目录

前言 1

第1章 准备工作 5

本书主要内容 5

为什么要使用Python进行数据分析 6

重要的Python库 7

安装和设置 10

社区和研讨会 16

使用本书 16

致谢 18

第2章 引言 20

来自bit.ly的1.usa.gov数据 21

MovieLens 1M数据集 29

1880—2010年间全美婴儿姓名 35

小结及展望 47

第3章 IPython:一种交互式计算和开发环境 48

IPython基础 49

内省 51

使用命令历史 60

与操作系统交互 63

软件开发工具 66

IPython HTML Notebook 75

利用IPython提高代码开发效率的几点提示 77

高级IPython功能 79

致谢 81

第4章 NumPy基础:数组和矢量计算 82

NumPy的ndarray:一种多维数组对象 83

通用函数:快速的元素级数组函数 98

利用数组进行数据处理 100

用于数组的文件输入输出 107

线性代数 109

随机数生成 111

范例:随机漫步 112

第5章 pandas入门 115

pandas的数据结构介绍 116

基本功能 126

汇总和计算描述统计 142

处理缺失数据 148

层次化索引 153

其他有关pandas的话题 158

第6章 数据加载、存储与文件格式 162

读写文本格式的数据 162

二进制数据格式 179

使用HTML和Web API 181

使用数据库 182

第7章 数据规整化:清理、转换、合并、重塑 186

合并数据集 186

重塑和轴向旋转 200

数据转换 204

字符串操作 217

示例:USDA食品数据库 224

第8章 绘图和可视化 231

matplotlib API入门 231

pandas中的绘图函数 244

绘制地图:图形化显示海地地震危机数据 254

Python图形化工具生态系统 260

第9章 数据聚合与分组运算 263

GroupBy技术 264

数据聚合 271

分组级运算和转换 276

透视表和交叉表 288

示例:2012联邦选举委员会数据库 291

第10章 时间序列 302

日期和时间数据类型及工具 303

时间序列基础 307

日期的范围、频率以及移动 311

时区处理 317

时期及其算术运算 322

重采样及频率转换 327

时间序列绘图 334

移动窗口函数 337

性能和内存使用方面的注意事项 342

第11章 金融和经济数据应用 344

数据规整化方面的话题 344

分组变换和分析 355

更多示例应用 361

第12章 NumPy高级应用 368

ndarray对象的内部机理 368

高级数组操作 370

广播 378

ufunc高级应用 383

结构化和记录式数组 386

更多有关排序的话题 388

NumPy的matrix类 393

高级数组输入输出 395

性能建议 397

附录A Python语言精要 401

下载地址:网盘下载

时间: 2024-12-21 04:04:58

《利用Python进行数据分析》.(Wes McKinney).[PDF].pdf的相关文章

利用Python进行数据分析PDF

利用Python进行数据分析PDF百度网盘链接:https://pan.baidu.com/s/1S6iIb69V2ap1yaoIYLVMtg 提取码:zbeq 复制这段内容后打开百度网盘手机App,操作更方便哦内容简介 · · · · · · [名人推荐]"科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法.本书在未来几年里肯定会成为Python领域中技术计算的权威指南."--Fernando Pérez 加州大学伯克利分校 研究科学家, IPyt

分享《利用Python进行数据分析(第二版)》高清中文版PDF+高清英文版PDF+源代码

资料下载:https://pan.baidu.com/s/1K3DjJ9S1S3AxpacEElNF9Q <利用Python进行数据分析(第二版)>[中文版和英文版][高清完整版PDF]+[配套源代码]<利用Python进行数据分析(第二版)>中文和英文两版对比学习, 高清完整版PDF,带书签,可复制粘贴:还有配套源代码:讲解详细并配有源代码. 其中,高清中文版如图: 原文地址:http://blog.51cto.com/3215120/2306885

《利用Python进行数据分析(第2版)》高清中文版PDF+高清英文版PDF+源代码

资源链接:https://pan.baidu.com/s/15LtkL6q9AX-mYfPhkuXBCw<利用Python进行数据分析(第2版)>高清中文版PDF+高清英文版PDF+源代码高清中文版PDF,667页,带目录和书签,文字能够复制粘贴:高清英文版PDF,541页,带目录和书签,文字能够复制粘贴:中英文两版可以对比学习.配套源代码:经典书籍,讲解详细:其中,高清中文版如图: 原文地址:http://blog.51cto.com/14063572/2320192

参考《利用Python进行数据分析(第二版)》高清中文PDF+高清英文PDF+源代码

第2版针对Python 3.6进行全面修订和更新,涵盖新版的pandas.NumPy.IPython和Jupyter,并增加大量实际案例,可以帮助高效解决一系列数据分析问题. 第2版中的主要更新了Python第三方发布版Anaconda和其他所需Python包的安装指引: 更新pandas库到2017年的新版: 新增一章关于更多高级pandas工具和一些使用提示:新增statsmodels和scikit-learn的简明使用介绍. 学习参考: <利用Python进行数据分析(第二版)>高清中文

《利用Python进行数据分析第2版》中文PDF+英文PDF+源代码

<利用Python进行数据分析(第二版)>中文PDF 667页,带目录,文字能复制:英文PDF,541页,带目录,文字能复制:配套源代码: https://pan.baidu.com/s/1_IucldnemGSF_GaUMI5zxw 提取密码 rr9b 原文地址:https://www.cnblogs.com/cuhuer/p/12069766.html

PYTHON学习(三)之利用python进行数据分析(1)---准备工作

学习一门语言就是不断实践,python是目前用于数据分析最流行的语言,我最近买了本书<利用python进行数据分析>(Wes McKinney著),还去图书馆借了本<Python数据分析基础教程--NumPy学习指南>(第二版),准备将python数据分析工具的门给入了哈哈,闲话少说,直接切入正题. 首先<利用python进行数据分析>此书的译者强烈建议计算机环境的配置最好与书上的一致,所以我找了半天书上要求用的安装包 第一,安装32位的EPDFree(书上的版本就是3

利用Python进行数据分析(第二版)电子版书籍分享

资料下载地址: 链接:https://pan.baidu.com/s/1y1C0bJPkSn7Sv6Eq9G5_Ug 提取码:vscu <利用Python进行数据分析(第二版)>高清中文版PDF+高清英文版PDF+配套源代码 高清中文版PDF,带目录和书签,能够复制粘贴:高清英文版PDF,带目录和书签,能够复制粘贴:中英文两版可以对比学习.配套源代码:经典书籍,讲解详细:其中,高清中文版如图: 原文地址:https://www.cnblogs.com/yxxblog/p/10716700.ht

利用python进行数据分析--(阅读笔记一)

以此记录阅读和学习<利用Python进行数据分析>这本书中的觉得重要的点! 第一章:准备工作 1.一组新闻文章可以被处理为一张词频表,这张词频表可以用于情感分析. 2.大多数软件是由两部分代码组成:少量需要占用大部分执行时间的代码,以及大量不经常执行的“粘合剂代码”. cython已经成为python领域中创建编译型扩展以及对接c/c++代码的一大途径. 3.在那些要求延迟性非常小的应用程序中(例如高频交易系统),为了尽最大可能地优化性能,耗费时间使用诸如C++这样更低级.更低生产率的语言进行

《利用python进行数据分析》

今天开始码这本书--<利用python进行数据分析>.R和python都得会用才行,这是码这本书的原因.首先按照书上说的进行安装,google下载了epd_free-7.3-1-win-x86.msi,译者建议按照作者的版本安装.

利用python进行数据分析——(一)库的学习

总结一下自己对python常用包:Numpy,Pandas,Matplotlib,Scipy,Scikit-learn 一. Numpy: 标准安装的Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指 针.这样为了保存一个简单的[1,2,3],需要有3个指针和三个整数对象.对于数值运算来说这种结构显然比较浪费内存和CPU计算时间. 此外Python还提供了一个array模块,array对象和列表不同,它直接保存数值,和