数据分析常用工具

NumPy
NumPy(Numerical Python的简称)是Python科学计算的基础包。在本专题中的大部分内容都是基于NumPy以及构建于其上的库,它提供了以下功能(不限于此):
- 快速高效的多位数组对象ndarray
- 用于对数组执行元素级计算以及直接对数组执行数学运算的函数
- 用于读写硬盘上的基于数组的数据集工具
- 线性代数计算、傅里叶变换以及随机数生成
- 用于将C、C++、Fortran代码集成到Python工具中
除了Python提供快速的数组处理能力,NumPy在数据分析方面还有另外一个主要作用,即作为在算法之间传递数据的容器。对于数值型数据,NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多。此外,由低级语言(比如C和Fortran)编写的库可以直接操作NumPy数组中的数据,无需进行任何数据复制工作。

pandas
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

matplotlib

Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。

SciPy

SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等

类库安装

pip install NumPy 
pip install pandas 
pip install matplotlib 
pip install SciPy

原文地址:https://www.cnblogs.com/yjz8888/p/9910418.html

时间: 2024-08-02 09:18:13

数据分析常用工具的相关文章

数据分析常用工具总结

123456789101112131415 1. 优点:向量化数据操作比for循环,速度大大加强,numpy array比list好的地方在于切片2. array属性 np.random.random((2,2)) # 0-1随机数 np.random.randint(1,10,(3,3)) # 随机整数 array.shape, array.dtype # numpy两个属性 array.astype(np.float64) # 类型转换3. array切片操作 a[0,1] # 第一个维度为

《Python数据分析常用手册》一、NumPy和Pandas篇

一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scikit-learn 3.数据分析常用库的离线安装包(pip+wheels)(百度云):http://pan.baidu.com/s/1dEMXbfN 密码:bbs2 二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和

转 常用工具和技术

技术站点 Hacker News:非常棒的针对编程的链接聚合网站 Programming reddit:同上 MSDN:微软相关的官方技术集中地,主要是文档类 infoq:企业级应用,关注软件开发领域 OSChina:开源技术社区,开源方面做的不错哦 cnblogs,51cto,csdn:常见的技术社区,各有专长 stackoverflow:IT技术问答网站 GitHub:全球最大的源代码管理平台,很多知名开源项目都在上面,如Linux内核, OpenStack等免费的it电子书:http://

数据可视化的常用工具都有哪些?

很多技术都涉及到了不少工具,数据分析也不例外.数据分析中的数据可视化也是有很多的工具支撑的,大家可能普遍认为只要学会了Excel.Photoshop就可以了,其实并不是这样的.数据可视化有很多的工具可以给我们的工作和展示起到如虎添翼的效果.我们在这篇文章中就给大家介绍一下数据可视化中经常用到的工具. 首先我们说的是echarts.很多人认为echarts识百度为数不多的良心产品,其实这种硕大是正确的,一般来说,这个库跟d3相反(d3我们在后面会讲到),它离应用层更近,提供了许多示例模板,把代码复

java 常用工具

System:类中的属性方法都是静态的.无法实例化 err:"标准"错误输出流 in:"标准"输入流 out:"标准"输出流 常见方法: long currentTimeMillis();获取当前时间的毫秒值 Properties    getProperties(); 获取系统属性 Properties集合中存储的都是String类型的键和值. Runtime:没有构造方法摘要,说明该类不可以创建对象. 方法又是非静态,说明该类提供静态返回该类

2015第30周三Spring常用工具类

文件资源操作 文件资源的操作是应用程序中常见的功能,如当上传一个文件后将其保存在特定目录下,从指定地址加载一个配置文件等等.我们一般使用 JDK 的 I/O 处理类完成这些操作,但对于一般的应用程序来说,JDK 的这些操作类所提供的方法过于底层,直接使用它们进行文件操作不但程序编写复杂而且容易产生错误.相比于 JDK 的 File,Spring 的 Resource 接口(资源概念的描述接口)抽象层面更高且涵盖面更广,Spring 提供了许多方便易用的资源操作工具类,它们大大降低资源操作的复杂度

开发常用工具 屏幕取色软件 取色软件

开发常用工具 屏幕取色软件 韩梦飞沙  韩亚飞  [email protected]  yue31313  han_meng_fei_sha 取色软件_屏幕取色软件_取色软件大全

写python的常用工具及设置

目的:记录一下常用工具及设置,以便换电脑后可以找回工作环境. 环境:windows 7  ubuntu 16.4 情景:学习python时,一个好的开发环境可以提供很多帮助,节省时间,提高效率等,经常在windows和ubuntu系统中写python,想要一个兼容平台且好用免费的软件---pycharm不错的选择. 之前ubuntu上我用过Spyder,很轻巧,但是自动补齐功能不方便,只能当作小工具了,然后找到了pycharm,它支持ubuntu和windows,社区版是免费的,已经足够了,自动

mysql 性能优化常用工具

mysql 性能优化常用工具: 常用性能检测工具 show engine innodb  status show full processlist information_schema.processlist explain create table innodb_table_monitor(a int) engine=innodb; innodb_locks innodb_lock_wait innodb_trx zabbix监控 pt-tools 工具 性能优化的两种方式: 1.执行计划的解