python-数据处理的包Numpy,scipy,pandas,matplotlib

一,NumPy包(numeric python,数值计算)

该包主要包含了存储单一数据类型的ndarry对象的多维数组和处理数组能力的函数ufunc对象。是其它包数据类型的基础。只能处理简单的数据分析能力,对于高级的数据处理和大数据分析,采用pandas包。

python自带的list可以包含不同类型的数据,原因是list保存的实际是这些数据的指针,这样才能实现不同类型的数据都能保存在list中。但缺点是这样的保存方式消耗内存,运行工作量大。

二,Scipy包(scientific python,科学计算)

主要用于数据处理,包括统计分析,优化,整合,线性代数,傅里叶变换,信号处理,图像处理,常微分方程求解等,依赖与Numpy包,因为numpy是该包数据类型来源。

三,Pandas包

主要用于数据清洗,整理,建立在numpy上。

擅长处理大数据(文本,csv,excel等数据)。数据也来自与numpy类型数据,因此依赖numpy包

四,matplotlib包

matplotlib也是基于numpy的包,主要负责数据的可视化显示。

五,scikit-learn包

机器学习,建立在scipy基础上

基本功能被分为六个部分,分类,回归,聚类,数据降维,数据选择,数据预处理

六,Nltk包

自然语言处理

七,Pattern包

网络挖掘

八,Theano包

深度学习

九,Scrappy包

网络爬虫

参考文献:z00182 python与数据科学

原文地址:https://www.cnblogs.com/zhuluqing/p/9746998.html

时间: 2024-10-12 22:43:26

python-数据处理的包Numpy,scipy,pandas,matplotlib的相关文章

Linux下Python科学计算包numpy和SciPy的安装

系统环境: OS:RedHat5 Python版本:Python2.7.3 gcc版本:4.1.2 各个安装包版本: scipy-0.11.0 numpy-1.6.2 nose-1.2.1 lapack-3.4.2 atlas-3.10.0 依赖关系:scipy的安装需要依赖于numpy.lapack.atlas(后两者都是线性代数工具包),而numpy和sci的测试程序的运行又依赖于nose,因此,整个安装过程必须要按顺序执行的,否则是无法执行下去的. 安装步骤: 1.安装nose 这个安装比

Ubuntu下安装Numpy, SciPy and Matplotlib

Python开发环境包含科学计算,需要安装NumPy, SciPy, Matplotlib.其中Matplotlib依赖于Python和NumPy.我们先安装NumPY和SciPy.  Matplotlib安装稍微复杂 1.首先确保你的apt-get可用.如果不可用 试着更新一下 sudo apt-get install 2.安装你的NumPy和SciPy. apt-get install python-numpy apt-get install python-scipy 3.安装你的Matpl

Python 数据处理扩展包: numpy 和 pandas 模块介绍

一.numpy模块 NumPy(Numeric Python)模块是Python的一种开源的数值计算扩展.这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix)).据说NumPy将Python相当于变成一种免费的更强大的MatLab系统. NumPy模块提供了许多高级的数值编程工具,如:矩阵数据类型.矢量处理,以及精密的运算库等. 1).一个强大的N维数组对象Array: 2).比较成熟

Ubuntu Python 安装numpy SciPy、MatPlotLib环境

安装 sudo apt-get install python-scipysudo apt-get install python-numpysudo apt-get install python-matplotlib 测试 #test plot from mpl_toolkits.mplot3d import axes3d import matplotlib.pyplot as plt from matplotlib import cm fig = plt.figure() ax = fig.gc

Python 数据处理扩展包: pandas 模块的DataFrame介绍

DataFrame是Pandas中的一个表结构的数据结构,包括三部分信息,表头(列的名称),表的内容(二维矩阵),索引(每行一个唯一的标记). 一.DataFrame的创建 有多种方式可以创建DataFrame,下面举例介绍. 例1: 通过list创建 >>> import pandas as pd >>> df = pd.DataFrame([[1,2,3],[4,5,6]]) >>> df 0 1 2 0 1 2 3 1 4 5 6 [2 rows

python库安装(numpy+scipy+matplotlib+scikit_learn)

python安装好后,库安装走了很多弯路,查了很多资料,终于安装成功,并且保存了该文章的地址,分享给大家 本人电脑windows 7,64位系统,安装的Python是3.5的,因此下载的库也是对应版本的 安装方式:同过命令行提示符,安装后缀是.whl的文件 原博客中还有测试程序,都很好用 希望能帮助到大家 原博客链接:http://www.cnblogs.com/eastmount/p/5052871.html

Python 数据处理扩展包: pandas 模块的DataFrame介绍(读写数据库的操作)

读取表中的内容,如下例子: import MySQLdb try: conn = MySQLdb.connect(host='127.0.0.1',user='root',passwd='root',db='mydb',port=3306) df = pd.read_sql('select * from test;', con=conn) conn.close() print "finish load db" except MySQLdb.Error,e: print e.args[1

【数据分析&数据挖掘】numpy、pandas&matplotlib

1 import numpy as np 2 import pandas as pd 3 4 """ 5 numpy --科学计算库 6 核心---ndarray 7 本质: 存储单一数据类型的 内存连续的 N维数组 8 C F 风格存储 9 10 matplotlib ---数据可视化的库 11 能绘制2-D 与 3-D 图形 12 13 pandas ----进行数据处理的库 14 里面封装了部分numpy 与matplotlib 功能 15 结构核心: 16 常用两种结

在windows下python,pip,numpy,scipy,matplotlib的安装

系统:win7(64bit) 一.先安装python 先到https://www.python.org/downloads/ 下载python, 现在主流有python2.7和python 3.5两个版本,随便下载两个版本都可以. 如果下载python 2.7版本: 如果下载python 3.5版本: 不管下载哪一个版本,下载成功后,都可以在windows下直接双击安装.安装的时候,一定要把" add python 3.5 to path" ,选中,不然,安装完成后,还得手动配置环境变