python中numpy和pandas介绍

numpy和pandas是python中用于处理数据的两个库。
numpy介绍:
numpy用于处理array,且array中数据类型必须一致。下面以代码备注的方式介绍。

#START
import numpy as np

v=np.array([1,2,3,4,5,6,7,8])   //array中以list的方式展现

m=np.array([[1,2,3,4,5,6,7,8],
                    [8,7,6,5,4,3,2,1]])

h=np.array([[1,2,3,4,5,6,7,8],
                    [8,7,6,5,4,3,2,1],
                          [9,8,7,6,5,4,3,2]],dtype=float)   //指定list中数据类型为float

print(v.type)    //查看array类型
print(v.shape)    //查看array模型
#print(np.shape(v))
print(v.size)
#print(np.size(v))
print(v.dtype)
#END
#START
import numpy as np
##如下是一个三行四列的array
#[1,2,3,4]
#[2,3,4,5]
#[3,4,5,6]
#shape(3,4)
a=np.array([[1,2,3,4],[2,3,4,5],[3,4,5,6]])
b=a[0:2,1:3]     //array切分操作,对比list中的cut。修改b的话a也会变更。

h=np.array([[1,2],[3,4],[5,6]])
i=np.array(h[0,1],h[1,1],h[2,0])   //使用index方法脱离关系,即b变化a不变。
i[[0,0]]=888
print(i)
print(h)

c=np.zeros((2,20))   //生成2行20列的0
print(c)

d=np.ones((20,5))    //生成20行5列的1
print(d)

e=np.full((5,7),888)  //生成5行7列的888
print(e)

f=np.eye(10)    //Identify matrix(I)
print(f)

g=np.random.random((8,19))   //生成随机array
print(g)
#END
#START
j=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
k=np.array([0,2,0,1])

l=j[np.arange(4),k]   //j中前4行按照k中的数值提取列中元素

j[np.arange(4),k] += 100   //j中前4行按照k中的数值提取列中元素后再加100,返回j
print(j)
#END
#START
m=np.array([[1,2,3],[4,5,6],[7,8,9]])
print(m)

boolean_array_indexing =(m>5)   //按照判断条件将array转换成布尔值
print(boolean_array_indexing)
print(m(m>5))
#END
#START
#array四则运算
x=np.array([[1,2],[3,4]],dtype=np.float64)
y=np.array([[5,6],[7,8]],dtype=np.float64)
print(x+y)
print(np.add(x,y))

print(x-y)
print(np.subtract(x,y))

print(x*y)
print(np.multiply(x,y))

print(x/y)
print(np.divide(x,y))

print(np.sqrt(x))

print(x.dot(y))
print(np.dot(x,y))

i=np.array([3,0])
j=np.array([0,4])

print(i.dot(j))
print(np.dot(i.j))

x=np.array([[1,2],[3,4]])
print(x)
print(np.sum(x))
print(np.sum(x,axis=1))
print(x,T)  //变形
#END
#START
x=np,array([[1,2],[3,4],[5,6]])
y=np.array([0,1])
print(x+y)    //broadcasting会自动补齐y中缺少元素
#END
#START
x=np,array([[1,2,3],[3,4,6],[5,6,7],[7,8,9]])
print(x[1,0:2])
y=np.array([1,0,1])
z=np.empty_like(x)   //生成一个和x格式一致的array
print(z)

for i in range(4):
    z[i,:]=x[i,:]+y
#END

pandas介绍:
用于处理.csv文件

import pandas as pd
pd.set_option(‘display.max_rows‘,1000)    //用于设置展示的行数和列数
pd.set_option(‘display.max_columns‘,1000)

user_input_cols=[‘‘,‘‘,‘‘,‘‘,‘‘,‘‘]   //用于自定义每一列的名称
data_frame=pd.read_csv(‘diabetes.csv‘,index_col=0,header=None,
                        name=user_input_cols)   //读取文件

print(df.head())   //展示文件的前几行
**********************
#dataframe   //数据域
#series    //列

df=pd.read_csv(‘diabetes.csv‘,index_col=0,header=None,
                        name=user_input_cols)
print(df[‘series_name‘])   //展示列名称

#series相加
print(df.series_name1+df.series_name2)
print(df.series_name1+‘,‘+df.series_name2)
new_series=df.series_name1+‘,‘+df.series_name2
df[‘series_name1+series_name2‘]=new_series

print(df.dtypes)
**********************
#查看数据特征
print(df.describe())

原文地址:https://blog.51cto.com/13438572/2359474

时间: 2024-10-02 19:00:30

python中numpy和pandas介绍的相关文章

Python下载numpy和pandas踩过的大坑

Python下载numpy和pandas踩过的大坑   最直接的安装方法是在python的scripts中执行 pip install pandas后,能出现Successfull是最好的,这也代表你已完成pandas的安装.下面的内容对你也没有用了.但是一般执行完后,dos窗口会出现各种报错.(Ps:我也是在网上找了各种各样的解决办法,看的人头大.下面是我的解决方法) 出现报错: E:\Python34\Scripts>pip install pandasCollecting pandas U

python中if __name__ == '__main__': 介绍

当我们下载一个.py文件时,经常会在代码的最下面看到if __name__ == '__main__':,现在就来简单的介绍一下它的作用 首先我们要知道,模块是对象,并且所有的模块都有一个内置属性 __name__. 如果 import 一个模块,那么模块__name__ 的值通常为模块文件名. 如果以一个标准的程序样直接运行模块,那么模块__name__ 的值将是一个特别缺省"__main__". 所以我们一般用if __name__ == '__main__'来判断是否是在直接运行

python安装numpy和pandas

最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须是2.7以上. linux首先安装依赖包 yum -y install blas blas-devel lapack-devel lapack yum -y install seaborn scipy yum -y install freetype freetype-devel libpng lib

【转载】python安装numpy和pandas

转载:原文地址 http://www.cnblogs.com/lxmhhy/p/6029465.html 最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须是2.7以上. linux首先安装依赖包 yum -y install blas blas-devel lapack-devel lapack yum -y install seaborn sc

Python中numpy 数组的切片操作

Python中numpy 数组的切片操作简介取元素 X[n0,n1]切片 X[s0:e0,s1:e1]切片特殊情况 X[:e0,s1:]示例代码输出结果简介X[n0,n1]是通过 numpy 库引用二维数组或矩阵中的某一段数据集的一种写法.类似的,X[n0,n1,n2]表示取三维数组,取N维数组则有N个参数,N-1个逗号分隔.以二维数组为例: import numpy as npX = np.array([[0,1,2,3],[10,11,12,13],[20,21,22,23],[30,31,

Python中的推导式介绍

推导式是Python中很强大的.很受欢迎的特性,具有语言简洁,速度快等优点.推导式包括: 列表推导式 字典推导式 集合推导式 嵌套列表推导式 NOTE: 字典和集合推导是最近才加入到Python的(Python 2.7 和Python 3.1以上版). 下面简要介绍下: [列表推导式] 列表推导能非常简洁的构造一个新列表:只用一条简洁的表达式即可对得到的元素进行转换变形 其基本格式如下: [expr for value in collection if condition] 过滤条件可有可无,取

Python中关于函数的介绍

一.什么是函数       当我们在日常工作中编写代码时,有没有发现这种情况,写了一套代码,却发现里面有很多段代码出现了有规律的重复,这样就不符合一个合格程序员的标准了,一个合格的程序员编写的代码最重要的应该是简洁,精炼.那么,有什么方法能减少代码中出现的这样有规律的重复的情况吗?当然有,那就是函数.例如我们平常使用最频繁的print(),input(),这些都是函数,属于python内置函数,这些函数是python中事先写好的函数,当我们需要打印一个内容时,我们就可以print().    

python中numpy学习

NumPy的主要对象是同种元素的多维数组.这是一个所有的元素都是一种类型.通过一个正整数元组索引的元素表格(通常是元素是数字).在NumPy中维度(dimensions)叫做轴(axes),轴的个数叫做秩(rank). 例如,在3D空间一个点的坐标 [1, 2, 3] 是一个秩为1的数组,因为它只有一个轴.那个轴长度为3.又例如,在以下例子中,数组的秩为2(它有两个维度).第一个维度长度为2,第二个维度长度为3. [[ 1., 0., 0.], [ 0., 1., 2.]] NumPy的数组类被

Python中面向对向介绍及类的属性和方法

1.面向对象介绍 类和对象:是面向对象中两个重要概念 类:是对象对事物的抽象,比如人类\球类 对象:是类的一个实例,比如足球\篮球 实例说明: 球类可以对球的特征和行为进行抽象,然后可以实例化一个真实的球体出来 为什么面向对象? 面向对象的主要思想是 封装 继承 多态 这种思想方面解决较为复杂的项目,而且维护起来较为容易 Python类定义 类定义: 类把需要的变量和函数组合成一起,这种包含称为"封装", class A(object): 类的结构: class 类名 成员变量-属性