一、Numpy的引入
1、标准的Python 中用列表(list)保存一组值,可以当作数组使用。但由于列表的元素可以是任何对象,因此列表中保存的是对象的指针。对于数值运算来说,这种结构显然比较浪费内存和CPU 计算
2、虽然Python 提供了array 模块,它和列表不同,能直接保存数值,但是由于它不支持多维数组,也没有各种运算函数,因此也不适合做数值运算。
NumPy 的诞生弥补了这些不足。
NumPy 提供了两种基本的对象:ndarray(n-dimensional array object)和ufunc(universal function object)。
ndarray(下文统一称之为数组)是存储单一数据类型的多维数组,而ufunc 则是能够对数组进行处理的函数。
二、Numpy简介
Numpy 是一个专门用于矩阵化运算、科学计算的开源Python库,Numpy将Python相当于变成一种免费的更强大的Matlab系统
优势:
1、强大的 ndarray 多维数组结构
2、成熟的函数库
3、用于整合C/C++和Fortran代码的工具包
4、实用的线性代数、傅里叶变换和随机数模块
5、Numpy 和稀疏矩阵运算包scipy 配合使用非常方便
三、语法简介
首先,简单的创建数组及相关操作:
1 import numpy as np 2 #生成简单的一维矩阵 3 a=np.array([1,2,3,4]) 4 #生成简单的二维矩阵 5 c=np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]]) 6 #获取类型 7 print(type(a)) 8 #数组的大小可以通过其属性获得 9 print (a.shape,b.shape) 10 #打印数组 11 print (c) 12 #可以通过修改数组的shape属性,在爆出数组元素个数不变的情况下,改变数组每个轴的长度 13 c.shape=4,3 14 ##注意,并不是对数组进行转置,而是只改变每个轴的大小 15 print(c) 16 #当某个轴的元素为-1时,将根据数组元素的阁主自动计算此轴的长度 17 c.shape=2,-1 18 print(c) 19 #使用reshape方法可以创建一个改变了尺寸的新数组,原数组保持不变 20 d=a.reshape((2,2)) 21 print(d) 22 print(a) 23 d=c.reshape((3,3))#不能讲一个12个元素的数组分成3*3,会报错 24 print(c) 25 #数组a和d实际上时共享数据存储内存区域,修改其一另一个也会改变
输出
<class ‘numpy.ndarray‘>#打印类型#shape (4,) (3, 4)#打印数组[[ 1 2 3 4] [ 4 5 6 7] [ 7 8 9 10]]#修改轴长 [[ 1 2 3] [ 4 4 5] [ 6 7 7] [ 8 9 10]]#修改轴长,其一参数为-1 [[ 1 2 3 4 4 5] [ 6 7 7 8 9 10]]#reshape [[1 2] [3 4]] [1 2 3 4]#错误 --------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-13-430fc5495966> in <module>() 21 print(d) 22 print(a) ---> 23 d=c.reshape((3,3)) 24 print(c) ValueError: cannot reshape array of size 12 into shape (3,3)
上面的例子都是先创建一个Python序列,然后通过array函数将其转换为数组,这样做显然效率不高。因此NumPy提供了很多专门用来创建数组的函数。
初始化数组:
1 import numpy as np 2 a=np.arange(0,1,0.1) 3 print("a=",a) 4 b=np.linspace(0,1,10) 5 print("b=",b) 6 c=np.linspace(0,1,10,endpoint=False) 7 print("c=",c) 8 d=np.logspace(0,2,20) 9 print("d=",d) 10 e=np.empty((2,3),np.int) 11 print("e=",e) 12 f=np.zeros(4,np.float) 13 print("f=",f)
运行结果:
a= [0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9] b= [0. 0.11111111 0.22222222 0.33333333 0.44444444 0.55555556 0.66666667 0.77777778 0.88888889 1. ] c= [0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9] d= [ 1. 1.27427499 1.62377674 2.06913808 2.6366509 3.35981829 4.2813324 5.45559478 6.95192796 8.8586679 11.28837892 14.38449888 18.32980711 23.35721469 29.76351442 37.92690191 48.32930239 61.58482111 78.47599704 100. ] e= [[ 0 0 1863334416] [ 588 0 -2147483648]] f= [0. 0. 0. 0.]
arange函数类似于python的range函数,通过指定开始值、终值和步长来创建一维数组,注意数组不包括终值。
linspace函数通过指定开始值、终值和元素个数来创建一维数组,可以通过endpoint关键字指定是否包括终值,缺省设置是包括终值:
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
Endpoint 如果是真,则一定包括stop,如果为False,一定不会有stop
#numpy.logspace(start, stop, num, endpoint=true, base=10, dtype)
#数据头一定是base^start,若endpoint=True,数据尾为base^end,其余数据为base^(start,end)
logspace函数和linspace类似,不过它创建等比数列,下面的例子产生1(10^0)到100(10^2)、有20个元素的等比数列。
zeros()、ones()、empty()可以创建指定形状和类型的数组。
此外,zeros_like()、ones_like()、empty_like()等函数可创建与参数数组的形状及类型相同的数组。因此,“zeros_like(a)”和“zeros(a.shape, a.dtype)”的效果相同。
存取元素:
1 >>> a = np.arange(10) 2 >>> a[5] # 用整数作为下标可以获取数组中的某个元素 3 5 4 >>> a[3:5] # 用范围作为下标获取数组的一个切片,包括a[3]不包括a[5] 5 array([3, 4]) 6 >>> a[:5] # 省略开始下标,表示从a[0]开始 7 array([0, 1, 2, 3, 4]) 8 >>> a[:-1] # 下标可以使用负数,表示从数组后往前数 9 array([0, 1, 2, 3, 4, 5, 6, 7, 8]) 10 >>> a[2:4] = 100,101 # 下标还可以用来修改元素的值 11 >>> a 12 array([ 0, 1, 100, 101, 4, 5, 6, 7, 8, 9]) 13 14 >>> a[1:-1:2] # 范围中的第三个参数表示步长,2表示隔一个元素取一个元素 15 array([ 1, 101, 5, 7]) 16 >>> a[::-1] # 省略范围的开始下标和结束下标,步长为-1,整个数组头尾颠倒 17 array([ 9, 8, 7, 6, 5, 4, 101, 100, 1, 0]) 18 >>> a[5:1:-2] # 步长为负数时,开始下标必须大于结束下标 19 array([ 5, 101]) 20 21 >>> b = a[3:7] # 通过下标范围产生一个新的数组b,b和a共享同一块数据空间 22 >>> b 23 array([101, 4, 5, 6]) 24 >>> b[2] = -10 # 将b的第2个元素修改为-10 25 >>> b 26 array([101, 4, -10, 6]) 27 >>> a # a的第5个元素也被修改为10 28 array([ 0, 1, 100, 101, 4, -10, 6, 7, 8, 9])
除了使用下标范围存取元素之外,NumPy还提供了两种存取元素的高级方法。
1、使用整数序列
当使用整数序列对数组元素进行存取时,将使用整数序列中的每个元素作为下标,整数序列可以是列表或者数组。使用整数序列作为下标获得的数组不和原始数组共享数据空间。
1 >>> x = np.arange(10,1,-1) 2 >>> x 3 array([10, 9, 8, 7, 6, 5, 4, 3, 2]) 4 >>> x[[3, 3, 1, 8]] # 获取x中的下标为3, 3, 1, 8的4个元素,组成一个新的数组 5 array([7, 7, 9, 2]) 6 >>> b = x[np.array([3,3,-3,8])] #下标可以是负数 7 >>> b[2] = 100 8 >>> b 9 array([7, 7, 100, 2]) 10 >>> x # 由于b和x不共享数据空间,因此x中的值并没有改变 11 array([10, 9, 8, 7, 6, 5, 4, 3, 2]) 12 >>> x[[3,5,1]] = -1, -2, -3 # 整数序列下标也可以用来修改元素的值 13 >>> x 14 array([10, -3, 8, -1, 6, -2, 4, 3, 2])
注:”:”用以表示当前维度的所有子模块 ; “-1”用以表示当前维度所有子模块最后一个;”负号用以表示从后往前数的元素”
2、使用布尔数组
当使用布尔数组b作为下标存取数组x中的元素时,将收集数组x中所有在数组b中对应下标为True的元素。
使用布尔数组作为下标获得的数组不和原始数组共享数据空间,注意这种方式只对应于布尔数组,不能使用布尔列表。
1 >>> x = np.arange(5,0,-1) 2 >>> x 3 array([5, 4, 3, 2, 1]) 4 5 >>> x=np.random.rand(10) 6 >>> x 7 array([ 0.5993579 , 0.68693925, 0.74380945, 0.40993085, 0.72345401, 0.64499497, 0.48715468, 0.80924589, 0.43362779, 0.06554248]) 8 >>> x>0.5 #对每个元素都比较 9 array([ True, True, True, False, True, True, False, True, False, False], dtype=bool) 10 >>> x[x>0.5] #将它当做索引传回原数组,只获取那些>0.5的 11 array([ 0.5993579 , 0.68693925, 0.74380945, 0.72345401, 0.64499497, 0.80924589]) 12 >>> np.all(x<1) #测试x<1所返回的数组(传给all)中所有元素是否都等价True 13 >>> a=np.array([1,2,3]) 14 >>> b=np.array([3,2,1]) 15 >>> a>b #对应位置作比较 16 array([False, False, True], dtype=bool) 17 >>> a[a==b] #获取一样的 18 array([2]) 19 >>>(a==b).all() 20 >>>(a==b).any() 21 >>> np.any([1,2,3,4]) #如果传入的数组中有至少一个元素等价True都返回True 22 True
原文地址:https://www.cnblogs.com/LOW-ctfer/p/9976231.html