Python str、list、numpy分片操作

在Python里,像字符串(str)、列表(list)、元组(tupple)和这类序列类型都支持切片操作

对对象切片,s是一个字符串,可以通过类似数组索引的方式获取字符串中的字符,同时也可以用s[a:b:c]的形式对s在a和b之间,以c为间隔取值,c的值还可以为负,负值则意味着反向取值

>>> s = ‘bicycle‘
>>> s[0]
‘b‘
>>> s[1]
‘i‘
>>> s[::3]
‘bye‘
>>> s[::-1]
‘elcycib‘
>>> s[::-2]
‘eccb‘

  

给切片赋值

首先,生成一个长度为16,从0到15的列表

>>> l = list(range(16))
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

  

用[20,30]将取代索引[2,5)的值

>>> l[2:5] = [20, 30]
>>> l
[0, 1, 20, 30, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]

  

索引[5,8)将被删除

>>> del l[5:8]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 13, 14, 15]

  

从数组第9个索引开始,以两个单位为间隔,将[11,22]赋值给左边的分片对象,如果赋值数组中元素的个数和分片对象中元素的个数不同,则会报错

>>> l[9::2]
[13, 15]
>>> l[9::2] = [11, 22]
>>> l
[0, 1, 20, 30, 5, 9, 10, 11, 12, 11, 14, 22]
>>> l[6::2]
[10, 12, 14]
>>> l[6::2] = [66, 77, 88]  # 同理,l[6::2]必须为[n1,n2,n3]的数组,如果不是则将其 赋值为[66, 77, 88]则会报错
>>> l
[0, 1, 20, 30, 5, 9, 66, 11, 77, 11, 88, 22]

  

列表l[2:5]的结果是[20, 30, 5],而我们的赋值是[30, 33],所以30会代替20,33会代替30,而5则会被去除。如果左边数组元素的个数少于赋值数组中元素的个数,则原数组分片之后的元素会排在新元素之后

>>> l[2:5]
[20, 30, 5]
>>> l[2:5] = [30, 33]
>>> l
[0, 1, 30, 33, 9, 66, 11, 77, 11, 88, 22]
>>> l[2:5]
[30, 33, 9]
>>> l[2:5] = [-10, -20, -30, -40, -50]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

  

拷贝一个分片对象,并修改其中的值,并不会修改原列表对象中的值

>>> l1 = l[2:5]
>>> l1
[-10, -20, -30]
>>> l1 = [10, 20, 30]
>>> l1
[10, 20, 30]
>>> l
[0, 1, -10, -20, -30, -40, -50, 66, 11, 77, 11, 88, 22]

  

如果将一个数字赋值给左边的分片对象,则会报错

>>> l[2:5] = 10
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: can only assign an iterable

  

  

numpy基本的索引和切片

>>> import numpy as np
>>> arr = np.arange(10)
>>> arr
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> arr[5]
5
>>> arr[5:8]
array([5, 6, 7])
>>> arr[5:8] = 12  # 这里不会像之前会报错
>>> arr
array([ 0,  1,  2,  3,  4, 12, 12, 12,  8,  9])

  

如上所示,当你将一个标量赋值给一个切片对象时(如arr[5:8] = 12),该值会自动传播到整个选区。跟之前列表的分片的区别在于,numpy数组分片是原始数组的视图,数据没有被复制,视图上任何的修改都会直接反映到源数据上,如果不希望修改到源数据,则用arr[5:8].copy():

>>> arr_slice = arr[5:8]
>>> arr_slice
array([12, 12, 12])
>>> arr_slice[1] = 99
>>> arr_slice
array([12, 99, 12])
>>> arr
array([ 0,  1,  2,  3,  4, 12, 99, 12,  8,  9])
>>> arr_slice[:] = 66
>>> arr
array([ 0,  1,  2,  3,  4, 66, 66, 66,  8,  9])
>>> arr_slice_copy = arr[5:8].copy()
>>> arr_slice_copy
array([66, 66, 66])
>>> arr_slice_copy[:] = 88
>>> arr_slice_copy
array([88, 88, 88])
>>> arr
array([ 0,  1,  2,  3,  4, 66, 66, 66,  8,  9])

  

在一个二维数组中,各索引位置上的元素不再是标量而是一维数组:

>>> arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
>>> arr2d[2]
array([7, 8, 9])
>>> arr2d[0][2]
3
>>> arr2d[0, 2]
3

  

按照行或者列来进行分片

>>> arr2d
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])
>>> arr2d[:2]  # 取前两行,即第0行和第1行
array([[1, 2, 3],
       [4, 5, 6]])
>>> arr2d[:2, 1:]  # 取前两行的第零列之后所有元素
array([[2, 3],
       [5, 6]])
>>> arr2d[:, 1:2]  # 取所有行的第一列元素(列索引从0开始)
array([[2],
       [5],
       [8]])
>>> arr2d[1, :2]  # 取第一行的前两列的元素元素
array([4, 5])
>>> arr2d[2, :1]  # 取第二行的第零列元素
array([7])
>>> arr2d[:, :1]  # 取所有行的第零列元素
array([[1],
       [4],
       [7]])
>>> arr2d[:, 1:] = 0  # 同样,分片表达式的赋值操作也会扩散到源数据
>>> arr2d
array([[1, 0, 0],
       [4, 0, 0],
       [7, 0, 0]])

  

布尔型索引

假设我们有一个用于存储数据的数组以及一个存储姓名的数组(含有重复项)。

>>> import numpy as np
>>> from numpy.random import randint
>>> names = np.array([‘Bob‘, ‘Joe‘, ‘Bob‘, ‘Will‘, ‘Will‘, ‘Joe‘, ‘Joe‘, ‘Bob‘])
>>> data = randint(6, size=(8, 4))
>>> data
array([[2, 1, 2, 2],
       [3, 3, 4, 2],
       [0, 5, 3, 5],
       [2, 1, 5, 2],
       [1, 3, 0, 3],
       [0, 0, 0, 1],
       [0, 0, 0, 5],
       [4, 2, 5, 1]])

  

假设每个名字都对应data数组中的一行,而我们想要选出对应于名字“Bob”的所有行。我们可以这样操作

>>> names == ‘Bob‘
array([ True, False,  True, False, False, False, False,  True], dtype=bool)
>>> data[names == ‘Bob‘]
array([[2, 1, 2, 2],
       [0, 5, 3, 5],
       [4, 2, 5, 1]])

  

布尔型数组的长度必须跟被索引的数组长度一致,此外,还可以将布尔型数组跟分片、整数(或整数序列)混合使用

>>> data[names == ‘Bob‘, 2:]
array([[2, 2],
       [3, 5],
       [5, 1]])
>>> data[names == ‘Bob‘, 3]
array([2, 5, 1])
>>> data[names == ‘Bob‘, 3:]
array([[2],
       [5],
       [1]])

  

如果需要选取多个名字组合需要组合多个布尔条件,使用&(和)、|(或)之类的布尔算术运算符即可:

>>> mask = (names == ‘Bob‘) | (names == ‘Will‘)
>>> mask
array([ True, False,  True,  True,  True, False, False,  True], dtype=bool)
>>> data[mask]
array([[2, 1, 2, 2],
       [0, 5, 3, 5],
       [2, 1, 5, 2],
       [1, 3, 0, 3],
       [4, 2, 5, 1]])

  

注意:Python关键字and和or在布尔型数据中无效

通过布尔型数组设置值是一种经常用到的手段,为了将data中所有的偶数设置为3,我们只需:

>>> data
array([[2, 1, 2, 2],
       [3, 3, 4, 2],
       [0, 5, 3, 5],
       [2, 1, 5, 2],
       [1, 3, 0, 3],
       [0, 0, 0, 1],
       [0, 0, 0, 5],
       [4, 2, 5, 1]])
>>> data[data % 2 == 0] = 3
>>> data
array([[3, 1, 3, 3],
       [3, 3, 3, 3],
       [3, 5, 3, 5],
       [3, 1, 5, 3],
       [1, 3, 3, 3],
       [3, 3, 3, 1],
       [3, 3, 3, 5],
       [3, 3, 5, 1]])

  

花式索引

花式索引是numpy术语,它指的是利用整数数组进行索引。假设我们有一个8×4数组:

>>> arr = np.empty((8, 4))
>>> for i in range(8):
...     arr[i] = i
...
>>> arr
array([[ 0.,  0.,  0.,  0.],
       [ 1.,  1.,  1.,  1.],
       [ 2.,  2.,  2.,  2.],
       [ 3.,  3.,  3.,  3.],
       [ 4.,  4.,  4.,  4.],
       [ 5.,  5.,  5.,  5.],
       [ 6.,  6.,  6.,  6.],
       [ 7.,  7.,  7.,  7.]])
>>> arr[[3, 5, 0, 6]]
array([[ 3.,  3.,  3.,  3.],
       [ 5.,  5.,  5.,  5.],
       [ 0.,  0.,  0.,  0.],
       [ 6.,  6.,  6.,  6.]])
>>> arr[[3, -3, -1]]
array([[ 3.,  3.,  3.,  3.],
       [ 5.,  5.,  5.,  5.],
       [ 7.,  7.,  7.,  7.]])

  

arr[[3, 5, 0, 6]]会索引源数组的第三行、第五行、第零行、第六行,然后组成新的视图返回,而arr[[3, -3, -1]]则会索引第三行、倒数第三行和倒数第一行

我们生成了一个8×4数组,然后传入两个索引数组[1, 5, 7, 2]、 [0, 3, 1, 2],然后我们得到一个一维的数组

>>> arr = np.arange(32).reshape((8, 4))
>>> arr
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])
>>> arr[[1, 5, 7, 2], [0, 3, 1, 2]]
array([ 4, 23, 29, 10])

  

下面我们分析一下上面的代码究竟发生了什么,第一个索引数组[1, 5, 7, 2],我们获取第一行、第五行、第七行和第二行,然后我们将根据第二个索引数组 [0, 3, 1, 2],获取第一行的第零列、第五行的三列……以此类推,最后,我们获得了一个一维的数组

当然,在有些情况下,我们希望按照不同的顺序获取源数组不同的行,并且还要在获取后,改动原来的列顺序,于是我们可以这样做:

>>> arr[[1, 5, 7, 2]]
array([[ 4,  5,  6,  7],
       [20, 21, 22, 23],
       [28, 29, 30, 31],
       [ 8,  9, 10, 11]])
>>> arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]
array([[ 6,  5,  7,  4],
       [22, 21, 23, 20],
       [30, 29, 31, 28],
       [10,  9, 11,  8]])
>>> arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
array([[ 6,  5,  7,  4],
       [22, 21, 23, 20],
       [30, 29, 31, 28],
       [10,  9, 11,  8]])

  

如上,我们既可以用arr[[1, 5, 7, 2]][:, [2, 1, 3, 0]]这样的方式获取获取不同的行,再改变其中的列顺序,同时也可以用np.ix_函数达到一样的目的,不过需要注意的一点是,花式索引跟分片不一样,它总是将数据复制到新的数组中:

>>> arr1 = arr[np.ix_([1, 5, 7, 2], [2, 1, 3, 0])]
>>> arr1
array([[ 6,  5,  7,  4],
       [22, 21, 23, 20],
       [30, 29, 31, 28],
       [10,  9, 11,  8]])
>>> arr1[1] = 66
>>> arr1
array([[ 6,  5,  7,  4],
       [66, 66, 66, 66],
       [30, 29, 31, 28],
       [10,  9, 11,  8]])
>>> arr
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

  

 

  

  

  

原文地址:https://www.cnblogs.com/beiluowuzheng/p/8448517.html

时间: 2024-11-02 04:26:19

Python str、list、numpy分片操作的相关文章

有关Python的分片操作

刚在论坛python版 http://bbs.byr.cn/#!article/Python/1693 解决了一个关于python分片的问题. 问题: uesrList = ['1','2','3','4','5','6'] subList1 = uesrList[2:5] subList2 = uesrList[-3:-1] subList3 = uesrList[0:-2] subList4 = uesrList[0:-3] subList5 = uesrList[-3:0] print(s

科学计算库Numpy基础操作

pycharm,python3.7,numpy版本1.15.1 2018年9月11日04:23:06 """ 科学计算库Numpy基础操作 时间:2018\9\11 0011 """ import numpy print("""\n------以矩阵的方式读取数据------\n ------------genfromtxt函数('文件路径',delimiter = '分隔符',dtype = 读取方式)------

Python中列表list常见操作

主要涉及知识点 列表是我们python里面最常见的数据类型,我们主要有以下的操作. 1.索引 2.切片 3.追加 4.删除 5.长度 6.循环 (也称遍历) 7.包含 8.嵌套 例如定义列表: List2=['openstack','python','linux',"docker","zabbix","nginx","linux","linux","123","ww33##&q

Python/C++ 对字符串的操作

字符串操作在任何语言中都很常用. 本文列举了一些常见的Python/c++ 对字符串的操作. c++ 的使用了boost libraray,  所涉及到的函数都在  <boost/algorithm/string.hpp> 中定义.   python  c++ 大小写转换 'str'.upper(),  'str'.lower() boost::to_upper('str'), boost::to_upper_copy('str') 字符串包含某个substr str.find(substr)

Python/Django(CBA/FBA/ORM操作)

Python/Django(CBA/FBA/ORM操作) CBA:url对应的类(模式) 1 ##====================================CBA操作============================ 2 3 # class geting(View): 4 # def dispatch(self, request, *args, **kwargs): 5 # print('before') 6 # obj = super(geting,self).dispat

python str的一些方法

在python有各种各样的string操作函数.在历史上string类在python中经历了一段轮回的历史.在最开始的时候,python有一个专门的string的module,要使用string的方法要先import,但后来由于众多的python使用者的建议,从python2.0开始,string方法改为用S.method()的形式调用,只要S是一个字符串对象就可以这样使用,而不用import.同时为了保持向后兼容,现在的python中仍然保留了一个string的module,其中定义的方法与S

Python中的Numpy、SciPy、MatPlotLib安装与配置

Python安装完Numpy,SciPy和MatplotLib后,可以成为非常犀利的科研利器.网上关于这三个库的安装都写得非常不错,但是大部分人遇到的问题并不是如何安装,而是安装好后因为配置不当,在使用时总会出现import xxx error之类的错误.我也是自己摸索了很久才发现如何去正确配置的.下面就详细说下安装和配置的过程. 1.安装Python,这里选择2.7还是3.4都行,不过推荐使用2.7,毕竟现在的教程大部分还是基于2.7的,3.4跟2.7的语法还是略有不同,为了避免语法错误的麻烦

Python 文件夹及文件操作

我们经常会与文件和目录打交道,对于这些操作,python可以使用 os 及 shutill 模块,其中包含了很多操作文件和目录的函数. os 可以执行简单的文件夹及文件操作,引入用  import os,可用  help(os)  或是  dir(os)  查看其用法.注意有些函数在os模块中,有的是在os.path模块中. shutil 模块提供了大量的文件的高级操作,特别针对文件拷贝和删除.主要功能为目录和文件操作以及压缩操作.须引入 import shutil  ,具体 help.本文仅介

python对mysql的一些操作(drop,create,insert)

python对mysql的一些操作(drop,create,insert) by 伍雪颖 import MySQLdb,random def getRandomNum(): key_list = [] for iin range(200): key_list.append(str(random.uniform(10,20))) return key_list def write_to_mysql(key_list): db = MySQLdb.connect("localhost",&