Python切片中的误区与高级用法

众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串、列表、元组...)中的单个元素,那么,如果要获取一个索引区间的元素该怎么办呢?

切片(slice)就是一种截取索引片段的技术,借助切片技术,我们可以十分灵活地处理序列类型的对象。通常来说,切片的作用就是截取序列对象,然而,它还有一些使用误区与高级用法,都值得我们注意。所以,本文将主要跟大家一起来探讨这些内容,希望你能学有所获。

事先声明,切片并非列表的专属操作,但因为列表最具有代表性,所以,本文仅以列表为例作探讨。

1、切片的基础用法

列表是 Python 中极为基础且重要的一种数据结构,我曾写过一篇汇总文章(链接见文末)较全面地学习过它。文中详细地总结了切片的基础用法,现在回顾一下:

切片的书写形式:[i : i+n : m] ;其中,i 是切片的起始索引值,为列表首位时可省略;i+n 是切片的结束位置,为列表末位时可省略;m 可以不提供,默认值是1,不允许为0 ,当m为负数时,列表翻转。注意:这些值都可以大于列表长度,不会报越界。

切片的基本含义是:从序列的第i位索引起,向右取到后n位元素为止,按m间隔过滤 。

  li = [1, 4, 5, 6, 7, 9, 11, 14, 16]
  ?
  # 以下写法都可以表示整个列表,其中 X >= len(li)
  li[0:X] == li[0:] == li[:X] == li[:] == li[::] == li[-X:X] == li[-X:]
  ?
  li[1:5] == [4,5,6,7] # 从1起,取5-1位元素
  li[1:5:2] == [4,6] # 从1起,取5-1位元素,按2间隔过滤
  li[-1:] == [16] # 取倒数第一个元素
  li[-4:-2] == [9, 11] # 从倒数第四起,取-2-(-4)=2位元素
  li[:-2] == li[-len(li):-2] == [1,4,5,6,7,9,11] # 从头开始,取-2-(-len(li))=7位元素
  ?
  # 步长为负数时,列表先翻转,再截取
  li[::-1] == [16,14,11,9,7,6,5,4,1] # 翻转整个列表
  li[::-2] == [16,11,7,5,1] # 翻转整个列表,再按2间隔过滤
  li[:-5:-1] == [16,14,11,9] # 翻转整个列表,取-5-(-len(li))=4位元素
  li[:-5:-3] == [16,9] # 翻转整个列表,取-5-(-len(li))=4位元素,再按3间隔过滤
  ?
  # 切片的步长不可以为0
  li[::0]  # 报错(ValueError: slice step cannot be zero)

上述的某些例子对于初学者(甚至很多老手)来说,可能还不好理解。我个人总结出两条经验:(1)牢牢记住公式[i : i+n : m] ,当出现缺省值时,通过想象把公式补全;(2)索引为负且步长为正时,按倒数计算索引位置;索引为负且步长为负时,先翻转列表,再按倒数计算索引位置。

2、切片是伪独立对象

切片操作的返回结果是一个新的独立的序列。以列表为例,列表切片后得到的还是一个列表,占用新的内存地址。

当取出切片的结果时,它是一个独立对象,因此,可以将其用于赋值操作,也可以用于其它传递值的场景。但是,切片只是浅拷贝,它拷贝的是原列表中元素的引用,所以,当存在变长对象的元素时,新列表将受制于原列表。

‘‘‘
遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
‘‘‘
  li = [1, 2, 3, 4]
  ls = li[::]
  ?
  li == ls # True
  id(li) == id(ls) # False
  li.append(li[2:4]) # [1, 2, 3, 4, [3, 4]]
  ls.extend(ls[2:4]) # [1, 2, 3, 4, 3, 4]
  ?
  # 下例等价于判断li长度是否大于8
  if(li[8:]):
      print("not empty")
  else:
      print("empty")
  ?
  # 切片列表受制于原列表
  lo = [1,[1,1],2,3]
  lp = lo[:2] # [1, [1, 1]]
  lo[1].append(1) # [1, [1, 1, 1], 2, 3]
  lp # [1, [1, 1, 1]]

由于可见,将切片结果取出,它可以作为独立对象使用,但是也要注意,是否取出了变长对象的元素。

3、切片可作为占位符

切片既可以作为独立对象被“取出”原序列,也可以留在原序列,作为一种占位符使用。

对于列表来说,使用切片作为占位符,同样能够实现拼接列表的效果。特别需要注意的是,给切片赋值的必须是可迭代对象。

  li = [1, 2, 3, 4]
  ?
  # 在头部拼接
  li[:0] = [0] # [0, 1, 2, 3, 4]
  # 在末尾拼接
  li[len(li):] = [5,7] # [0, 1, 2, 3, 4, 5, 7]
  # 在中部拼接
  li[6:6] = [6] # [0, 1, 2, 3, 4, 5, 6, 7]
  ?
  # 给切片赋值的必须是可迭代对象
  li[-1:-1] = 6 # (报错,TypeError: can only assign an iterable)
  li[:0] = (9,) #  [9, 0, 1, 2, 3, 4, 5, 6, 7]
  li[:0] = range(3) #  [0, 1, 2, 9, 0, 1, 2, 3, 4, 5, 6, 7]

上述例子中,若将切片作为独立对象取出,那你会发现它们都是空列表,即 li[:0]== li[len(li):] == li [6 : 6]==[] ,我将这种占位符称为“纯占位符”,对纯占位符赋值,并不会破坏原有的元素,只会在特定的索引位置中拼接进新的元素。删除纯占位符时,也不会影响列表中的元素。

与“纯占位符”相对应,“非纯占位符”的切片是非空列表,对它进行操作(赋值与删除),将会影响原始列表。如果说纯占位符可以实现列表的拼接,那么,非纯占位符可以实现列表的替换。

‘‘‘
遇到问题没人解答?小编创建了一个Python学习交流QQ群:857662006
寻找有志同道合的小伙伴,互帮互助,群里还有不错的视频学习教程和PDF电子书!
‘‘‘
  li = [1, 2, 3, 4]
  ?
  # 不同位置的替换
  li[:3] = [7,8,9] # [7, 8, 9, 4]
  li[3:] = [5,6,7] # [7, 8, 9, 5, 6, 7]
  li[2:4] = [‘a‘,‘b‘] # [7, 8, ‘a‘, ‘b‘, 6, 7]
  ?
  # 非等长替换
  li[2:4] = [1,2,3,4] # [7, 8, 1, 2, 3, 4, 6, 7]
  li[2:6] = [‘a‘]  # [7, 8, ‘a‘, 6, 7]
  ?
  # 删除元素
  del li[2:3] # [7, 8, 6, 7]

切片占位符可以带步长,从而实现连续跨越性的替换或删除效果。需要注意的是,这种用法只支持等长替换。

  li = [1, 2, 3, 4, 5, 6]
  ?
  li[::2] = [‘a‘,‘b‘,‘c‘] # [‘a‘, 2, ‘b‘, 4, ‘c‘, 6]
  li[::2] = [0]*3 # [0, 2, 0, 4, 0, 6]
  li[::2] = [‘w‘] # 报错,attempt to assign sequence of size 1 to extended slice of size 3
  ?
  del li[::2] # [2, 4, 6]

4、更多思考

其它编程语言是否有类似于 Python 的切片操作呢?有什么差异?

原文地址:https://blog.51cto.com/14246112/2446619

时间: 2024-10-30 08:46:00

Python切片中的误区与高级用法的相关文章

Python 内置函数sorted()在高级用法

对于Python内置函数sorted(),先拿来跟list(列表)中的成员函数list.sort()进行下对比.在本质上,list的排序和内建函数sorted的排序是差不多的,连参数都基本上是一样的.主要的区别在于,list.sort()是对已经存在的列表进行操作,进而可以改变进行操作的列表.而内建函数sorted返回的是一个新的list,而不是在原来的基础上进行的操作. 再来,让我们用Python自带的帮助函数help()看看对于sorted()是怎么定义的: >>>help(sort

linux中man手册的高级用法

Linux提供了丰富的帮助手册,当你需要查看某个命令的参数时不必到处上网查找,只要man一下即可. Linux 的man手册共有以下几个章节: 1.Standard commands (标准命令) 2.System calls (系统调用) 3.Library functions (库函数) 4.Special devices (设备说明) 5.File formats (文件格式) 6.Games and toys (游戏和娱乐) 7.Miscellaneous (杂项) 8.Administ

python列表中enumerate和zip函数用法

enumerate: 定义:enumerate() 函数用于将一个可遍历的数据对象(如列表.元组或字符串)组合为一个索引序列,同时列出数据和数据下标 例子: 1 list1 =[89,98,00,75,68,37,58,90] 2 for index,item in enumerate(list1): 3 if str(item)!='0': 4 list1[index]=int('19'+str(item)) 5 else: 6 list1[index]=int('200'+str(item)

Python学习过程中知识误区总结

a**b==a*b+a 字符串 'abc' 3 * 'ab'== 'ababab'   'a'+str(123) == 'a123' len('abc') ==3 indexing  'abc'[0] == 'a'   'abc'[-1] == 'c' Slicing       'abc'[1:3] == 'bc'     [i:j:k]   最后一个参数 step 为负时,表示截取结果按照逆序排列 4.  in The operators in and not in test for col

Python爬虫的Urllib库有哪些高级用法?

本文和大家分享的主要是python爬虫的Urllib库的高级用法相关内容,一起来看看吧,希望对大家学习python有所帮助. 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它 是一段HTML代码,加 JS.CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服.所以最重要的部分是存在于HTML中的,下面我 们就写个例子来扒一个网页下来. imp

【357】sorted 函数高级用法

参考:Python 内置函数sorted()在高级用法 - Brad1994 - 博客园 sorted 函数主要实现的就是对于可迭代对象进行排序,对于一维数据排序很好理解与实现,直接调用即可,本文主要讲解对于二维数据的调用,以及字典的调用. 语法如下: sorted(iterable[, cmp[, key[, reverse]]]) iterable:可迭代对象,列表.数组.字典 key:对于二维数据指定需要排序的列 reverse:True 降序,False 升序(默认) 示例如下: >>

精密解析Python切片的用法

众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串.列表.元组-)中的单个元素,那么,如果要获取一个索引区间的元素该怎么办呢? 切片(slice)就是一种截取索引片段的技术,借助切片技术,我们可以十分灵活地处理序列类型的对象.通常来说,切片的作用就是截取序列对象,然而,对于非序列对象,我们是否有办法做到切片操作呢?在使用切片的过程中,有什么要点值得重视,又有什么底层原理值得关注呢?本文将主要跟大家一起来探讨这些内容,希望我能与你共同学习进步. 学习Python中有不明白推荐加入交流

Python 内置函数sorted()有哪些高级用法?

本文和大家分享的主要是python内置函数sorted()的相关内容,一起来看看吧,希望对大家学习python http://www.maiziedu.com/land/python/有所帮助. 1.对于 Python 内置函数 sorted() ,先拿来跟list(列表)中的成员函数 list.sort() 进行下对比.在本质上,list的排序和内建函数sorted的排序是差不多的,连参数都基本上是一样的. 2.主要的区别在于, list.sort() 是对已经存在的列表进行操作,进而可以改变

Python爬虫入门之Urllib库的高级用法

1.设置Headers 有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们需要设置一些Headers 的属性. 首先,打开我们的浏览器,调试浏览器F12,我用的是Chrome,打开网络监听,示意如下,比如知乎,点登录之后,我们会发现登陆之后界面都变化了,出现一个新的界面,实质上这个页面包含了许许多多的内容,这些内容也不是一次性就加载完成的,实质上是执行了好多次请求,一般是首先请求HTML文件,然后加载JS,CSS 等等,经过多次