易被忽略的Python内置类型

Python中的内置类型是我们开发中最常见的,很多人都能熟练的使用它们。

然而有一些内置类型确实不那么常见的,或者说往往会被我们忽略,所以这次的主题就是带领大家重新认识这些“不同寻常”的内置类型。

(注意:本文基于python3,不会包含任何python2相关内容)

frozenset

不可变集合(frozenset)与普通的set一样,只不过它的元素是不可变的,因此诸如addremoveupdate等可以添加/删除/改变集合内元素的方法是不存在的,换句话说一旦frozenset建立后你将不再可能更改集合内的元素。其他的方法与set一致:

>>> frozen = frozenset([1, 1, 2, 3, 4, 5, 6, 6])
frozenset({1, 2, 3, 4, 5, 6})
>>> frozen | {1, 2, 3, 7, 8}
frozenset({1, 2, 3, 4, 5, 6, 7, 8})
>>> frozen ^ {1, 2, 3, 7, 8}
frozenset({4, 5, 6, 7, 8})

range

range事实上相当得常见,所以你也许会奇怪我为什么把它列出来。

其实原因很简单,因为大部分人熟悉range的使用,但并不清楚range到底是什么。返回迭代器?返回一个可迭代对象?range本身又是什么呢?

答案揭晓:

>>> range
<class ‘range‘>

是的,range是个class!所以当我们使用for i in range(1, 10)这样的代码时,实际上我们遍历了一个range对象,而range也实现了可迭代对象需要的__iter__魔法方法,所以它自身是可迭代对象:

>>> range.__iter__
<slot wrapper ‘__iter__‘ of ‘range‘ objects>

因此,range既不返回迭代器,也不返回其他可迭代对象,而是返回的自己。

bytearray

bytearray一般情况下并不常见,它主要为了可以实现原地修改bytes对象而出现,因为bytes和str一样是不可变对象,例如这样是非法的:

>>> b = ‘测试用例a‘.encode(‘utf8‘)
>>> b[-1] = 98 # change ‘a‘ -> ‘b‘
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: ‘bytes‘ object does not support item assignment

而当我们把bytes的内容复制给bytearray时就可以进行原地修改了:

>>> array = bytearray(b)
>>> array[-1] = 98
>>> array.decode(‘utf8‘)
测试用例b

bytearray对象没有字面常量,因此只能通过构造函数创建,它有着和bytes一样的方法,只是可变以及多了一些序列对象的特性。如果要创建一个bytearray可以有如下的几种方法:

  • bytearray()返回一个空的bytearray对象
  • bytearray(10)创建一个长度为10且内容被0填充的bytearray
  • bytearray(iterable)会将可迭代对象的内容转换成bytes然后存入对象中
  • bytearray(b‘Hi!‘)将已有的二进制数据复制进对象

另外bytearray还提供了fromhexhex方便将数据以16进制的形式输入输出:

>>> array.hex()
‘e6b58be8af95e794a8e4be8b62‘
>>> bytearray().fromhex(‘e6b58be8af95e794a8e4be8b62‘).decode(‘utf8‘)
‘测试用例b‘

memoryview

memoryview提供了直接访问对象内存的机制,只要目标对象支持buffer protocol,例如bytesbytearray

memoryview有个称为“元素”的概念,也就是对象规定的最小的内存单元,比如bytesbytearray的最小内存单元就是一个byte,具体取决于对象的实现。

len(view)通常等于len(view.tolist()),也就是等于view的“元素”数量。如果view.ndim == 0,那么整个view的内存会被视作一个整体,len会返回1,如果view.ndim == 1那么就正常返回“元素”的个数。view.itemsize会返回单个“元素”的大小。单位是byte。

view.readonly表示当前的memoryview是否是只读的,例如bytes对象的view就是只读的,view.readonly的值为True。是否只读取决于被引用的对象是否可变以及对buffer protocol的实现。

对于使用完毕的memoryview应该尽快调用其release()方法释放资源,而且部分对象在被view引用时会自动进行一些限制,比如bytearray会禁止调整大小,及时释放view是资源可以解除这些限制。

结合示例可以更清晰地了解这些特性:

>>> data = bytearray(b‘abcefg‘)
>>> v = memoryview(data)
>>> v.readonly
False
>>> v[0] = ord(b‘z‘)
>>> data
bytearray(b‘zbcefg‘)
>>> v[1:4] = b‘123‘
>>> data
bytearray(b‘z123fg‘)
>>> v[2:3] = b‘spam‘
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: memoryview assignment: lvalue and rvalue have different structures
>>> v[2:6] = b‘spam‘
>>> data
bytearray(b‘z1spam‘)

dict-views

准确的说,这不是一种类型,而是一种概念。然而typing里仍然将其视为一种类型,所以也就罗列在此了。

概念:返回自dict.keys(),dict.values()和dict.items()的对象被称作dict-views

对于views对象,可以使用len,成员检测,它本身也是可迭代对象:

>>> dishes = {‘eggs‘: 2, ‘sausage‘: 1, ‘bacon‘: 1, ‘spam‘: 500}
>>> keys = dishes.keys()
>>> values = dishes.values()

>>> # iteration
>>> n = 0
>>> for val in values:
...     n += val
>>> print(n)
504

>>> # keys and values are iterated over in the same order (insertion order)
>>> list(keys)
[‘eggs‘, ‘sausage‘, ‘bacon‘, ‘spam‘]
>>> list(values)
[2, 1, 1, 500]

>>> # view objects are dynamic and reflect dict changes
>>> del dishes[‘eggs‘]
>>> del dishes[‘sausage‘]
>>> list(keys)
[‘bacon‘, ‘spam‘]

>>> # set operations
>>> keys & {‘eggs‘, ‘bacon‘, ‘salad‘}
{‘bacon‘}
>>> keys ^ {‘sausage‘, ‘juice‘}
{‘juice‘, ‘sausage‘, ‘bacon‘, ‘spam‘}

从例子中可以看出,views保持着元素的插入顺序(插入顺序的保证从python3.6开始)以及views动态反应了key/value的插入和删除以及修改,因此在某些场景下views对象是相当有用的。

The Ellipsis Object (...)

...不是一个类型,不过算是一个内置对象。

它没什么特殊的含义,仅表示省略,通常被用在type hints中:

>>> ...
Ellipsis
>>> from typing import Callable
>>> func: Callable[..., None] = lambda x,y:print(x*y)

func是一个没有返回值的函数,参数列表没有做任何限制。

你也可以写成Ellipsis,两者是等价的,不过显然是...这种形式更简单明了。

以上就是这些容易被忽略和遗忘的内置类型,如有错误和疏漏欢迎指出。

参考:

https://docs.python.org/3/library/stdtypes.html

https://docs.python.org/3/c-api/buffer.html#bufferobjects

原文地址:https://www.cnblogs.com/apocelipes/p/10252081.html

时间: 2024-10-05 15:35:06

易被忽略的Python内置类型的相关文章

python内置类型详细解释

文章编写借鉴于内置类型 - Python 3.7.3 文档,主要用于自己学习和记录 python主要内置类型包括数字.序列.映射.类.实例和异常 有些多项集类是可变的.它们用于添加.移除或重排其成员的方法,将原地执行,并不返回特定的项,绝对不会返回多项集实例自身而是返回 None. 实际上所有对象都可以被比较.检测逻辑值,以及转换为字符串(使用 repr() 函数或略有差异的 str() 函数). 后一个函数是在对象由 print() 函数输出时被隐式地调用的. 逻辑值检测 任何对象都可以进行逻

Python——内置类型

Python定义了丰富的数据类型,包括: 数值型:int, float, complex 序列:(iterable) str, unicode, tuple, list, bytearray, buffer, xrange 集合:set, fronzeset 映射:dict 文件:file 布尔值:True.False 和 bool() 函数,其中 bool() 函数将一个值转变成布尔对象 True 或 False . 可调用对象:凡是可以使用 x() 调用 x 的对象 x ,称为可调用的,x

python内置类型---第二天笔记

强类型语言 ***********两个对象的比较******************* 1,值比较,对象中的数据是否相同 == 2,身份比较,两个变量名引用的是否为同一对象 3,类型比较, 例子: *************核心数据类型***************** 数字:int lang float complex bool 字符:str unicode 列表:list 字典:dict 元组:tuple 文件:file 其他类型:集合(set) frozenset 类类型 none 其他文

python内置类型:列表,包括 list 和 tuple

列表list 是一种有序的集合 ,假定list的名字为class list的元素个数:len( class) 访问元素: a. 索引从0开始    b. 也可以使用[-1],[-2],[-3] 从后面访问元素 添加元素 a. append方法  , 该方法是默认添加元素到末尾     class.append('adam') b. insert方法, 该方法能把元素添加到指定的索引位置   class.insert (1,'lily') 删除元素 pop方法 pop( ):括号内为空时,默认删除

Python内置类型性能分析

timeit模块 timeit模块可以用来测试一小段Python代码的执行速度. Timer是测量小段代码执行速度的类. class timeit.Timer(stmt='pass', setup='pass', timer=<timer function>) stmt参数是要测试的代码语句(statment): setup参数是运行代码时需要的设置: timer参数是一个定时器函数,与平台有关. Timer对象.timeit(number=1000000) Timer类中测试语句执行速度的对

Python内置类型——set

Python中, 集合是容器,可以使用len()计算集合中元素的个数, 集合中不存在重复的元素: 集合是可迭代的,但迭代时以任意的顺序进行. non-mutating方法 s.copy() 返回集合s的浅拷贝. s.difference(s1) 返回集合s中不在集合s1中的元素的集合,即s-s1. s.intersection(s1) 返回s与s1的交集.即s&s1. s.issubset(s1) 判断s是不是s1的子集. s.issuperset(s1) 判断s是不是s1的超集. s.symm

【二】python内置类型

1.布尔类型 表示真假的类型(true和false) 数字 0.None,以及元素为空的容器类对象都可视作False,反之为 True. In [1]: bool(0) Out[1]: False In [2]: bool(1) Out[2]: True In [3]: bool(-9) Out[3]: True In [4]: bool(5) Out[4]: True In [5]: bool(None) Out[5]: False In [6]: bool("") Out[6]:

Python内置类型——dict

Python中, 字典是容器,所以可以使用len()方法统计字典中的键值对的个数: 字典是可迭代的,迭代的依据是字典中的键. in, not in 等运算符判断指定的键是否在字典中: 如果索引一个字典中不存在的键,将会抛出异常KeyError: del d[k]将会删除k对应的键值对,如果d中不存在k,则抛出异常KeyError: 字典的返回迭代器的方法比返回列表的方法要节省内存,因为迭代器更省内存. non-mutating方法 d.copy() 返回一份d的浅拷贝. d.items() 返回

Python内建方法

参考: https://docs.python.org/3.4/library/functions.html https://docs.python.org/2/library/functions.html http://blog.csdn.net/jgood/article/details/4371991 以上链接分别为Python官网的3.4版本的内建方法说明.2.X(指2.6和2.7)版本的内建方法说明.以及JGood对2.X版本的内建方法说明的翻译. abs(x) 返回一个数的绝对值.参