【Python学习笔记】集合

  • 概述
  • 集合的一般操作
  • 内建函数进行标准操作集合
  • 数学运算符进行标准操作集合
  • 集合的应用

  概述



  python的集合(set)是无序不重复元素集,是一种容器。集合(set)中的元素必须是不可变对象,即可用被哈希,这和字典的键是一样的,所以列表、字典等可变对象不可作为set的元素。集合不提供索引或切片操作,即对象不存在相关的键值。python中的集合分为两种:set是可变的集合,frozenset是不可变的集合。

  集合的创建使用关键字set或frozenset, 参数可以是列表、字符串或元组等不可变对象。

  • 可变集合set
>>> s1=set("abcdef")
>>> s2=set([‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
>>> s3=set((‘a‘,‘b‘,‘c‘,‘d‘,‘e‘))
>>> s1,s2,s3
(set([‘a‘, ‘c‘, ‘b‘, ‘e‘, ‘d‘, ‘f‘]), set([‘a‘, ‘c‘, ‘b‘, ‘e‘, ‘d‘]), set([‘a‘, ‘c‘, ‘b‘, ‘e‘, ‘d‘]))
  • 不可变集合frozenset
>>> fs1=frozenset([1,2,3])
>>> fs2=frozenset((1,2,3))
>>> fs3=frozenset("123")
>>> fs1,fs2,fs3
(frozenset([1, 2, 3]), frozenset([1, 2, 3]), frozenset([‘1‘, ‘3‘, ‘2‘]))

集合的一般操作



1. 获取集合元素

s=set([1,2,3,4,5])L = len(s)    #L=5

2. 获取集合的副本s.copy()

  s.copy()获取到的副本和使用s1=s方式获得的集合是不一样的。s1=s得到的s1和s指向的是同一个集合,Python并没有为s1新开辟一块内存并把s拷贝过去,s1和s指向的是同一块内存。而s.copy()方式会在内存中新建一个set并把s的值拷贝过去。

>>> s=set([1,2,3])
>>> s1=s
>>> s2=s.copy()
>>> id(s),id(s1),id(s2)
(40826920L, 40826920L, 40825800L)

  从上面的例子中我们可以看到,s和s1的id是相同的,表明它们指向同一块内存,而s2的id则和它们不同.

3.增加元素s.add(item)

>>> s = set([1,2,3])
>>> s.add(4)
>>> s
set([1, 2, 3, 4])

4.随机删除元素s.pop()

  s.pop()返回任意的集合元素,并将其从s中删除

set([1, 2, 3, 4])
>>> s = set([1,2,3])
>>> s.pop()
1
>>> s
set([2, 3])

5.删除指定元素 s.remove(item)和s.discard(item)

  s.remove(item)从s中删除item,如果item不是s的成员,则引发KeyError异常。

>>> s = set([1,2,3])
>>> s.remove(2)
>>> s
set([1, 3])

>>> s.remove(4)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 4

  s.discard(item)删除item,如果s中不存在item,则没有效果,不会引发异常.

>>> s = set([1,2,3])
>>> s.discard(2)
>>> s
set([1, 3])
>>> s.discard(4)
>>> s
set([1, 3])

6.删除所有元素s.clear() 

>>> s = set([1,2,3])
>>> s.clear()

7.更新集合s.update(t)

  s.update(t)将t中的所有项添加到s中,t可以是另外一个集合、序列或支持迭代的任意对象,t也可以是字典,如果是字典的话则只是将字典的键加入到集合s中。  

>>> s = set([1,2,3])
>>> t = set([4,5,6])

#t是集合
>>> s.update(t)
>>> s
set([1, 2, 3, 4, 5, 6])
#t是元组
>>> s.update((7,8,9))
>>> s
set([1, 2, 3, 4, 5, 6, 7, 8, 9])

#t是列表
>>> s.update([10,11,12])
>>> s
set([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])

#t是字典
>>> s.update({"a":13,"b":14})
>>> s
set([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, ‘a‘, ‘b‘])

8. 判断集合中是否存在某元素,in , not in 

>>> s = set([1,2,3,4])
>>> 1 in s
True
>>> 1 not in s
False

使用内建函数操作集合



集合的标准操作包括集合的交集、并集、差集和对称差操作,下面举例解释下。

  假设s=[1,2,3,4],t=[3,4,5,6]

  交集:既在s又在t中的元素, 操作结果为[3,4].

  并集: s中或t中的元素,操作结果为[1,2,3,4,5,6].

  差集: 只在s中的元素,操作结果为[1,2].

  对称差:s中或t中的元素,但是不同在这两个集合中的元素.

  子集:如果s的元素在t中都有,则s是t的子集.

  超集: 如果s包含t中的所有元素,则s是t的超集合.

Python的集合操作的结果与最左边的操作数具有相同的类型,所以如果s是一个frozennet,而t是一个set,则结果将是frozennet。Python的集合操作可以使用集合的内建函数,也可以使用数学操作符。

由于Python的集合分为可变集合set和不可变集合frozenset两种,所以Python集合的内建函数的集合标准操作也分为两种。一种是set和frozenset都支持的,直接返回操作结果。另一种是仅set支持的操作,可以更改当前集合。

  1. 不改变集合的标准操作

  • s.intersection(t):交集.
  • s.union(t):并集.
  • s.difference(t):差集.
  • s.symmetric_difference(t):对称差.
  • s.issubset(t):如果s是t的子集,返回True.
  • s.issuperset(t):如果s是t的超集,返回True.
  • d.isdisjoint(t):如果s和t没有共同项,则返回True  
>>> s = set([1,2,3,4]);t = set([3,4,5,6])

#交集
>>> s.intersection(t)
set([3, 4])

#并集
>>> s.union(t)
set([1, 2, 3, 4, 5, 6])

#差集
>>> s.difference(t)
set([1, 2])

#对称差
>>> s.symmetric_difference(t)
set([1, 2, 5, 6])

#判断子集
>>> set([1,2]).issubset(s)
True

#判断超集
>>> s.issuperset(set([1,2]))
True

#判断有没有共同项
>>> s.isdisjoint(t)
False

  2. 改变集合的操作:

  • s.intersection_update(t):交集
  • s.difference_update(t):差集
  • s.symmetric_difference_update(t):对称差

  这三个函数会将操作的结果写入到集合s中。

>>> s = set([1,2,3,4]);t = set([3,4,5,6])

#交集
>>> s.intersection_update(t)
>>> s
set([3, 4])

#差集>>> s.difference_update(t)
>>> s
set([1, 2])

#对称差
>>> s = set([1,2,3,4]);t = set([3,4,5,6])
>>> s.symmetric_difference_update(t)
>>> s
set([1, 2, 5, 6])

数学运算符进行标准操作集合



  支持的数学运算符操作如下:

  s | t : 并集

  s & t : 交集

  s - t: 差集

  s ^ t: 对称差

  s < t: 如果s是t的子集返回True,否则False.

  s > t: 如果s是t的超集返回True,否则返回False.

  s == t: s和t相等返回True,否则False.

>>> s = set([1,2,3,4]); t = set([3,4,5,6])
>>> s & t
set([3, 4])
>>> s | t
set([1, 2, 3, 4, 5, 6])
>>> s - t
set([1, 2])
>>> s ^ t
set([1, 2, 5, 6])
>>> set([1,2]) < s
True
>>> t > set([3,4,5])
True
>>> s == t
False
  • 可变集合类型的方法和操作

  集合操作符



  集合的内建函数



  集合的应用



【Python学习笔记】集合

时间: 2024-10-18 17:14:29

【Python学习笔记】集合的相关文章

python学习笔记集合(七)

集合 set(集合)是一个无需不重复的元素数据集,对比列表的区别首先是无需的,不可以使用索引进行访问,另外一个特点是不能有重复数据. 项目开发中,集合主要用于数据元素去重和测试是否存在.集合还支持一些数学上的运算,例如:union(联合).intersection(交).difference(差).symmetric difference(对称差集). 创建集合:集合使用大括号或者set函数创建,需要注意空的集合不能使用{}创建,只能使用set函数,因为{}创建的是一个空字典. >> cour

Python 学习笔记 - 集合和文件操作

Set 集合 Set是一个无序而且不重复的元素集合.下面看看他有哪些基本功能 创建集合 >>> s1 = {11,22} s2 = set() s3 = set([11,22,33,4]) print(s1,s2,s3) ------------------- {11, 22} set() {33, 11, 4, 22} 把列表转换成集合,注意列表中重复的元素只保留一次 >>> li = [11,22,11,22] s1 = set(li) print(s1) ----

Python学习笔记:集合(set)基本内容

1.创建集合. 集合是无序的,元素不重复的一种序列. set() 创建,集合可变. >>> s = set('abcdef') >>> s {'d', 'c', 'b', 'a', 'e', 'f'} >>> type(s) <class 'set'> frozenset() 创建是不可变的集合,存在哈希值,可以做字典的key. >>> s = frozenset('abcdef') >>> s froz

OpenCV之Python学习笔记

OpenCV之Python学习笔记 直都在用Python+OpenCV做一些算法的原型.本来想留下发布一些文章的,可是整理一下就有点无奈了,都是写零散不成系统的小片段.现在看 到一本国外的新书<OpenCV Computer Vision with Python>,于是就看一遍,顺便把自己掌握的东西整合一下,写成学习笔记了.更需要的朋友参考. 阅读须知: 本文不是纯粹的译文,只是比较贴近原文的笔记:         请设法购买到出版社出版的书,支持正版. 从书名就能看出来本书是介绍在Pytho

Python学习笔记--未经排版

Python 学习笔记 Python中如何做到Print() 不换行 答:Print("输出内容",end='不换行的分隔内容'),其中end=后面为2个单引号 注:在Python 2.x中,Print "输出内容", 即在输出内容后加一逗号 Python中 is 和 == 的区别 答:Python中的对象包含三要素:id.type.value 其中id用来唯一标识一个对象,type标识对象的类型,value是对象的值 is判断的是a对象是否就是b对象,是通过id来

Python学习笔记_Python对象

Python学习笔记_Python对象 Python对象 标准类型 其他内建类型 类型对象和type类型对象 Python的Null对象None 标准类型操作符 对象值的比较 对象身份比较 布尔类型 标准类型的内建函数 typeObj cmpobj1 obj2 strobj reprobj typeobj isinstanceobj 标准类型的分类 存储模型 更新模型 访问模型 不支持的类型 Python学习笔记_Python对象 首先来理解一个通俗的含义,什么是对象?其实对象无论在什么语言里面

python 学习笔记 14 -- 常用的时间模块之datetime

书接上文,前面我们讲到<常用的时间模块之time>,这次我们学习datetime -- 日期和时间值管理模块 使用apihelper 查看datetime 模块,我们可以看到简单的几项: date       ---  日期对象,结构为date(year, month, day) time       ---  时间值对象,结构为 time([hour[, minute[, second[, microsecond[, tzinfo]]]]]).时间对象所有的参数都是可选的.tzinfo 可以

python学习笔记[3]-邮件的发送

本文摘抄自:http://www.cnblogs.com/xiaowuyi/archive/2012/03/17/2404015.html 一.相关模块介绍 发送邮件主要用到了smtplib和email两个模块,这里首先就两个模块进行一下简单的介绍:    1.smtplib模块 smtplib.SMTP([host[, port[, local_hostname[, timeout]]]])   SMTP类构造函数,表示与SMTP服务器之间的连接,通过这个连接可以向smtp服务器发送指令,执行

Python 学习笔记 6

6.1 字典 字典就是一个关联数组(或者称为哈希表).它是通过关键字索引的对象的集合.使用大括号{}来创建一个字典. print "字典" dic={ "username":"beazley", "home":"/home/beazley", "uid":500 } print dic uu=dic["username"] dd=dic["home"