集合
set(集合)是一个无需不重复的元素数据集,对比列表的区别首先是无需的,不可以使用索引进行访问,另外一个特点是不能有重复数据。
项目开发中,集合主要用于数据元素去重和测试是否存在。集合还支持一些数学上的运算,例如:union(联合)、intersection(交)、difference(差)、symmetric difference(对称差集)。
创建集合:
集合使用大括号或者set函数创建,需要注意空的集合不能使用{}创建,只能使用set函数,因为{}创建的是一个空字典。
>> courses = set()
>> type(courses)
<class ‘set‘>
>> courses = {‘linux‘,‘C++‘,‘Vim‘,‘Linx‘}
>> courses
{‘C++‘, ‘Vim‘, ‘Linx‘, ‘linux‘} #重复的‘linux’字符串已被自动去除
集合还可以直接由字符串与set函数进行创建,会将字符串拆分为不同的字符,并去除重复的字符:
>> nameset = set(‘python3‘)
>> nameset
{‘p‘, ‘n‘, ‘o‘, ‘3‘, ‘h‘, ‘t‘, ‘y‘}
集合操作:
集合去重,使用in判断(in也适用于列表和元组):
>> ‘linux‘ in courses
True
>> ‘python‘ in courses
False
>> ‘python‘ not in courses
True
add()向集合中增加元素,使用remove()从集合中删除元素,如果元素不存在则抛出异常:
>> courses
{‘C++‘, ‘Vim‘, ‘Linx‘, ‘linux‘}
>> courses.add(‘python‘)
>> ‘python‘ in courses
True
>> courses
{‘C++‘, ‘Vim‘, ‘Linx‘, ‘linux‘, ‘python‘}
>> courses.remove(‘python‘)
>> ‘python‘ in courses
False
>> courses
{‘C++‘, ‘Vim‘, ‘Linx‘, ‘linux‘}
>> courses.remove(‘python‘)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: ‘python‘
集合运算符:
>> set1 = {1,2,3,4}
>> set2 = {3,4,5,6}
‘|’操作,存在set1中或者set2中的元素,等效于union:
>> set1 | set2
{1, 2, 3, 4, 5, 6}
>> set2.union(set1)
{1, 2, 3, 4, 5, 6}
‘&‘操作,返回即在set1又在set2的元素:
>> set1 & set2
{3, 4}
‘-’操作,返回在set1不在set2的元素:
>> set1 - set2
{1, 2}
‘^’操作,返回只存在两个集合中无交集的元素:
>> set1 ^ set2
{1, 2, 5, 6}
原文地址:http://blog.51cto.com/cqtesting/2070574