python数据结构之 set

在数学概念中,被意为整合元素的定义区域

在python中,set最大的作用是用来去重

set常见操作:

In [158]: s ={1,1,1,1,2,22,33,3,3,3}

In [159]: s

Out[159]: {1,2, 3, 22, 33}

在定义一个集合的时候,只能使用大括号定义最少一个值,不然会被认为字典进行定义

在set中不能加入不可哈希的对象类型

In [161]:hash(‘a‘)

Out[161]:4952964627402403516

查看列表的哈希值,可以发现这个对象不可被哈希

In [162]: a =[1,2,3]

In [163]:hash(a)

---------------------------------------------------------------------------

TypeError                               Traceback (most recent call last)

<ipython-input-163-fe724719d9a1>in <module>()

----> 1hash(a)

TypeError:unhashable type: ‘list‘

set元素必须是可以哈希运算,但是需要元素可以迭代的

只要是能被迭代的元素都可以被加入到set中

In [171]:list(s)

Out[171]:[‘abc‘, b‘abc‘]

In [172]: a =list(s)

In [173]: a

Out[173]:[‘abc‘, b‘abc‘]

In [174]:set(a)

Out[174]:{‘abc‘, b‘abc‘}

set.add增加元素

增加一个元素到set中,如果存在则什么都不做,因为存在其值

In [176]:s.add(1)

In [177]: s

Out[177]: {1,‘abc‘, b‘abc‘}

In [178]:s.add(2)

In [179]: s

Out[179]: {1,‘abc‘, 2, b‘abc‘}

set可以收集多个集合,同样的可以合并多个集合

使用update进行更新

In [180]:s.update({1,2,3},{5,7},(1,9,1))

In [181]: s

Out[181]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 9}

In [185]:s.update({1})

In [186]: s

Out[186]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 4, 9}

In [187]:s.update({10})

In [188]: s

Out[188]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 4, 9, 10}

set.remove删除

remove,将要删除的值转为hash,并按当前hash值定位其位置进行删除,这个hash将作为一个key进行操作

In [193]: s

Out[193]: {1,2, b‘abc‘, 3, 5, 7, 4, 9, 10}

In [194]:s.remove(b‘abc‘)

In [195]: s

Out[195]: {1,2, 3, 4, 5, 7, 9, 10}

查找元素的过程是非常快,因为是直接定义hash,并非是从头到尾去遍历

discard 从集合移除一个元素

与remove功能一样,但是discard并不会弹出异常:

remove 删除一个异常索引会报出keyerror

In [196]:s.remove(‘hahaha‘)

---------------------------------------------------------------------------

KeyError                                Traceback (most recent call last)

<ipython-input-196-185a5cf4c543>in <module>()

----> 1s.remove(‘hahaha‘)

KeyError:‘hahaha‘

discard 删除一个索引则不会返回任何信息

In [197]:s.discard(‘hahaha‘)

In [198]:

pop  随机挑选一个弹出并返回

pop只是随机弹出,并不能跟参数

In [202]:s.pop()

Out[202]: 2

In [203]:s.pop()

Out[203]: 3

In [204]: s

Out[204]: {4,5, 7, 9, 10}

clear  清除集合内所有元素,但是要考虑GC内存回收问题

set修改及查询

在set中没有修改的概念,只有两种操作:

删除元素 和追加元素

查询:非线性结构,无法进行索引查询

遍历:可以遍历所有可迭代的元素

成员运算符

成员运算符 in , not in ,效率很高

非线性结构如果找哈希值,时间复杂度相当于索引遍历列表大O(1)

看似通过值在遍历,实际上是用哈希值进行定位

可哈希的类型

数值型:int、float、complex

布尔类:True、False

字符串: str Bytes

Tuple、None都是不可变类型,称为哈希类型

对比list和set执行效率

查看set执行效率

导入模块timeit

import timeit

In [3]:%%timeit lst1 = set(range(1000))

...: a = -1 in lst1

...:

38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)

查看list效率

In [1]:%%timeit lst1 = list(range(1000))

...: a = -1 in lst1

...:

14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


总结:

线性结构查询的复杂度是O(n), 随着规模增大耗时间越来越高

set和字典都属于特殊结构,其中都存了hash作为key,时间复杂度可以做到O(1),查询时间与数据规模无关

时间: 2024-11-17 12:02:29

python数据结构之 set的相关文章

Python数据结构

1. 元组(tuple) 元组由不同的元素组成,每个元素可以储存不同类型的数据,如字符串.数字甚至元组.元组是写保护的,即元组创建后不能再做任何修改操作. 1.1 元组的创建 Tuple(元组)由一系列元素组成,所有元素被包含在一对圆括号中.创建元组时可以不指定元素个数,但一旦创建后就不能修改长度 元组的创建格式如下:tuple_name = (元素1,元素2,-) 如果创建空元组,只需要一对空的圆括号:tuple_name = () 如果创建的元组只包含一个元素,应在元素后面加上逗号,以区分元

Python数据结构——散列表

散列表的实现常常叫做散列(hashing).散列仅支持INSERT,SEARCH和DELETE操作,都是在常数平均时间执行的.需要元素间任何排序信息的操作将不会得到有效的支持. 散列表是普通数组概念的推广.如果空间允许,可以提供一个数组,为每个可能的关键字保留一个位置,就可以运用直接寻址技术. 当实际存储的关键字比可能的关键字总数较小时,采用散列表就比较直接寻址更为有效.在散列表中,不是直接把关键字用作数组下标,而是根据关键字计算出下标,这种 关键字与下标之间的映射就叫做散列函数. 1.散列函数

python数据结构与算法 38 分析树

分析树 树的结构完成以后,该是时候看看它能做点什么实事儿了.这一节里,我们研究一下分析树.分析树能够用于真实世界的结构表示,象语法或数学表达式一类的. 图1 一个简单语句的分析树 图1所示是一个简单语句的层级结构,把语句表示为树结构可以让我们用子树来分析句子的组成部分. 图2 ((7+3)?(5?2))的分析树 我们也可以把数学表达式如((7+3)?(5?2))表示为分析树,如图2.此前我们研究过完全括号表达式,这个表达式表达了什么呢?我们知道乘法的优先级比加减要高,但因为括号的关系,在做乘法之

python数据结构与算法 36 树的基本概念

树 学习目标 理解什么是树及使用方法 学会使用树实现映射 用列表实现树 用类和引用实现树 用递归实现树 用堆实现优先队列 树的例子 前面我们学习过栈和队列这类线性数据结构,并且体验过递归,现在我们学习另一种通用数据结构,叫做树.树在计算机科学中应用广泛,象操作系统.图形学.数据库系统.网络等都要用到树.树和他们在自然界中的表哥--植物树--非常相似,树也有根,有分枝,有叶子.不同之处是,数据结构的树,根在顶上,而叶子在底部. 在开始学习之前,我们来研究几个普通的例子.第一个是生物学上的分级树.图

Python学习日志之Python数据结构初识

Python数据结构初识: 一.Python数据结构概述 1.何为数据结构 在程序中,同样的一个或几个数据组织起来,可以有不同的组织方式,也就是不同的存储方式,不同的组织方式就是不同的结构,我们把这些数据组织在一起的结构就叫做数据结构 例如: 有一串字符串:"abc",我们将它重新组织一下,比如通过list()函数将"abc"变成["a","b","c"],那么这个时候数据发生了重组,重组之后的结构就发生了

[笔记]python数据结构之线性表:linkedlist链表,stack栈,queue队列

python数据结构之线性表 python内置了很多高级数据结构,list,dict,tuple,string,set等,在使用的时候十分舒心.但是,如果从一个初学者的角度利用python学习数据结构时,这些高级的数据结构可能给我们以迷惑. 比如,使用list实现queue的时候,入队操作append()时间复杂度可以认为是O(1),但是,出队操作pop(0)的时间复杂度就是O(n). 如果是想利用python学学数据结构的话,我觉得还是自己实现一遍基本的数据结构为好. 1.链表 在这里,我想使

python数据结构与算法 37 树的实现

树的实现 记住上一节树的定义,在定义的基础上,我们用以下的函数创建并操作二叉树: BinaryTree() 创建一个二叉树实例 getLeftChild() 返回节点的左孩子 getRightChild() 返回节点的右孩子 setRootVal(val) 把val变量值赋给当前节点 getRootVal() 返回当前节点对象. insertLeft(val) 创建一个新二叉树作为当前节点的左孩子 insertRight(val) 创建一个新二叉树作为当前节点的右孩子. 实现树的关键点是合适的存

python数据结构与算法 34 归并排序

归并排序 在提高排序算法性能的方法中,有一类叫做分而治之.我们先研究其中第一种叫做归并排序.归并排序使用递归的方法,不停地把列表一分为二.如果列表是空或只有一个元素,那么就是排好序的(递归基点),如果列表有超过1个的元素,那么切分列表并对两个子列表递归使用归并排序.一旦这两个列表排序完成,称为"归并"的基本操作开始执行.归并是把两个有序列表合并成一个新的有序列表的过程.图10是我们熟悉的列表样例分解过程,图11是归并的过程. 图10  切分过程 图11  归并过程 以下是mergeSo

Python数据结构与算法--List和Dictionaries

Lists 当实现 list 的数据结构的时候Python 的设计者有很多的选择. 每一个选择都有可能影响着 list 操作执行的快慢. 当然他们也试图优化一些不常见的操作. 但是当权衡的时候,它们还是牺牲了不常用的操作的性能来成全常用功能. 本文地址:http://www.cnblogs.com/archimedes/p/python-datastruct-algorithm-list-dictionary.html,转载请注明源地址. 设计者有很多的选择,使他们实现list的数据结构.这些选

python数据结构与算法 35 快速排序

快速排序 快速排序也使用了分而治之的策略来提高性能,而且不需要额外的内存,但是这么做的代价就是,列表不是对半切分的,因而,性能上就有所下降. 快速排序选择一个数值,一般称为"轴点",虽然有很多选取轴点的方法,我们还是简单地把列表中第一个元素做为轴点了.轴点的作用是帮助把列表分为两个部分.列表完成后,轴点所在的位置叫做"切分点",从这一点上把列表分成两部分供后续调用. 图12所示,54将作为轴点.这个例子我们已经排过多次了,我们知道54在排好序后将处于现在31的位置上