python数据结构之 set

在数学概念中，被意为整合元素的定义区域

在python中，set最大的作用是用来去重

set常见操作：

In [158]: s ={1,1,1,1,2,22,33,3,3,3}

In [159]: s

Out[159]: {1,2, 3, 22, 33}

在定义一个集合的时候，只能使用大括号定义最少一个值，不然会被认为字典进行定义

在set中不能加入不可哈希的对象类型

In [161]:hash(‘a‘)

Out[161]:4952964627402403516

查看列表的哈希值，可以发现这个对象不可被哈希

In [162]: a =[1,2,3]

In [163]:hash(a)

---------------------------------------------------------------------------

TypeError Traceback (most recent call last)

<ipython-input-163-fe724719d9a1>in <module>()

----> 1hash(a)

TypeError:unhashable type: ‘list‘

set元素必须是可以哈希运算，但是需要元素可以迭代的

只要是能被迭代的元素都可以被加入到set中

In [171]:list(s)

Out[171]:[‘abc‘, b‘abc‘]

In [172]: a =list(s)

In [173]: a

Out[173]:[‘abc‘, b‘abc‘]

In [174]:set(a)

Out[174]:{‘abc‘, b‘abc‘}

set.add增加元素

增加一个元素到set中，如果存在则什么都不做，因为存在其值

In [176]:s.add(1)

In [177]: s

Out[177]: {1,‘abc‘, b‘abc‘}

In [178]:s.add(2)

In [179]: s

Out[179]: {1,‘abc‘, 2, b‘abc‘}

set可以收集多个集合，同样的可以合并多个集合

使用update进行更新

In [180]:s.update({1,2,3},{5,7},(1,9,1))

In [181]: s

Out[181]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 9}

In [185]:s.update({1})

In [186]: s

Out[186]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 4, 9}

In [187]:s.update({10})

In [188]: s

Out[188]: {1,‘abc‘, 2, b‘abc‘, 3, 5, 7, 4, 9, 10}

set.remove删除

remove，将要删除的值转为hash，并按当前hash值定位其位置进行删除，这个hash将作为一个key进行操作

In [193]: s

Out[193]: {1,2, b‘abc‘, 3, 5, 7, 4, 9, 10}

In [194]:s.remove(b‘abc‘)

In [195]: s

Out[195]: {1,2, 3, 4, 5, 7, 9, 10}

查找元素的过程是非常快，因为是直接定义hash，并非是从头到尾去遍历

discard 从集合移除一个元素

与remove功能一样，但是discard并不会弹出异常：

remove 删除一个异常索引会报出keyerror

In [196]:s.remove(‘hahaha‘)

---------------------------------------------------------------------------

KeyError Traceback (most recent call last)

<ipython-input-196-185a5cf4c543>in <module>()

----> 1s.remove(‘hahaha‘)

KeyError:‘hahaha‘

discard 删除一个索引则不会返回任何信息

In [197]:s.discard(‘hahaha‘)

In [198]:

pop 随机挑选一个弹出并返回

pop只是随机弹出，并不能跟参数

In [202]:s.pop()

Out[202]: 2

In [203]:s.pop()

Out[203]: 3

In [204]: s

Out[204]: {4,5, 7, 9, 10}

clear 清除集合内所有元素，但是要考虑GC内存回收问题

set修改及查询

在set中没有修改的概念，只有两种操作:

删除元素和追加元素

查询：非线性结构，无法进行索引查询

遍历：可以遍历所有可迭代的元素

成员运算符

成员运算符 in , not in ,效率很高

非线性结构如果找哈希值，时间复杂度相当于索引遍历列表大O(1)

看似通过值在遍历，实际上是用哈希值进行定位

可哈希的类型

数值型：int、float、complex

布尔类：True、False

字符串： str Bytes

Tuple、None都是不可变类型，称为哈希类型

对比list和set执行效率

查看set执行效率

导入模块timeit

import timeit

In [3]:%%timeit lst1 = set(range(1000))

...: a = -1 in lst1

...:

38.1 ns ± 0.0493 ns per loop(mean ± std. dev. of 7 runs, 10000000 loops each)

查看list效率

In [1]:%%timeit lst1 = list(range(1000))

...: a = -1 in lst1

...:

14.7 μs ± 99.3ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

总结：

线性结构查询的复杂度是O(n), 随着规模增大耗时间越来越高

set和字典都属于特殊结构，其中都存了hash作为key，时间复杂度可以做到O(1),查询时间与数据规模无关

时间： 2024-11-17 12:02:29

python数据结构之 set的相关文章

Python数据结构

1. 元组(tuple) 元组由不同的元素组成,每个元素可以储存不同类型的数据,如字符串.数字甚至元组.元组是写保护的,即元组创建后不能再做任何修改操作. 1.1 元组的创建 Tuple(元组)由一系列元素组成,所有元素被包含在一对圆括号中.创建元组时可以不指定元素个数,但一旦创建后就不能修改长度元组的创建格式如下:tuple_name = (元素1,元素2,-) 如果创建空元组,只需要一对空的圆括号:tuple_name = () 如果创建的元组只包含一个元素,应在元素后面加上逗号,以区分元

Python数据结构——散列表

散列表的实现常常叫做散列(hashing).散列仅支持INSERT,SEARCH和DELETE操作,都是在常数平均时间执行的.需要元素间任何排序信息的操作将不会得到有效的支持. 散列表是普通数组概念的推广.如果空间允许,可以提供一个数组,为每个可能的关键字保留一个位置,就可以运用直接寻址技术. 当实际存储的关键字比可能的关键字总数较小时,采用散列表就比较直接寻址更为有效.在散列表中,不是直接把关键字用作数组下标,而是根据关键字计算出下标,这种关键字与下标之间的映射就叫做散列函数. 1.散列函数

python数据结构与算法 38 分析树

分析树树的结构完成以后,该是时候看看它能做点什么实事儿了.这一节里,我们研究一下分析树.分析树能够用于真实世界的结构表示,象语法或数学表达式一类的. 图1 一个简单语句的分析树图1所示是一个简单语句的层级结构,把语句表示为树结构可以让我们用子树来分析句子的组成部分. 图2 ((7+3)?(5?2))的分析树我们也可以把数学表达式如((7+3)?(5?2))表示为分析树,如图2.此前我们研究过完全括号表达式,这个表达式表达了什么呢?我们知道乘法的优先级比加减要高,但因为括号的关系,在做乘法之

python数据结构与算法 36 树的基本概念

树学习目标理解什么是树及使用方法学会使用树实现映射用列表实现树用类和引用实现树用递归实现树用堆实现优先队列树的例子前面我们学习过栈和队列这类线性数据结构,并且体验过递归,现在我们学习另一种通用数据结构,叫做树.树在计算机科学中应用广泛,象操作系统.图形学.数据库系统.网络等都要用到树.树和他们在自然界中的表哥--植物树--非常相似,树也有根,有分枝,有叶子.不同之处是,数据结构的树,根在顶上,而叶子在底部. 在开始学习之前,我们来研究几个普通的例子.第一个是生物学上的分级树.图

Python学习日志之Python数据结构初识

Python数据结构初识: 一.Python数据结构概述 1.何为数据结构在程序中,同样的一个或几个数据组织起来,可以有不同的组织方式,也就是不同的存储方式,不同的组织方式就是不同的结构,我们把这些数据组织在一起的结构就叫做数据结构例如: 有一串字符串:"abc",我们将它重新组织一下,比如通过list()函数将"abc"变成["a","b","c"],那么这个时候数据发生了重组,重组之后的结构就发生了

[笔记]python数据结构之线性表：linkedlist链表,stack栈,queue队列

python数据结构之线性表 python内置了很多高级数据结构,list,dict,tuple,string,set等,在使用的时候十分舒心.但是,如果从一个初学者的角度利用python学习数据结构时,这些高级的数据结构可能给我们以迷惑. 比如,使用list实现queue的时候,入队操作append()时间复杂度可以认为是O(1),但是,出队操作pop(0)的时间复杂度就是O(n). 如果是想利用python学学数据结构的话,我觉得还是自己实现一遍基本的数据结构为好. 1.链表在这里,我想使

python数据结构与算法 37 树的实现

树的实现记住上一节树的定义,在定义的基础上,我们用以下的函数创建并操作二叉树: BinaryTree() 创建一个二叉树实例 getLeftChild() 返回节点的左孩子 getRightChild() 返回节点的右孩子 setRootVal(val) 把val变量值赋给当前节点 getRootVal() 返回当前节点对象. insertLeft(val) 创建一个新二叉树作为当前节点的左孩子 insertRight(val) 创建一个新二叉树作为当前节点的右孩子. 实现树的关键点是合适的存

python数据结构与算法 34 归并排序

归并排序在提高排序算法性能的方法中,有一类叫做分而治之.我们先研究其中第一种叫做归并排序.归并排序使用递归的方法,不停地把列表一分为二.如果列表是空或只有一个元素,那么就是排好序的(递归基点),如果列表有超过1个的元素,那么切分列表并对两个子列表递归使用归并排序.一旦这两个列表排序完成,称为"归并"的基本操作开始执行.归并是把两个有序列表合并成一个新的有序列表的过程.图10是我们熟悉的列表样例分解过程,图11是归并的过程. 图10 切分过程图11 归并过程以下是mergeSo

Python数据结构与算法--List和Dictionaries

Lists 当实现 list 的数据结构的时候Python 的设计者有很多的选择. 每一个选择都有可能影响着 list 操作执行的快慢. 当然他们也试图优化一些不常见的操作. 但是当权衡的时候,它们还是牺牲了不常用的操作的性能来成全常用功能. 本文地址:http://www.cnblogs.com/archimedes/p/python-datastruct-algorithm-list-dictionary.html,转载请注明源地址. 设计者有很多的选择,使他们实现list的数据结构.这些选

python数据结构与算法 35 快速排序

快速排序快速排序也使用了分而治之的策略来提高性能,而且不需要额外的内存,但是这么做的代价就是,列表不是对半切分的,因而,性能上就有所下降. 快速排序选择一个数值,一般称为"轴点",虽然有很多选取轴点的方法,我们还是简单地把列表中第一个元素做为轴点了.轴点的作用是帮助把列表分为两个部分.列表完成后,轴点所在的位置叫做"切分点",从这一点上把列表分成两部分供后续调用. 图12所示,54将作为轴点.这个例子我们已经排过多次了,我们知道54在排好序后将处于现在31的位置上