python-散列表

散列表

简单地来说,通过某种函数关系将输入的数据映射为数字,使得数字与数据有着一一对应的关系。

其中,散列函数必须满足一定的要求:

  •  它必须是一致的。例如,当你输入mag时得到4,那么每当输入mag时,其结果也得是4
  • 它必须将用户的输入映射到不同的数值。例如,当你输入不同的数据时,如果每次都映射到1,那么显然这个散列函数不是一个好的散列函数。最好情况下,每一个数据映射到不同的数值

python提供的散列函数为字典。

 例如:

    book = {"aa":"3,12","bb":"231","cc":"5.77"}

 散列表的应用

  •   将散列表应用于查找。例如,将119.75.218.70映射为www.baidu.com。
  • 防止元素重复。
  • 将散列表用作缓存。访问网站的一个大致流程为:你向xxxxx网站服务器发出一个请求,然后服务器做一些 处理,返回个网页给你,最后你就看到所呈现的网站。

缓存原理:记录你最近所访问的数据,如果你需要该数据,服务器可以直接将其返回给你,不必进行大量的查找操作,从而节约时间。

缓存是一种常用的加速方式,而缓存的数据就存储在散列表中。

其大致过程如下:

    

测试代码:

cache = {}

def get_page(url):
    if cache.get(url):
        return cache[url]
    else:
        data = get_data_from_server(url)
        cache[url] = data
        return data

  性能分析

    由于常规的散列表都是一一映射的关系,查找、删除、修改值,其时间复杂度均为O(1)

时间: 2024-11-06 21:10:44

python-散列表的相关文章

python 散列表查找

class HashTable: def __init__(self, size): self.elem = [None for i in range(size)] self.count = size # def hash(self, key): return key % self.count # def insert_hash(self, key): address = self.hash(key) # while self.elem[address]: # address = (addres

Python数据结构——散列表

散列表的实现常常叫做散列(hashing).散列仅支持INSERT,SEARCH和DELETE操作,都是在常数平均时间执行的.需要元素间任何排序信息的操作将不会得到有效的支持. 散列表是普通数组概念的推广.如果空间允许,可以提供一个数组,为每个可能的关键字保留一个位置,就可以运用直接寻址技术. 当实际存储的关键字比可能的关键字总数较小时,采用散列表就比较直接寻址更为有效.在散列表中,不是直接把关键字用作数组下标,而是根据关键字计算出下标,这种 关键字与下标之间的映射就叫做散列函数. 1.散列函数

算法导论 第十章 基本数据类型 & 第十一章 散列表(python)

更多的理论细节可以用<数据结构>严蔚敏 看几遍,数据结构很重要是实现算法的很大一部分 下面主要谈谈python什么实现 10.1 栈和队列 栈:后进先出LIFO 队列:先进先出FIFO python 中使用list实现在这些功能 栈:压栈 append() 退栈   pop() 队列:   入队 append() 出队 pop(0) 栈: >>> stack = list() >>> stack.append(3) >>> stack.ap

【Python算法】哈希存储、哈希表、散列表原理

哈希表的定义: 哈希存储的基本思想是以关键字Key为自变量,通过一定的函数关系(散列函数或哈希函数),计算出对应的函数值(哈希地址),以这个值作为数据元素的地址,并将数据元素存入到相应地址的存储单元中. 查找时再根据要查找的关键字采用同样的函数计算出哈希地址,然后直接到相应的存储单元中去取要找的数据元素即可. 哈希表的应用: 哈希表(hash table)是实现字典操作的一种有效的数据结构. 尽管最坏的情况下,散列表中查找一个元素的时间与链表中查找的时间相同,达到了O(n). 然而实际应用中,散

C++ STL中的map用红黑树实现,搜索效率是O(lgN),为什么不像python一样用散列表从而获得常数级搜索效率呢?

C++ STL中的标准规定: map, 有序 unordered_map,无序,这个就是用散列表实现 谈谈hashmap和map的区别,我们知道hashmap是平均O(1),map是平均O(lnN)的,实践上是不是hashmap一定优于map呢?这里面有几个因素要考虑: hashmap的内存效率比map差,这是显而易见的 map的查找效率实践上是非常高的,如在1M数据中查找一个元素,需要多少次比较呢?20次. map的查找效率比hashmap稳定. hashmap查找时候要算hash,这个最坏时

python基础&mdash;&mdash;列表、字典

Python核心数据类型--列表 列表是一个任意类型的对象的位置相关的有序集合,它没有固定的大小.大小可变的,通过偏移量进行赋值以及其他各种列表的方法进行调用,能够修改列表.其他更多的功能可以查阅python的标准手册,或者运行help(list)或dir(list)查看list方法的完整清单. 任意对象的有序集合:从功能上看,列表是收集其他对象的地方,同时列表所包含的每一项都保持了从左到右的位置顺序. 通过偏移读取:可以通过列表对象的偏移对其进行索引,从而读取对象的某一部分内容.由于列表的每一

7、散列表

一.什么是散列表? 问题:现在我们需要为一家超市建立一个结账系统,我们应该考虑用哪一种数据结构? 思考:由于结账系统多用于查询,我们可以考虑使用数组.在数组中需要同时储存商品名和对应的价格,我们可以再数组中内嵌子数组,把一个商品名和对应价格同时保存在一个子数组中,最后对所有数组排序.查询是速度为O(log2n). 反思:①数组无法储存具有映射关系的数据:②超市中的商品成千上万,即使查询速度为对数速度,当记录的项目多时查询起来也非常耗时. 针对反思中的两点,我们想:如果有一种数据结构,能够储存具有

算法——散列表

散列表 算法——散列表 散列表(hash table):键值(key_value)映射,Python提供的哈希列表实现为字典. 作用: 模拟映射关系 便于查找 避免重复 缓存/记住数据,以免服务器再通过处理来生成它们 # hash_table.py 哈希表 # 避免重复 def vote(li): voters = {} for i in li: if i not in voters: voters[i] = True else: print(i + ' has already voted.')

数据结构和算法: 散列表

散列表(Hash table,也叫哈希表),是根据键(Key)而直接访问在内存存储位置的数据结构.也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录,这加快了查找速度.这个映射函数称做散列函数,存放记录的数组称做散列表 散列表的时间复杂度不是严格的O(1), 因为和多种因素有关, 比如散列函数, 还有就是如果采用链表法处理冲突, 那么最坏情况是所有数据都散列到一个链表中, 此时是O(n). hash函数有以下几种简单实现的方法 取余法 常见的对一个数进行取余操作

算法——散列表(最有用的基本数据结构之一)

你作为一个老板,一个卖东西要不断找价格表的销售员和一个一眼看到商品就能知道价格的销售员 你会要哪一个? 可以使用这样形式的数组来记录商品价格 [(eggs,2,49)(milk,1.49)(pear,0.79)], 将这些数组按商品名排序,再执行二分查找商品的价格. 这样查找价格的时间就是O(log n) 什么是散列函数? 输入能够映射到数字的函数. 散列函数需要满足的要求: ①必须是一致的.比如输入apple得到4,那么每次输入apple都是4 ②将不同的输入映射到不同的数字.[最理想] 如果