哈希表

哈希表支持的一种最有效的检索方法:散列.

由于计算哈希值和在数组中进行索引都只消耗固定时间,因此哈希表的最大亮点在于他是一种运行时间在常量级的检索方法.

哈希表主要有两种:

1.链式哈希表:将数据存储在桶中的哈希表,每个桶里面都是一个链表,且链表的容量随着冲突的增大而增大.(换句话说就是如果有冲突,会在桶中的链表加上一个存储的值)

2.开地址哈希表:将数据存在表本身,而不是在桶中,他通过各种探查方法来避免冲突.

解决冲突:

不管在以上那种哈希表中,我们的目标是尽可能均匀的分配表中的元素.所以我们必须选择正确和哈希函数.

链式哈希表中,哈希函数可以表示为:

 h(k)=x

一般来说,大多数的散列方法都假设键值k为整数,所以,如果设置键值需要把传入的类型进行转换.

哈希函数可以使用:

取余法:

h(k)= k mod m (其中k表示转换后的整数,m表示哈希表的桶数)

比如:有m=11个位置,k为25,得到桶的索引index=25%11=3,所以在bucket[index]的位置存入值.

一般来说,需要避免m的值是2的幂,通常选择一个素数.

乘法:

h(k)= m(kA mod 1),

他将整数k乘以一个常数A(0<A<1),取结果的小数部分,然后乘以m取结果的整数部分.通常情况下,A取0.618,他是由√‾5减1除以2得到.

这个方法的有点是在取m得时候不需要啊那么慎重.

最后,如果还是有冲突的元素在一个桶内,哈希表会用链式结构存储冲突元素.

开地址哈希表

由于元素放在表本身,没有链式结构存储冲突元素,哈希表需要其他方法解决冲突.

线性探查:开地址哈希表中一种简单的探查方法就是探查表中的连续槽位.

表示为:如果存在i(0<i<m-1)

h(k,i)= (h‘(k)+i) mod m

其中h‘(k)可以使用上述的取余法.

大致步骤:

1.i=0,通过h‘(k)找到一个位置,如果位置没有元素,就存储元素.

2.如果有元素,i+1来查看这个位置的下个位置是否有元素.

3.循环1,2步骤.

这个方法的主要缺点是元素不能均匀散列.

双散列:

最有效的探查的方法,就是通过计算两个辅助哈希函数哈希编码的和来得到哈希编码.

表示为:如果存在i(0<i<m-1)

h(k,i)=(h1(k)+ih2(k)) mod m

h1和h2是两个辅助哈希函数.

一般来说:m的值取素数,然后令h1(k)= k mod m,h2(k)=1+(k mod m‘),其中m‘略小于m,一般取m‘=m-1或者m-2;

这种方法的优点是能在表中探查并产生较好的元素分布,缺点是必须限制m的值.这样才能保证在一系列探查中访问表中所有槽之后才会再次探查任何槽.

 

时间: 2024-09-29 10:22:54

哈希表的相关文章

8. 蛤蟆的数据结构进阶八哈希表相关概念

8. 蛤蟆的数据结构进阶八哈希表相关概念 本篇名言:"作家当然必须挣钱才能生活,写作,但是他决不应该为了挣钱而生活,写作.--马克思" 前些笔记我们学习了二叉树相关.现在我们来看下哈希表.这篇先来看下哈希表的相关概念 欢迎转载,转载请标明出处:http://blog.csdn.net/notbaron/article/details/47347273 1.  哈希表的概念 哈希表(HashTable)也叫散列表,是根据关键码值(Key Value)而直接进行访问的数据结构.它通过把关键

哈希表——线性探测法、链地址法、查找成功、查找不成功的平均长度

一.哈希表 1.概念 哈希表(Hash Table)也叫散列表,是根据关键码值(Key Value)而直接进行访问的数据结构.它通过把关键码值映射到哈希表中的一个位置来访问记录,以加快查找的速度.这个映射函数就做散列函数,存放记录的数组叫做散列表. 2.散列存储的基本思路 以数据中每个元素的关键字K为自变量,通过散列函数H(k)计算出函数值,以该函数值作为一块连续存储空间的的单元地址,将该元素存储到函数值对应的单元中. 3.哈希表查找的时间复杂度 哈希表存储的是键值对,其查找的时间复杂度与元素数

【搜索引擎(二)】索引、倒排索引、哈希表、跳表

索引 其实在计算机中我们早已接触过跟索引有关的东西,比如数据库里的索引(index),还有硬盘文件系统中其实也有类似的东西,简而言之,索引是一种为了方便找到自己需要的东西而设计出来的条目,你可以通过找索引找到自己想要内容的位置.索引过程是: 关键字->索引->文档.在图书馆内的书分门别类,就是一种按类别来分的索引.当然索引还有很多其他的实现. 仅仅有索引的概念是不够的.虽然分门别类是一种方法,但是我们在拥有一堆文档的时候必须要有从文档到索引的规范过程,并且索引的结构要满足能够让人(或者计算机)

哈希表的简单操作

哈希表中,关键值通过哈希函数映射到数组上,查找时通过关键值直接访问数组.哈希表的关键问题在于哈希函数的构造和解决冲突的方法. 下面采用最简单的线性探测展示一下哈希表的基本操作: 1 //Hashtable 2 class HashTable { 3 private: 4 string *elem; 5 int size; 6 public: 7 HashTable() { 8 size = 2000; 9 elem = new string[size]; 10 for (int i = 0; i

Stack集合 Queue队列集合 Hashtable哈希表

Stack集合 干草堆集合 栈集合 栈;stack,先进后出,一个一个赋值,一个一个取值,安装顺序来. 属性和方法 实例化 初始化 Stack st = new Stack(); 添加元素 1 个数 2 Console.WriteLine(st.Count); 3 只要使用一次pop方法,就会从最后一个元素开始排除 弹出 4 Console.WriteLine(st.Pop()); 5 Console.WriteLine(st.Count); 6 只想查看不弹出 7 Console.WriteL

深入理解哈希表

有两个字典,分别存有 100 条数据和 10000 条数据,如果用一个不存在的 key 去查找数据,在哪个字典中速度更快? 有些计算机常识的读者都会立刻回答: “一样快,底层都用了哈希表,查找的时间复杂度为 O(1)”.然而实际情况真的是这样么? 答案是否定的,存在少部分情况两者速度不一致,本文首先对哈希表做一个简短的总结,然后思考 Java 和 Redis 中对哈希表的实现,最后再得出结论,如果对某个话题已经很熟悉,可以直接跳到文章末尾的对比和总结部分. 哈希表概述 Objective-C 中

哈希表(开链法)

纯代码 #pragma once #include <iostream> #include <vector> using namespace std; struct __HashFuncString { size_t operator()(const string &key) { size_t hash = 0; for (size_t i = 0; i < key.size(); ++i) { hash += key[i]; } return hash; } };

哈希表/散列表

哈希表/散列表,是根据关键字(key)直接访问在内存存储位置的数据结构. 构造哈希表的常用方法: 直接地址法---取关键字的某个线性函数为散列地址,Hash(Key) = Key或Hash(key) = A*Key + B, A,B为常数. 除留余数法---取关键值被某个不大于散列表长m的数p除后的所得的余数为散列地址. Hash(key) = key % p. 若采用直接地址法(Hash(Key) = Key)存在一定的缺陷. 当Key值特别大时,而Key之前的数很少,就会造成空间浪费.大多时

哈希表线性探测

HashTable-散列表/哈希表,是根据关键字(key)而直接访问在内存存储位置的数据结构. 它通过一个关键值的函数将所需的数据映射到表中的位置来访问数据,这个映射函数叫做散列函数,存放记录的数组叫做散列表. 哈希冲突/哈希碰撞 不同的Key值经过哈希函数Hash(Key)处理以后可能产生相同的值哈希地址,我们称这种情况为哈希冲突.任意的散列函数都不能避免产生冲突. 我给大家介绍的是哈希表的线性探测,线性探测的基本思路: 1.用一个数据除以散列表的长度,余数是多少,就把这个数放在散列表下标相同