hash冲突随笔

一:hash表

也叫散列表,以key-value的形式存储数据,就是将需要存储的关键码值通过hash函数映射到表中的位置,可加快访问速度。

二:hash冲突

如果两个相同的关键码值通过hash函数映射到了表中的相同位置,则产生了“碰撞”及hash冲突。解决冲突的方式有多种,可根据实际情况选择。

三:解决方法

1.外部链址法

为hash冲突的关键码值建立单链表,将单链表的头指针保存在hash表的存储单元中。以HashMap为例,可以实例化一个初始容量为16和加载因子为0.75f的对象。首先会创建一个长度为16 的哈希表,相当于定义了一个由16个头指针(初始为空)组成的指针数组T[0...m-1],凡是hash结果为i的节点均插入到以T[i]为头指针的单链表中。数据越多,碰撞发生就越多,当哈希表的容量达到某个临界点时(数组长度*加载因子)就会对表进行扩容。扩容非常耗时,需要计算数据在新表中的位置并进行复制。所以如果事先知道HashMap中需要存储的数量,最好预设HashMap的初始容量能大大提升系统系能。

查找时间:链表查找时间+1;

2.再哈希法

也称作再散列法,当发生碰撞后使用不同的hash函数再次进行hash操作,直到不再冲突。

数据比较分散,但是增加了计算时间,不太可能进行删除操作。

3.建立公共溢出区

创建两个哈希表,一个为基本表,一个为公共表,如果需要存储的数据hash后和基本表中有冲突,则保存在公共表中,公共表为顺序表,可将冲突的数据一次插入到公共顺序表中。

查询数据的时候先根据hash值去基本表中查找,如果和数据不匹配再去公共表中顺序查找即可。

4.开放定址发

称作再散列法,当冲突发生后以同样的hssh函数再次进行不同规则的操作,直到不冲突为止。

表达式:Hi = (H(key) + di)%m i=1,2,3,...,n。根据di的的不同可分为:

1)线性探测再散列:di为线性函数即可,通常di = 1,2,3,...,m-1

冲突发生后顺序查找表中的下一个单元,直到找到空单元

2)二次探测再散列:di = 1^2,-1^2,2^2,-2^2,...,k^2,-k^2 (k<m/2)

冲突发生后,在表的左右两侧进行探测。

3)伪随机探测再散列:di = 随机数

冲突发生后,在表的位置随机进行探测。

查询操作则根据相同的存储规则进行查询操作即可。

特点:不太可能进行删除操作,当表快满状态时,效率下降。

时间: 2024-12-25 02:54:40

hash冲突随笔的相关文章

Hash冲突处理终极版

对于Hash,我们是怎样来处理冲突的.现在就来介绍一些经典的Hash冲突处理的方法.主要包括 (1)开放地址法 (2)拉链法 (3)再哈希法 (4)建立公共溢出区 (1)开放地址法     基本思想:当发生地址冲突时,按照某种方法继续探测Hash表中其它存储单元,直到找到空位置为止.描述如下 其中,为关键字的直接Hash地址,为Hash表的长度,为 每次再探测时的地址增量.根据的不同取法,有不同的称呼. 线性探测再散列         二次探测再散列         伪随机再散列       伪

hash 冲突及解决办法。

hash 冲突及解决办法. 关键字值不同的元素可能会映象到哈希表的同一地址上就会发生哈希冲突.解决办法: 1)开放定址法:当冲突发生时,使用某种探查(亦称探测)技术在散列表中形成一个探查(测)序列.沿此序列逐个单元地查找,直到找到给定 的关键字,或者碰到一个开放的地址(即该地址单元为空)为止(若要插入,在探查到开放的地址,则可将待插入的新结点存人该地址单元).查找时探查到开放的 地址则表明表中无待查的关键字,即查找失败. 2) 再哈希法:同时构造多个不同的哈希函数. 3)链地址法:将所有哈希地址

HashMap解决hash冲突的方法

源码分析 HashMap 采用一种所谓的“Hash 算法”来决定每个元素的存储位置.当程序执行 map.put(String,Obect)方法 时,系统将调用String的 hashCode() 方法得到其 hashCode 值——每个 Java 对象都有 hashCode() 方法,都可通过该方法获得它的 hashCode 值.得到这个对象的 hashCode 值之后,系统会根据该 hashCode 值来决定该元素的存储位置.源码如下: public V put(K key, V value)

poj 2549 --- 传说中的用“桶”防止HASH冲突

http://poj.org/problem?id=2549 维基百科有3Sum算法:https://en.wikipedia.org/wiki/3SUM sort(S); for i=0 to n-3 do a = S[i]; k = i+1; l = n-1; while (k<l) do b = S[k]; c = S[l]; if (a+b+c == 0) then output a, b, c; // Continue search for all triplet combinatio

hashMap 源码解读理解实现原理和hash冲突

hashMap 怎么说呢. 我的理解是 外表是一个set 数组,无序不重复 . 每个set元素是一个bean ,存着一对key value 看看代码吧 package test; import java.util.HashMap; import java.util.Map.Entry; public class HashMaptest { public static void main(String[] args) { HashMap<String, String> map = new Has

HashMap的hash冲突解决方案

Hash函数 非哈希表的特点:关键字在表中的位置和它之间不存在一个确定的关系,查找的过程为给定值一次和各个关键字进行比较,查找的效率取决于和给定值进行比较的次数. 哈希表的特点:关键字在表中位置和它之间存在一种确定的关系. 哈希函数:一般情况下,需要在关键字与它在表中的存储位置之间建立一个函数关系,以f(key)作为关键字为key的记录在表中的位置,通常称这个函数f(key)为哈希函数. hash : 翻译为"散列",就是把任意长度的输入,通过散列算法,变成固定长度的输出,该输出就是散

java.util.HashMap源码浅析之解决hash冲突

HashMap是java无论是企业管理系统还是web或者其他应用层的程序开发,都是应用比较多的一种数据结构,正好最近面试有问到与HashMap解决hash冲突的方式(本人菜比没答上来),现浅析源码以解惑 且记录,将来在项目上尽量避免此类问题的出现,大家都知道HashMap为key-value存储,在HashMap中,HashMap本身拥有一个Entry数组,Entry则存有key-value,且对于Hashmap来讲一个key只能对应一个value     首先是put方法          

Java集合--Hash、Hash冲突

一.Hash 散列表(Hash table,也叫哈希表),是根据键(Key)而直接访问在内存存储位置的数据结构.也就是说,它通过计算一个关于键值的函数,将所需查询的数据映射到表中一个位置来访问记录,这加快了查找速度. 这个映射函数称做散列函数,存放记录的数组称做散列表. 实现Hash算法的关键:实现hash算法 .解决hash冲突 1.Hash函数 首先来说hash函数,java中对象都已一个hashCode()方法,那为什么还需要hash函数呢?hashCode是在jdk中是有符号int类型,

解决hash冲突之分离链接法

解决hash冲突之分离链接法 分离链接法:其做法就是将散列到同一个值的所有元素保存到一个表中. 这样讲可能比较抽象,下面看一个图就会很清楚,图如下 相应的实现可以用分离链接散列表来实现(其实就是一个linkedList数组) 至于基本的增加.删除和查询的思路都是先根据散列函数来确定遍历哪个链表.然后再到被确定的链表中执行一次查找,然后再进行相应的操作. 接下来就讲几个注意点吧 (一)什么时候需要rehash来扩大散列表的大小 讲这个的时候,先介绍一下什么是装填因子. 装填因子 = 关键字个数 /