散列表(Hash table)及其构造

散列表(Hash table)

　　散列表，是根据关键码值(Key value)而直接进行访问的数据结构。它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。

已知的查找方法：

　　1.顺序查找 O(N)

　　2.二分查找（静态查找） O(log2N)

　　3.二叉搜索树 O(h) h为二叉树的高度

　　　平衡二叉树 O(log2N)

Q：如何快速搜索到需要的关键字？如果关键字不方便比较怎么办？

查找的本质：已知对象找位置

　　有序安排对象：全序、半序

　　直接“算出”对象位置：散列

散列查找的两项基本工作：

　　计算位置：构造散列函数确定关键词的存储位置

　　解决冲突：应用某种策略解决多个关键词位置相同的情况

时间复杂度几乎是常量O(1) 查找时间与问题规模无关

关键操作：查找插入删除

散列（Hashing）的基本思想：

　　1.以关键词key为自变量，通过一个确定的函数h(散列函数)计算出对应的函数值h(key),作为数据对象的存储地址。

　　2.可能不同的关键词会映射到同一个散列地址上，即h(keyi) = h(keyj) (当keyi≠keyj),称为”冲突(Collision)”。需要某种冲突解决策略

装填因子(Loading Factor)：

　　设散列表空间大小为m, 填入表中元素的个数时n, 则称α = n/m为散列表的装填因子

散列函数的构造方法：

一个“好”的散列函数一般考虑下列两个因素：

　　1.计算简单，以便提高转换速度

　　2.关键词对应的地址空间分布均匀，以尽量减少冲突

数字关键词的构造

1.直接定址法

　　取关键词的某个线性函数值为散列地址

　　h(key) = a * key + b (a, b为常数)

　　如：h(key) = key - 1990

2.除留余数法

　　h(key) = key mod P

　　如 h(key) = key % 17 P = Tablesize = 17

　　一般P取素数

3.数字分析法

　　分析数字关键字在各位上的变化情况，取比较随机的为作为散列地址

　　如取11位手机号码key的后4为作为地址： h(key) = atoi(key+7) (char *key)

　　如果关键词key是18位身份证号码：

　　h1 (key) = (key[6]-‘0’)*104 + (key[10]-‘0’)*103 + (key[14]-‘0’)*102 + 　　　　　　　　(key[16]-‘0’)*10 + (key[17]-‘0’)

　　h(key) = h1 (key)*10 + 10 　　　　　　（当 key[18] = ‘x’时）

　　　　或 = h1 (key)*10 + key[18]-‘0’ 　　（当 key[18] 为’0’~’9’时）

4.折叠法：

　　把关键词分割成位数相同的几个部分，然后叠加

5.平方取中法：

尽量使每一位都对最终结果产生影响

字符关键词的散列函数构造

1.简单的散列函数—ASCⅡ码加和法

　　h(key) = (Σkey[i]) mod TableSize

　　冲突严重如a3, b2, c1, eat, tea

2.简单的改进—前3个字符移位法

　　h(key)=(key[0]*272 + key[1]*27 + key[2])mod TableSize

　　27 可能有空格

　　仍然冲突：string street strong structure.. 并且空间浪费 3000/pow(26, 3) = 30%

3.好的散列函数—移位法

　　设计关键词的所以n个字符，并且分布很好：

　　如：h(“abcde”)=‘a’*324+’b’*323+’c’*322+’d’*32+’e’

Index Hash( const char *key, int TableSize )
{
    unsigned int h = 0;
    while (*key != ‘\0‘)
        h = (h << 5) + *key++;
    return h % TableSize;
}

时间： 2024-12-17 00:01:42

散列表(Hash table)及其构造的相关文章

Java 散列表 hash table

Java 散列表 hash table @author ixenos hash table, HashTable, HashMap, HashSet hash table 是一种数据结构 hash table 为每个对象计算一个整数,该整数被称为散列码 hash code hash code 是由对象的实例域产生的一个整数,具有不同的数据域的对象将产生不同的hash code 如果自定义类,就要负责实现这个类的hashCode方法,注意要与equals方法兼容,即如果a.equals(b)为tr

算法导论-散列表(Hash Table)

目录引言直接寻址散列寻址散列函数除法散列乘法散列全域散列完全散列碰撞处理方法链表法开放寻址法线性探查二次探查双重散列随机散列再散列问题完整源码(C++) 参考资料内容 1.引言如果想在一个n个元素的列表中,查询元素x是否存在于列表中,首先想到的就是从头到尾遍历一遍列表,逐个进行比较,这种方法效率是Θ(n):当然,如果列表是已经排好序的话,可以采用二分查找算法进行查找,这时效率提升到Θ(logn); 本文中,我们介绍散列表(HashTable),能使查找效率

散列表(hash table)——算法导论(13)

1. 引言许多应用都需要动态集合结构,它至少需要支持Insert,search和delete字典操作.散列表(hash table)是实现字典操作的一种有效的数据结构. 2. 直接寻址表在介绍散列表之前,我们前介绍直接寻址表. 当关键字的全域U(关键字的范围)比较小时,直接寻址是一种简单而有效的技术.我们假设某应用要用到一个动态集合,其中每个元素的关键字都是取自于全域U={0,1,-,m-1},其中m不是一个很大的数.另外,假设每个元素的关键字都不同. 为表示动

散列表(hash表)

1. hash表: 又称散列表,以key-value的形式存储数据,能够由key快速定位到其指定的value,而不经过查找.它采用了函数式的映射思想,将记录的存储位置与关键词相关联,从而快速定位进行查找,复杂度为O(1). 2. hash函数: key和value的映射关系称为HASH函数,通过该函数可以计算key所对应的存储位置(表中存储位置,不是实际物理地址),即HASH地址. 构造HASH地址的方法有: (1)直接定址法:取关键词或关键词的某个线性函数为hash地址. (2)平方取中法:关

算法导论11.2散列表Hash tables链式法解决碰撞

/* * IA_11.2ChainedHash.cpp * * Created on: Feb 12, 2015 * Author: sunyj */ #include <stdint.h> #include <iostream> #include <string.h> // CHAINED-HASH-INSERT(T, x) // insert x at the head of list T[h(x.key)] // CHAINED-HASH-SEARCH(T, k)

数据结构之散列表总结

散列表的概念注意: ①由同一个散列函数.不同的解决冲突方法构造的散列表,其平均查找长度是不相同的. ②散列表的平均查找长度不是结点个数n的函数,而是装填因子α(填入表中的记录个数/散列表的槽数 n/m).因此在设计散列表时可选择α以控制散列表的平均查找长度.(平均查找长度=总查找(插入)/记录个数) 通过链接法解决冲突:成功查找的期望查找长度O(1+a), 不成功查找的平均查找长度也为O(1+a). 开放寻址解决冲突:引入探查序列,对于a<

算法——散列表

散列表算法——散列表散列表(hash table):键值(key_value)映射,Python提供的哈希列表实现为字典. 作用: 模拟映射关系便于查找避免重复缓存/记住数据,以免服务器再通过处理来生成它们 # hash_table.py 哈希表 # 避免重复 def vote(li): voters = {} for i in li: if i not in voters: voters[i] = True else: print(i + ' has already voted.')

算法导论之十(十一章散列表11.1-4大数组实现直接寻址方式的字典操作)

11.1-4题目: 我们希望在一个非常大的数组上,通过利用直接寻址的方式来实现一个字典.开始时,该数组中可能包含一些无用信息,但要对整个数组进行初始化是不太实际的,因为该数组的规模太大.请给出在大数组上实现直接寻址字典的方式.每个存储对象占用O(1)空间:SEARCH.INSEART.DELETE操作的时间均为O(1):并且对数据结构初始化的时间为O(1).(提示:可以利用一个附加数组,处理方式类似于栈,其大小等于实际存储在字典中的关键字数目,以帮助确定大数组中某个给定的项是否有效). 想法:

linux内核中的哈希散列表

介绍一下linux内核中的哈希散列表的实现,在linux内核中哈希散列表(hash list)用的非常的多, 并且自己以后在做软件设计的时候,也非常有可能用到.毕竟,哈希散列表在数据的查找过程中非常的方便. linux内核对哈希散列表的实现非常的完美,所以非常有必要学习一下. 在哈希散列表的实现过程中,用到的两个非常有用的结构体: 哈希散列表头结构体 : struct hlist_head