看数据结构写代码（61）哈希表

前面说的各种查找都是基于 “比较” 的基础来进行查找的。查找的效率要看比较的次数。那么有没有不需要比较，就可以找到想要的数据的方法呢？

哈希表就是这样的一种方法，它用数组作为保存关键字的数据原型，通过一个哈希函数f(k)，来找到关键字存储的位置，从而找到想要的信息。

例如我们想要解决这样的一个问题：

假设这有一个各种字母组成的字符串，假设这还有另外一个字符串，而且这个字符串里的字母数相对少一些。什么方法能最快的查出所有小字符串里的字母在大字符串里都有？

比如，如果是下面两个字符串：

String
1: ABCDEFGHLMNOPQRS

String
2: DCGSRQPOM

我们
可以用一个分配一个 26 个 int 型的整形数组 a，将 0~25 分别代表 A~Z 是否出现，如果出现则值为 1，没有出现
值为0.

则
我们只需遍历 String1，然后将对应的元素设置为1，然后遍历 String2 ，如果查找过程中，遇到了 0 值，则不是
。否则 String2
的字母在 String1 中都存在。

哈希表虽然快速，但是其数据原型基于数组，同样有缺陷。

当查找的元素集合太大，不同的关键字，却得到同样的地址。即 k1 != k2,， F(K1) = = F(K2)，这时叫做冲突。冲突是无法避免的。只能通过一些方法减少冲突。当我们插入元素时，寻找插入位置，造成的冲突次数太多，影响查找效率，我们只能重新建表，这是个费时的过程。

而且哈希是无法按从小到大遍历数据的。

所以我们在用哈希的时候得考虑这些：

1.哈希函数

2冲突函数

3初始表长

4冲突多少次，我们就重新建表,

5.是否需要顺序遍历。

下面代码用的是

哈希函数：除整取余法

冲突函数：开发定址法（线性）

冲突次数到达表长的一半就重新建表。

哈希表基本结构，初始化和销毁

#include "stdafx.h"
#include <cstdlib>
int hashSize[] = {11,13,17,19};//哈希表容量增加 数组.

#define NULL_KEY	0
struct HashTable{
	int * base;//数据的基址
	int count;//表的数量
	int sizeIndex;//表的容量大小的索引
};

void initHash(HashTable * t){
	t->sizeIndex =0;
	t->base = (int *)calloc(hashSize[t->sizeIndex],sizeof(int));
	t->count = 0;
}

void destoryHash(HashTable * t){
	free(t->base);
	t->base = NULL;
	t->sizeIndex = 0;
	t->count = 0;
}

哈希函数：

//除留余数法
int hash(HashTable t,int key){
	return key % hashSize[t.sizeIndex];
}

冲突函数：

//开发定址 线性探索解决冲突法
int collision(HashTable t,int key,int times){
	return (key + times) % hashSize[t.sizeIndex];
}

查找函数：

int search(HashTable t,int key,int * index,int *ctimes){
	*index = hash(t,key);
	*ctimes = 0;
	while (t.base[*index] != NULL_KEY && t.base[*index] != key){
		(*ctimes)++;
		*index = collision(t,key,*ctimes);
	}
	printf("------------查找%d, 查找了%d次--------------\n",key,*ctimes+1);
	if (t.base[*index] == key){
		return t.base[*index];
	}
	else{
		return NULL_KEY;
	}
}

插入关键字，以及重建表函数：

void reCreateHashTable(HashTable * t,int key);
void insertHash(HashTable *t,int key){
	int index;//插入位置
	int	ctimes;//冲突次数
	int result = search(*t,key,&index,&ctimes);
	if (result == NULL_KEY && ctimes < hashSize[t->sizeIndex]/2){//没找到
		t->base[index] = key;
		t->count ++;
	}
	else{//重新建表
		reCreateHashTable(t,key);
	}
}

//
void reCreateHashTable(HashTable * t,int key){
	printf("--------------重建哈希表----------------\n");
	int * oldBase = t->base;//保存老空间.
	int oldSize = hashSize[t->sizeIndex];//老空间的容量大小
	t->sizeIndex++;
	int newSize = hashSize[t->sizeIndex];//新空间大小
	t->base = (int *) calloc(newSize,sizeof(int));//新空间
	//插入之前将 表的数量置0
	t->count = 0;
	for (int i = 0; i < oldSize; i++){
		if (oldBase[i] != NULL_KEY){
			insertHash(t,oldBase[i]);
		}
	}
	free(oldBase);//释放老空间
	insertHash(t,key);//插入冲突的关键字.
}

测试函数：

static int testArray[10] = {1,18,7,55,23,45,98,76,35,29};

int _tmain(int argc, _TCHAR* argv[])
{
	HashTable table;
	initHash(&table);
	for (int i = 0; i < 10; i++){
		insertHash(&table,testArray[i]);
	}
	int index ,count;
	for (int i = 0; i < 10; i++){
		search(table,testArray[i],&index,&count);
	}
	destoryHash(&table);
	return 0;
}

代码工程文件网盘地址：http://pan.baidu.com/s/1kToXLcj

时间： 2024-08-28 07:01:15

看数据结构写代码（61）哈希表的相关文章

看数据结构写代码（32) 赫夫曼树编码以及译码

杂谈:最近有点慵懒,不好不好.好几天都没写代码,原本准备上星期完结树这一章节的.现在又耽误了.哎.要抓紧时间啊. 下面直接上代码: 可以到我的网盘下载源代码,或者直接拷贝下面的源代码运行网盘地址:点击打开链接 // HuffmanTree.cpp : 定义控制台应用程序的入口点. //哈弗曼编码,译码 #include "stdafx.h" #include <stdlib.h> #include <cstring> enum E_State { E

看数据结构写代码（36）图的邻接表表示与实现

图的邻接表表示法,是为每一个顶点建立一个链表,链表里存放着相同弧尾的弧的信息,这些链表顺序存放在数组中.下面是无向图g2的邻接表邻接表比邻接矩阵节省空间,同时也带来一些操作上的不便,例如看两个顶点是否相邻,需要遍历链表,在求无向图顶点的度时,只需遍历顶点的链表,而求有向图顶点的度需要遍历整个图查找弧头为这个顶点的个数. 如果不想这样做,可以建立逆邻接表,即链表里存放着相同弧头的弧的信息. 下一节要说的十字链表类似于这种结

看数据结构写代码（52）广义表的扩展线性链表存储表示

广义表的另一种存储结构是扩展线性链表存储表示,这种存储结构的根节点必存在,并且根节点的表尾为空,将根节点的表尾放在表头的表尾指针上. 这样从表头一直就可以遍历所有同级节点. 具体j结构如下: 例如下面的广义表 ,用扩展线性链表表示为: 而头尾存储表示,是把表头和表尾都放在根节点的指针上.其存储结构如下: 所以其实现代码略有不同,要小心处理下面上代码: // GList2.cpp : 定义控制台应用

看数据结构写代码（51）广义表

广义表是一种非线性的数据结构.但如果广义表的每个元素都是原子,它就变成了线性表.广义表广泛地用于人工智能等领域的LISP语言. 广义表一般记作 LS = (a1, a2, ···, an), n是它的长度,ai可以是单个元素(原子),也可以是广义表(子表),当广义表非空时,称第一个元素a1为LS的表头,称其余元素组成的表为LS的表尾.注意:表头是元素(可以是原子,也可以是广表),表尾一定是广义表.E=(a, E)是一个递归的表.D=(( ),(e),(a,(b,c,d)))是多层次的广义表,长度

看数据结构写代码（38）图的邻接多重表表示法与实现

图的邻接多重表是无向图的另一种表示法.其与邻接表的差别仅仅在于 ,邻接表用两个顶点来表示一条边,而邻接多重表用一个顶点来表示一条边.这样使得邻接多重表在某些操作要来的方便.例如将搜索过的边做记号或者删除一条边. 下面是邻接多重表的结构: 下面的 6条边用 6个弧节点表示,用12个指针指向,每个弧节点被指向2次.这样使得我们在释放内存的时候需要格外小心. 下面上代码: 源码工程文件网盘地址:点击打开链接 // AMLGraph.cp

看数据结构写代码（53）静态查找表（线性查找，二分查找，斐波那契查找，插值查找）

查找定义:根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录). 查找表分类:静态查找表和动态查找表. 静态查找表:只查找,而不进行插入,删除. 动态查找表:在查找过程中同时插入查找表中不存在的数据元素,或者从查找表中删除已经存在的某个数据元素. 静态表的查找大致四种算法: 线性查找,二分查找,斐波那契查找和插值查找. 其中在线性查找之前,对表无要求.对于其余三种需要在查找之前排序.插值查找除了需要排序,还需要均匀分布. 下面给出代码: 线性查

看数据结构写代码（50）伙伴系统

伙伴系统是一种只可以分配 2的幂次方个空间的 ,回收内存时只合并 "伙伴空间" 的一种动态内存管理方式. 例如一个空间大小为 64 的内存,伙伴系统为这 64 的内存建立一组双向循环链表,分别管理着 2的 0 次方,2的1 次方幂,2的 2 次方幂...2的6次方幂的可用空间. 即使我们只想分配一个大小为3的空间,系统却只能返回一个内存大小为 4(2的2次方)的一个空间. 系统在初始化的时候 ,并

看数据结构写代码（15）链式队列的实现

队列和栈是一种受限制的线性表.所以他们的实现方式都相差无几.之前有过链栈和链式线性表的实现经验,自然写链队 ,也毫无问题. 下面详细讲解每一段代码的技术要点下面是队列节点的数据结构 struct QueueNode { ElementType data; QueueNode * next; }; //生成一个节点 QueueNode * queueNodeMake(ElementType data){ QueueNode * pNode = (Queue

看数据结构写代码（44）判断无向图是否有环路

在看严蔚敏的数据结构一书 7.5小节时,书上说" 判断有向图是否存在环要不无向图复杂.对于无向图来说,深度优先遍历过程中遇到回边(即指向已访问过的顶点的边),则必定存在环路". 看的不明白,所以网上百度了一下. 有了思路:故写下算法和思路,以便以后温故. 思路: 1.一个n个顶点,e条边的无向图,若 e>= n,必有环路. 2.若 e < n ,需要深度遍历,并把父节点传入参数中,如果遇到一个节点被访问过并且不是父节点,那么就有环

看数据结构写代码（61） 哈希表

看数据结构写代码（61） 哈希表的相关文章

看数据结构写代码（61）哈希表

看数据结构写代码（61）哈希表的相关文章