128 哈希函数

原题网址：https://www.lintcode.com/problem/hash-function/description

描述

在数据结构中，哈希函数是用来将一个字符串（或任何其他类型）转化为小于哈希表大小且大于等于零的整数。一个好的哈希函数可以尽可能少地产生冲突。一种广泛使用的哈希函数算法是使用数值33，假设任何字符串都是基于33的一个大整数，比如：

hashcode("abcd") = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZE

= (97* 333 + 98 * 332 + 99 * 33 +100) % HASH_SIZE

= 3595978 % HASH_SIZE

其中HASH_SIZE表示哈希表的大小(可以假设一个哈希表就是一个索引0 ~ HASH_SIZE-1的数组)。

给出一个字符串作为key和一个哈希表的大小，返回这个字符串的哈希值。

您在真实的面试中是否遇到过这个题？是

说明

For this problem, you are not necessary to design your own hash algorithm or consider any collision issue, you just need to implement the algorithm as described.

样例

对于key="abcd" 并且 size=100，返回 78

标签

哈希表

思路：哈希函数的实现算法题目已经给出了，照着实现就好。这题考察的是类似大数阶乘的数据溢出问题，如果直接将字符串转成整数再求余，emmm……一般会溢出。所以在将字符串逐个字符转成整数的过程中就应该取余防止数据过大。

对于整数求模，(a * b) % m = a % m * b % m这个基本公式务必牢记。根据这个公式我们可以大大降低时间复杂度和规避溢出。转载至此处

具体实现方式可以从高位（权值大的）到低位（权值小的）依次转化，也可以从低位到高位依次转化，后者需要额外定义一个权值，每次循环时*33，权值也同样需要取余。

AC代码（高位到低位）：

class Solution {
public:
    /**
     * @param key: A string you should hash
     * @param HASH_SIZE: An integer
     * @return: An integer
     */
    int hashCode(string &key, int HASH_SIZE) {
        // write your code here
     int n=key.size();
     if (n==0)
     {
         return 0;
     }
     long result=key[0];//注意数据类型是long，防止数据过大造成溢出;
     for (int i=1;i<n;i++)
     {
         result=result*33+key[i];
         result=result%HASH_SIZE;//及时求余防溢出;
     }
     return result;
    }
};

低位到高位代码：

 int hashCode(string &key, int HASH_SIZE)
 {
     int n=key.size();
     if (n==0)
     {
         return 0;
     }
     long result=0;//注意数据类型;
     long hashBase=1;//权值,注意数据类型;
     for (int i=n-1;i>=0;i--)
     {
         result=result+key[i]*hashBase;
         result=result%HASH_SIZE;//及时求余防溢出;
         hashBase=hashBase*33%HASH_SIZE;//及时求余防溢出;
     }
     return result;
 }

参考：https://blog.csdn.net/nawuyao/article/details/50953557

https://www.cnblogs.com/libaoquan/p/7217165.html

https://www.jianshu.com/p/9a67268b5a94

https://blog.csdn.net/outmain/article/details/51233385

https://blog.csdn.net/ljlstart/article/details/48391799

原文地址：https://www.cnblogs.com/Tang-tangt/p/9140858.html

时间： 2024-07-28 12:23:56