字符串hash算法

http://www.cnblogs.com/zyf0163/p/4806951.html

hash函数对大家来说不陌生吧？

而这次我们就用hash函数来实现字符串匹配。

首先我们会想一下二进制数。

对于任意一个二进制数，我们将它化为10进制的数的方法如下（以二进制数1101101为例）：

hash用的也是一样的原理，为每一个前缀（也可以后缀，笔者习惯1 base，所以喜欢用前缀来计算，Hash[i] = Hash[i - 1] * x + s[i](其中1 < i <= n,Hash[0] = 0)。

一般地，

而对于l - r区间的hash值，则为：

但是如果n很大呢？那样不是会溢出了吗？

因此我们把hash值储存在unsigned long long里面，那样溢出时，会自动取余2的64次方，but这样可能会使2个不同串的哈希值相同，但这样的概率极低（不排除你的运气不好）。

因此我们可以通过Hash值来比较两个字符串是否相等。

给出多项式hash的处理：

typedef unsigned long long ull;
const int N = 100000 + 5;
const ull base = 163;
char s[N];
ull hash[N];

void init(){//处理hash值
    p[0] = 1;
    hash[0] = 0;
    int n = strlen(s + 1);
   for(int i = 1; i <=100000; i ++)p[i] =p[i-1] * base;
   for(int i = 1; i <= n; i ++)hash[i] = hash[i - 1] * base + (s[i] - ‘a‘);
}

ull get(int l, int r, ull g[]){//取出g里l - r里面的字符串的hash值
    return g[r] - g[l - 1] * p[r - l + 1];
}

我们来看到题目吧：传送门

题目大意:

是有一份文件，前面是密文，后面是原文，但那个人接到这个文件后不知道中间从哪里开始是原文，所以你要帮忙还原一下，如果后面原文比密文少，你就将它补全, 第一行是密文转换格式，例如第二个样例表示将q翻译成a,w翻译成b。

思路：

我们只要先把密文都翻译成明文，然后去比较原来的字符串的后缀和翻译之后的字符串前缀的最长匹配长度就行（注：最长匹配的长度不能超过原长的一半）

hash水题（附AC代码）：

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef unsigned long long ull;
const int N = 100000 + 5;
const ull base = 163;
ull Hash1[N], Hash2[N], p[N];

char s[N], t[30], r[N];

int T;

int c[30];

void init(){
    p[0] = 1;
   for(int i = 1; i <=100000; i ++)p[i] =p[i-1] * base;
}

ull get(int l, int r, ull g[]){
    return g[r] - g[l - 1]*p[r - l + 1];
}

void work(){
    for(int i = 0; i < 26; i ++) c[t[i] - ‘a‘] = i;
    //puts(r+1);
    int n = strlen(s + 1);
    Hash1[0] = Hash2[0] = 0;
    for(int i = 1; i <= n; i ++){
        Hash1[i] = Hash1[i - 1] * base + (s[i] - ‘a‘);
        Hash2[i] = Hash2[i - 1] * base + (c[s[i] - ‘a‘]);
    }
    int ans = n;
    for(int i = n; i < n * 2; i ++){
        if(i & 1) continue;
        int tmp = i / 2;
        int len =n - tmp;
        ull s1 = get(1, len, Hash2);
        ull s2 = get(n - len + 1, n, Hash1);
        if(s1 == s2){
            ans = tmp;
            break;
        }
        //printf("%llu %llu\n", s1, s2);
    }
    //printf("ans = %d\n", ans);
    for(int i = 1; i <= ans; i ++)printf("%c", s[i]);
    for(int i = 1; i <= ans; i ++)printf("%c", c[s[i]-‘a‘] + ‘a‘);
    puts("");
}

int main(){
    scanf("%d", &T);
    init();
    while(T--){
        scanf("%s%s", t, s + 1);
        work();
    }
    return 0;
}

时间： 2024-09-26 23:22:27

字符串hash算法的相关文章

记录几个经典的字符串hash算法

记录几个经典的字符串hash算法,方便以后查看: 推荐一篇文章: http://www.partow.net/programming/hashfunctions/# (1)暴雪字符串hash 1 #include <stdio.h> 2 #include <string.h> 3 #include <stdlib.h> 4 #include <stdint.h> 5 #include <stdbool.h> 6 7 #define MAXTABL

转载：字符串hash总结（hash是一门优雅的暴力！）

转载自:远航休息栈字符串Hash总结 Hash是什么意思呢?某度翻译告诉我们: hash 英[hæ?] 美[hæ?]n. 剁碎的食物; #号; 蔬菜肉丁;vt. 把…弄乱; 切碎; 反复推敲; 搞糟; 我觉得Hash是引申出把...弄乱的意思. 今天就来谈谈Hash的一种——字符串hash. 据我的理解,Hash就是一个像函数一样的东西,你放进去一个值,它给你输出来一个值.输出的值就是Hash值.一般Hash值会比原来的值更好储存(更小)或比较. 那字符串Hash就非常好理解了.就是把字符

字符串Hash总结(转载)

转载地址 Hash是什么意思呢?某度翻译告诉我们: hash 英[hæ?] 美[hæ?] n. 剁碎的食物; #号; 蔬菜肉丁; vt. 把…弄乱; 切碎; 反复推敲; 搞糟; 我觉得Hash是引申出把...弄乱的意思. 今天就来谈谈Hash的一种——字符串hash. 据我的理解,Hash就是一个像函数一样的东西,你放进去一个值,它给你输出来一个值.输出的值就是Hash值.一般Hash值会比原来的值更好储存(更小)或比较. 那字符串Hash就非常好理解了.就是把字符串转换成一个整数的函数.而

字符串hash与字典树

title: 字符串hash与字典树 date: 2018-08-01 22:05:29 tags: acm 算法字符串概述这篇主要是关于字符串里的字符串hash 和字符串字典树,,两个都是简单的套模板的东西,,,理解基本思想就行了,,,对了,,还有一个字典树的的变形--01字典树: 字符串hash 如何求一个字符串的hash值字符串hash的作用就是将字符串有效的转化为一个整数 ,,这个转化过程利用的是一个 hash函数例如,,我们选hash函数为 \(hash[i]=(has

hash算法搜索获得api函数地址的实现

我们一般要获得一个函数的地址,通常采用的是明文,例如定义一个api函数字符串"MessageBoxA",然后在GetProcAddress函数中一个字节一个字节进行比较.这样弊端很多,例如如果我们定义一个杀毒软件比较敏感的api函数字符串,那么可能就会增加杀毒软件对我们的程序的判定值,而且定义这些字符串还有一个弊端是占用的字节数较大.我们想想如何我们的api函数字符串通过算法将它定义成一个4字节的值,然后在GetProcAddress中把AddressOfNames表中的每个地址指向的

分布式算法(一致性Hash算法)

一.分布式算法在做服务器负载均衡时候可供选择的负载均衡的算法有很多,包括: 轮循算法(Round Robin).哈希算法(HASH).最少连接算法(Least Connection).响应速度算法(Response Time).加权法(Weighted )等.其中哈希算法是最为常用的算法. 典型的应用场景是: 有N台服务器提供缓存服务,需要对服务器进行负载均衡,将请求平均分发到每台服务器上,每台机器负责1/N的服务. 常用的算法是对hash结果取余数 (hash() mod N ):对机器编号

对一致性Hash算法，Java代码实现的深入研究

一致性Hash算法关于一致性Hash算法,在我之前的博文中已经有多次提到了,MemCache超详细解读一文中"一致性Hash算法"部分,对于为什么要使用一致性Hash算法和一致性Hash算法的算法原理做了详细的解读. 算法的具体原理这里再次贴上: 先构造一个长度为232的整数环(这个环被称为一致性Hash环),根据节点名称的Hash值(其分布为[0, 232-1])将服务器节点放置在这个Hash环上,然后根据数据的Key值计算得到其Hash值(其分布也为[0, 232-1]),接着在

常见hash算法的原理（转）

常见hash算法的原理散列表,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法.顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙. 散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度.这个映射函数叫做散列函数,存放记录的数组叫做散列表. 比如我们存储70个元素,但我们可能为这70个元素申请了100个元素的空间.7

[知识点] 字符串Hash

1.前言字符串的几大主要算法都多少提及过,现在来讲讲一个称不上什么算法, 但是非常常用的东西——字符串Hash. 2.Hash的概念 Hash更详细的概念不多说了,它的作用在于能够对复杂的状态进行简单的表达,更方便的用于判重.在搜索的时候,或是动规的时候,都有过类似的做法.在实际应用中,也是非常重要的,这也就是为什么存在什么暴雪公司的Hash算法等等:加密环节也是Hash的重要之处,MD5码就是一个经典的例子. 字符串Hash的方式多式多样,重点来解释一下最简单的,最常用的. 3.BKDRHa