UVA 11475 后缀数组/KMP

题目链接:

题意:给定一个只含字母的字符串,求在字符串末尾添加尽量少的字符使得字符串为回文串。

思路:因为只能从末尾添加字符,所以其实求的是最长的后缀回文串。那么添加的字符为除了这个原串的最长后缀回文串之外的其他字符。于是问题就转变成了求字符串的最长后缀回文串,对于后缀数组求回文串子串的做法,将整个字符串反过来写在原字符串后面,中间用一个特殊的字符隔开。这样就把问题变为了求这个新的字符串的某两个后缀的最长公共前缀。奇数长度和偶数长度的分开做。对于求奇数长度,假设现在枚举的位置为i,那么对应在反过来的串的位置为2*len-i。[len为输入字符串的长度,字符串的下标从0开始],求i和2*len-i的最长公共前缀,如果长度等于len-i那么就说话后缀i是回文后缀。 同理偶数长度的位置是i和2*len-i+1。关于求任意两个后缀的最长公共前缀可以用预处理+RMQ的做法。总的复杂度为O(nlogn)

#define _CRT_SECURE_NO_DEPRECATE
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<string>
#include<queue>
#include<vector>
#include<time.h>
#include<cmath>
#include<set>
using namespace std;
typedef long long int LL;
const int MAXN = 100000 * 2 + 10;
int wa[MAXN], wb[MAXN], wv[MAXN], WS[MAXN];
int cmp(int *r, int a, int b, int l)
{
    return r[a] == r[b] && r[a + l] == r[b + l];
}
void da(int *r, int *sa, int n, int m)
{
    int i, j, p, *x = wa, *y = wb, *t;
    for (i = 0; i < m; i++) WS[i] = 0;
    for (i = 0; i < n; i++) WS[x[i] = r[i]]++;
    for (i = 1; i < m; i++) WS[i] += WS[i - 1];
    for (i = n - 1; i >= 0; i--) sa[--WS[x[i]]] = i;
    for (j = 1, p = 1; p < n; j *= 2, m = p)
    {
        for (p = 0, i = n - j; i < n; i++) y[p++] = i;
        for (i = 0; i < n; i++) if (sa[i] >= j) y[p++] = sa[i] - j;
        for (i = 0; i < n; i++) wv[i] = x[y[i]];
        for (i = 0; i < m; i++) WS[i] = 0;
        for (i = 0; i < n; i++) WS[wv[i]]++;
        for (i = 1; i < m; i++) WS[i] += WS[i - 1];
        for (i = n - 1; i >= 0; i--) sa[--WS[wv[i]]] = y[i];
        for (t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i++)
            x[sa[i]] = cmp(y, sa[i - 1], sa[i], j) ? p - 1 : p++;
    }
    return;
}
int Rank[MAXN], height[MAXN], sa[MAXN];
void calheight(int *r, int *sa, int n){
    int i, j, k = 0;
    for (i = 0; i <= n; i++) { Rank[sa[i]] = i; }
    for (i = 0; i < n; height[Rank[i++]] = k){
        for (k ? k-- : 0, j = sa[Rank[i] - 1]; r[i + k] == r[j + k]; k++);
    }
    return;
}
int RMQ[MAXN], mm[MAXN], best[20][MAXN];
void initRMQ(int n){
    int i, j, a, b;
    for (mm[0] = -1, i = 1; i <= n; i++)
        mm[i] = ((i&(i - 1)) == 0) ? mm[i - 1] + 1 : mm[i - 1];
    for (i = 1; i <= n; i++) best[0][i] = i;
    for (i = 1; i <= mm[n]; i++)
        for (j = 1; j <= n + 1 - (1 << i); j++)
        {
        a = best[i - 1][j];
        b = best[i - 1][j + (1 << (i - 1))];
        if (RMQ[a]<RMQ[b]) best[i][j] = a;
        else best[i][j] = b;
        }
    return;
}
int askRMQ(int a, int b){
    int t;
    t = mm[b - a + 1]; b -= (1 << t) - 1;
    a = best[t][a]; b = best[t][b];
    return RMQ[a]<RMQ[b] ? a : b;
}
int lcp(int a, int b){
    int t;
    a = Rank[a]; b = Rank[b];
    if (a>b) { t = a; a = b; b = t; }
    return(height[askRMQ(a + 1, b)]);
}
char str[MAXN];
int r[MAXN], len, lenstr;
void solve(){
    int plr = 1;
    for (int i = 0; i < lenstr; i++){ //奇长度回文
        int idx = 2 * lenstr - i;
        if (idx<len&&lcp(i, idx) >= lenstr - i){
            plr = max(plr, (lenstr - i) * 2 - 1);
        }
    }
    for (int i = 0; i < lenstr; i++){ //偶长度回文
        int idx = 2 * lenstr - i + 1;
        if (idx<len&&lcp(i, idx) >= lenstr - i){
            plr = max(plr, (lenstr - i) * 2);
        }
    }
    printf("%s", str);
    for (int i = lenstr - 1 - plr; i >= 0; i--){
        printf("%c", str[i]);
    }
    printf("\n");
}
int main(){
//#ifdef kirito
//    freopen("in.txt", "r", stdin);
//    freopen("out.txt", "w", stdout);
//#endif
    //    int start = clock();
    while (~scanf("%s", str)){
        lenstr = strlen(str); len = lenstr;
        for (int i = 0; i < lenstr; i++){
            r[i] = str[i];
        }
        r[len++] = 0;
        for (int i = lenstr - 1; i >= 0; i--){
            r[len++] = str[i];
        }
        r[len] = 1;
        da(r, sa, len + 1, 128);
        calheight(r, sa, len);
        for (int i = 1; i <= len; i++){ RMQ[i] = height[i]; }
        initRMQ(len);
        solve();
    }
    //#ifdef LOCAL_TIME
    //    cout << "[Finished in " << clock() - start << " ms]" << endl;
    //#endif
    return 0;
}

思路二:本题也可以用KMP的做法,由于只能在末尾添加字符所以可以用反过来的串和原串进行匹配,看看最后能匹配多次就是最长后缀回文的长度了。对于求回文串不仅仅可以用后缀数组和KMP,HASH,manacher,回文树都是可行的办法,不过这题还是KMP比较容易写而且运行时间明显比后缀数组快

#define _CRT_SECURE_NO_DEPRECATE
#include<iostream>
#include<cstdio>
#include<cstring>
#include<algorithm>
#include<string>
#include<queue>
#include<vector>
#include<time.h>
#include<cmath>
#include<set>
using namespace std;
typedef long long int LL;
const int MAXN = 100000 * 2 + 10;
char str[MAXN], restr[MAXN];
int Next[MAXN], len;
void getNext(char *s, int len){
    int i = 0, j = -1;
    memset(Next, 0, sizeof(Next));
    Next[0] = -1;
    while (i<len){
        if (j == -1 || s[i] == s[j]){
            i++; j++;
            Next[i] = j;
        }
        else{
            j = Next[j];
        }
    }
}
int KMP(char *str, char *restr, int len){
    int j = 0;
    for (int i = 0; i<len; i++){
        while (j != -1 && restr[j] != str[i]){
            j = Next[j];
        }
        if (restr[j] == str[i]){
            j++;
        }
        if (j == -1){
            j = 0;
        }
    }
    return j;
}
int main(){
//#ifdef kirito
//    freopen("in.txt", "r", stdin);
//    freopen("out.txt", "w", stdout);
//#endif
//    int start = clock();
    while (scanf("%s", str) != EOF){
        len = strlen(str);
        for (int i = len - 1; i >= 0; i--){
            restr[len - i - 1] = str[i];
        }
        getNext(restr, len);
        printf("%s", str);
        for (int i = KMP(str, restr, len) ; i<len; i++){
            printf("%c", restr[i]);
        }
        printf("\n");
    }
//#ifdef LOCAL_TIME
//    cout << "[Finished in " << clock() - start << " ms]" << endl;
//#endif
    return 0;
}
时间: 2024-08-05 17:35:02

UVA 11475 后缀数组/KMP的相关文章

Extend to Palindrome UVA - 11475 (后缀数组)

题面就不弄了 题意:给你一个串,让你求出补充最少的字符形成的回文串 思路:思路很好想,就是对一个串,找其最后一个字符(第一个也行)和原串的反串的最长公共前缀,这样就求出了该串中的已有最长回文,然后把剩下部分 倒序添加到原串上即可. 也就是我们可以固定一个位置,即使反串的第一个单词(原串最后一个),然后从该位置向前向后遍历ht数组直到找到一个属于原串即可. 1 #include<cstdio> 2 #include<iostream> 3 #include<cstring>

hdu5442(2015长春赛区网络赛1006)后缀数组+KMP /最小表示法?

题意:给定一个由小写字母组成的长度为 n 的字符串,首尾相连,可以从任意一个字符开始,顺时针或逆时针取这个串(长度为 n),求一个字典序最大的字符串的开始字符位置和顺时针或逆时针.如果有多个字典序最大的字符串,优先选择开始位置靠前的,如果开始位置相同,优先选择顺时针. 这种字符串的问题,第一反应是后缀数组,为了达到首尾相连的目的,所以先复制了一个两倍长的该字符串,然后再将串倒置,也弄成两倍长度,得到顺逆时针的两倍长的串,并对这两个字符串分别做后缀数组,得到 sa 数组(该串字典序第几小的后缀的开

codeforces Round 246 D. Prefixes and Suffixes (后缀数组 || KMP)

题目大意: 求一个子串,子串既是前缀又是后缀. 然后再求出它在整个串中出现的次数. 思路分析: 可以很容易想到如何判断一个串既是前缀又是后缀. 只需要它与 sa[0] 的lcp 等于 整个串的长度减去它的 sa 值. 然后接下来的工作是判断出现了 多少次. 首先我们想到,如果这个子串是目标前后缀. 那么出现过它的子串在sa 中的下标一定比这个串大. 因为它已经是最简的了. 然后可以直接二分求出他出现了多少次. #include <iostream> #include <cstdio>

hdu 5769 Substring 后缀数组 + KMP

http://acm.hdu.edu.cn/showproblem.php?pid=5769 题意:在S串中找出X串出现的不同子串的数目? 其中1 官方题解: 处理出后缀数组中的sa[]数组和height[]数组.在不考虑包含字符X的情况下,不同子串的个数为 如果要求字符X,只需要记录距离sa[i]最近的字符X的位置(用nxt[sa[i]]表示)即可,个数 理解:后缀数组height[i]就是sa[i]与sa[i-1]的LCP,在后缀数组中求解全部的不同子串(之前只写过SAM处理所有不同子串..

UVA 11475 Extend to Palindrome(后缀数组+ST表)

[题目链接] http://acm.hust.edu.cn/vjudge/problem/27647 [题目大意] 给出一个字符串,要求在其后面添加最少的字符数,使得其成为一个回文串.并输出这个回文串. [题解] 用拼接符将原字符串倒序相接,做一遍后缀数组,查询两串相应位置的LCP就是以该点为中心的回文串长度的一半分,奇偶求出所有后缀回文串,保留最长的,则补充部分为剩下的前缀的倒置.至于查询两串的LCP我们可以在height数组建立ST表查询. [代码] #include <cstdio> #

uva 10829 - L-Gap Substrings(后缀数组)

题目链接:uva 10829 - L-Gap Substrings 题目大意:给定一个字符串,问有多少字符串满足UVU的形式,要求U非空,V的长度为g. 解题思路:对字符串的正序和逆序构建后缀数组,然后枚举U的长度l,每次以长度l分区间,在l和l+d+g所在的两个区间上确定U的最大长度. #include <cstdio> #include <cstring> #include <cstdlib> #include <algorithm> using nam

uva 10526 - Intellectual Property(后缀数组)

题目链接:uva 10526 - Intellectual Property 题目大意:给定两个文本,问说下面一个文本中在哪些位置上抄袭了上面个一个文本的,输出n个抄袭位置(不足n个情况全部输出),按照长度优先输出,长度相同的输出位置靠前的. 注意:空格,回车都算一个字符:一段字符只能是抄袭上面的一部分,比如上:NSB*SB 下:NSB 答案:NSB. 解题思路:将两个文本连接在一起,中间用没有出现的字符分割,然后处理处后缀数组,根据height数组的性质,求出哪些位置匹配的长度不为0(注意匹配

uva 11855 - Buzzwords(后缀数组)

题目链接:uva 11855 - Buzzwords 题目大意:给定一个字符串,输出重复子串长度大于1的重复次数(每种长度只算一个次数最多的),并且按照从大到小输出. 解题思路:后缀数组,处理处后缀数组,然后枚举子串长度,按照长度分段即可. #include <cstdio> #include <cstring> #include <vector> #include <algorithm> using namespace std; const int max

uva 261 - The Window Property(后缀数组)

题目链接:uva 261 - The Window Property 题目大意:给定给一个字符串,枚举子串长度k(len≥k≥1),要求在任意k时,有不超过k+1个不同的子串,如果有的话则输出NO,并且输出最早发现不满足的位置. 解题思路:后缀数组,处理出height数组,对于每个k,遍历height数组,碰到小于k的则分段,将整个height分成若干段,即为有多少种长度为k的不同前缀,需要注意的是要跳过前缀长度不足k的. #include <cstdio> #include <cstr