HDU_6194 后缀数组+RMQ

好绝望的。。想了五个多小时，最后还是没A。。。赛后看了下后缀数组瞬间就有了思路。。。不过因为太菜，想了将近两个小时才吧这个题干掉。

首先，应当认为，后缀数组的定义是，某字符串S的所有后缀按照字典序有小到大的顺序排列（使用下标表示后缀）。因为具体过程没太看懂，但是参见刘汝佳蓝书《算法竞赛黑暗圣典》可以得到一个聪明的NLOGN的神器算法。不过这个不太重要。

之后还可以通过他在LCP问题中提到的RANK，height数组相关算法，处理出来height数组，之后其他的可以扔掉。

《黑暗圣典》中定义了height数组，height[k]的含义是，第rank[i]数组和rank[i]-1之间的最长公共前缀的长度。。。基于这个我们可以看到一些规则。

首先height数组的定义具有传递性，很容易想到的就是。。。出现且仅出现M次可以被简单的定义为，传递且仅能够被传递M次。。。

于是。。。我们有了如下算法.

#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
const long long MAXN=400233;
const long long INF=1E8+7;
char s[MAXN];
//long long dp[MAXN];
long long sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n,len;
long long r1ank[MAXN],height[MAXN];
long long d[MAXN][30];
void RMQ_init()
{
    for(int i=0;i<n;++i)d[i][0]=height[i];
    for(int j=1;(1<<j)<=n;j++)
        for(int i=0;i+(1<<j)-1<n;i++)
            d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
long long RMQ(int a,int b)
{
    int k=0;
    while((1<<(k+1))<=b-a+1)k++;
    return min(d[a][k],d[b-(1<<k)+1][k]);
}

int m;
void build_sa(int m)
{
    long long i,*x=t,*y=t2;
    for( i=0;i<m;++i)c[i]=0;
    for( i=0;i<n;++i)c[x[i]=s[i]]++;
    for( i=1;i<m;++i)c[i]+=c[i-1];
    for( i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for( int k=1;k<= n ;k*=2)
    {
        int p=0;
        for(i=n-k;i<n;++i)y[p++]=i;
        for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;

        for( i=0;i<m;++i)c[i]=0;
        for( i=0;i<n;++i)c[x[y[i]]]++;
        for( i=0;i<m;++i)c[i]+=c[i-1];
        for( i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];

        swap(x,y);
        p=1;x[sa[0]]=0;
        for( i=1;i<n;++i)
        {
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        }if(p>=n)break;
            m=p;
    }
}
void getHeight()
{
    int i,j,k=0;
    for(int i=0;i<n;++i)r1ank[sa[i]]=i;
    for(int i=0;i<n;++i)
    {
        if(k)k--;
        int j=sa[r1ank[i]-1];
        while(s[j+k]==s[i+k])k++;
        height[r1ank[i]]=k;
    }
    height[n]=0;
}

int main()
{
    int t;cin>>t;

    while(t--)
    {
//        memset(height,0,sizeof(height));
        scanf("%d %s",&m,s);
        n=strlen(s);
        len=n;n+=1;;
        build_sa(128);
        getHeight();
        RMQ_init();long long ans=0;
        for(int i=0;i<n;++i)
        {
            if(m==1)
            {
                ans+=len-sa[i]-max(height[i],height[i+1]);
                continue;
            }
            int a=i+1;int b=i+m-1;
            long long limit=RMQ(a,b);
            if(n>b&&limit>max(height[i],height[b+1]))ans+=limit-max(height[i],height[b+1]);

        }
        cout<<ans<<"\n";
    }

}

时间： 2024-12-18 22:57:36

HDU_6194 后缀数组+RMQ的相关文章

【uva10829-求形如UVU的串的个数】后缀数组+rmq or 直接for水过

题意:UVU形式的串的个数,V的长度规定,U要一样,位置不同即为不同字串 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=&problem=1770 题解:一开始理解错题意,以为是abcxxxcba(xxx为v),开心地打了后缀数组后发现哎样例不对丫.. UVA的意思是abcxxxabc(xxx为v). 类似poj3693,我们暴

BZOJ 题目3172: [Tjoi2013]单词（AC自动机||AC自动机+fail树||后缀数组暴力||后缀数组+RMQ+二分等五种姿势水过）

3172: [Tjoi2013]单词 Time Limit: 10 Sec Memory Limit: 512 MB Submit: 1890 Solved: 877 [Submit][Status][Discuss] Description 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. Input 第一个一个整数N,表示有多少个单词,接下来N行每行一个单词.每个单词由小写字母组成,N<=200,单词长度不超过10^6

Codeforces Round #422 (Div. 2) E. Liar 后缀数组+RMQ+DP

E. Liar The first semester ended. You know, after the end of the first semester the holidays begin. On holidays Noora decided to return to Vi?kopolis. As a modest souvenir for Leha, she brought a sausage of length m from Pavlopolis. Everyone knows th

SPOJ687---REPEATS - Repeats（后缀数组+RMQ）

A string s is called an (k,l)-repeat if s is obtained by concatenating k>=1 times some seed string t with length l>=1. For example, the string s = abaabaabaaba is a (4,3)-repeat with t = aba as its seed string. That is, the seed string t is 3 charac

HDU2459 后缀数组+RMQ

题目大意: 在原串中找到一个拥有连续相同子串最多的那个子串比如dababababc中的abababab有4个连续的ab,是最多的如果有同样多的输出字典序最小的那个这里用后缀数组解决问题: 枚举连续子串的长度l , 那么从当前位置0出发每次递增l,拿 i 和 i+l 开头的后缀求一个前缀和val , 求解依靠RMQ 得到区间 rank(i),rank(i+l) 那么连续的子串个数应该是val/l+1 但是由于你不一定是从最正确的位置出发,那么我们就需要不断将这个i往前推l位,直到某一位字符不

POJ 3693 后缀数组+RMQ

点击打开链接题意:问连续重复部分最多的串是什么,不能重叠,且我们要字典序最小的串如xbcabcab,有bcabca重复次数为2,cabcab重复次数也为2,那么要前边那个思路:以前写过一个类似的,SPOJ 687,这个只是求连续重复部分最多的串的次数,并不需要将按字典序最小串输出,那么我们可以用到SPOJ687的代码,用它我们可以求出那个重复的次数和满足这个次数的串的长度,那么就只差找到字典序最小的那个串了,而我们知道后缀数组的sa数组就是按字典序来的嘛,从字典序最小开始找,找到就跳出,输出

uva 12338 - Anti-Rhyme Pairs(后缀数组+RMQ)

题目链接:uva 12338 - Anti-Rhyme Pairs 题目大意:给定若干个字符串,每次询问两个字符串的最长公共前缀. 解题思路:本来应该将每个字符串连接起来做后缀数组,但其实可以直接把一个字符串看成是一个字符,然后排序了就对应是SA数组,然后处理height即可.然后根据后缀数组的性质,字符串i和j的最长公共前缀长度即为rank[i]+1~rank[j]之间height的最小值.特判i=j的情况. #include <cstdio> #include <cstring>

【poj3693】Maximum repetition substring（后缀数组+RMQ）

自己看着大牛的论文学了一下后缀数组,看了好久好久,想了好久好久才懂了一点点皮毛TAT 然后就去刷传说中的后缀数组神题,poj3693是进化版的,需要那个相同情况下字典序最小,搞这个搞了超久的说. 先简单说一下后缀数组.首先有几个重要的数组: ·SA数组(后缀数组):保存所有后缀排序后从小到大的序列.[即SA[i]=j表示排名第i的后缀编号为j] ·rank数组(名次数组):记录后缀的名次.[即rank[i]=j表示编号为i的后缀排名第j] 用倍增算法可以在O(nlogn)时间内得出

ZOJ1905Power Strings （KMP||后缀数组+RMQ求循环节）

Given two strings a and b we define a*b to be their concatenation. For example, if a = "abc" and b = "def" then a*b = "abcdef". If we think of concatenation as multiplication, exponentiation by a non-negative integer is defin