HDU_6194 后缀数组+RMQ

好绝望的。。想了五个多小时,最后还是没A。。。赛后看了下后缀数组瞬间就有了思路。。。不过因为太菜,想了将近两个小时才吧这个题干掉。

首先,应当认为,后缀数组的定义是,某字符串S的所有后缀按照字典序有小到大的顺序排列(使用下标表示后缀)。因为具体过程没太看懂,但是参见刘汝佳蓝书《算法竞赛黑暗圣典》可以得到一个聪明的NLOGN的神器算法。不过这个不太重要。

之后还可以通过他在LCP问题中提到的RANK,height数组相关算法,处理出来height数组,之后其他的可以扔掉。

《黑暗圣典》中定义了height数组,height[k]的含义是,第rank[i]数组和rank[i]-1之间的最长公共前缀的长度。。。基于这个我们可以看到一些规则。

首先height数组的定义具有传递性,很容易想到的就是。。。出现且仅出现M次可以被简单的定义为,传递且仅能够被传递M次。。。

于是。。。我们有了如下算法.

#include<iostream>
#include<stdio.h>
#include<string.h>
using namespace std;
const long long MAXN=400233;
const long long INF=1E8+7;
char s[MAXN];
//long long dp[MAXN];
long long sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n,len;
long long r1ank[MAXN],height[MAXN];
long long d[MAXN][30];
void RMQ_init()
{
    for(int i=0;i<n;++i)d[i][0]=height[i];
    for(int j=1;(1<<j)<=n;j++)
        for(int i=0;i+(1<<j)-1<n;i++)
            d[i][j]=min(d[i][j-1],d[i+(1<<(j-1))][j-1]);
}
long long RMQ(int a,int b)
{
    int k=0;
    while((1<<(k+1))<=b-a+1)k++;
    return min(d[a][k],d[b-(1<<k)+1][k]);
}

int m;
void build_sa(int m)
{
    long long i,*x=t,*y=t2;
    for( i=0;i<m;++i)c[i]=0;
    for( i=0;i<n;++i)c[x[i]=s[i]]++;
    for( i=1;i<m;++i)c[i]+=c[i-1];
    for( i=n-1;i>=0;i--)sa[--c[x[i]]]=i;
    for( int k=1;k<= n ;k*=2)
    {
        int p=0;
        for(i=n-k;i<n;++i)y[p++]=i;
        for(i=0;i<n;++i)if(sa[i]>=k)y[p++]=sa[i]-k;

        for( i=0;i<m;++i)c[i]=0;
        for( i=0;i<n;++i)c[x[y[i]]]++;
        for( i=0;i<m;++i)c[i]+=c[i-1];
        for( i=n-1;i>=0;i--)sa[--c[x[y[i]]]]=y[i];

        swap(x,y);
        p=1;x[sa[0]]=0;
        for( i=1;i<n;++i)
        {
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        }if(p>=n)break;
            m=p;
    }
}
void getHeight()
{
    int i,j,k=0;
    for(int i=0;i<n;++i)r1ank[sa[i]]=i;
    for(int i=0;i<n;++i)
    {
        if(k)k--;
        int j=sa[r1ank[i]-1];
        while(s[j+k]==s[i+k])k++;
        height[r1ank[i]]=k;
    }
    height[n]=0;
}

int main()
{
    int t;cin>>t;

    while(t--)
    {
//        memset(height,0,sizeof(height));
        scanf("%d %s",&m,s);
        n=strlen(s);
        len=n;n+=1;;
        build_sa(128);
        getHeight();
        RMQ_init();long long ans=0;
        for(int i=0;i<n;++i)
        {
            if(m==1)
            {
                ans+=len-sa[i]-max(height[i],height[i+1]);
                continue;
            }
            int a=i+1;int b=i+m-1;
            long long limit=RMQ(a,b);
            if(n>b&&limit>max(height[i],height[b+1]))ans+=limit-max(height[i],height[b+1]);

        }
        cout<<ans<<"\n";
    }

}
时间: 2024-12-18 22:57:36

HDU_6194 后缀数组+RMQ的相关文章

【uva10829-求形如UVU的串的个数】后缀数组+rmq or 直接for水过

题意:UVU形式的串的个数,V的长度规定,U要一样,位置不同即为不同字串 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=&problem=1770 题解:一开始理解错题意,以为是abcxxxcba(xxx为v),开心地打了后缀数组后发现哎样例不对丫.. UVA的意思是abcxxxabc(xxx为v). 类似poj3693,我们暴

BZOJ 题目3172: [Tjoi2013]单词(AC自动机||AC自动机+fail树||后缀数组暴力||后缀数组+RMQ+二分等五种姿势水过)

3172: [Tjoi2013]单词 Time Limit: 10 Sec  Memory Limit: 512 MB Submit: 1890  Solved: 877 [Submit][Status][Discuss] Description 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. Input 第一个一个整数N,表示有多少个单词,接下来N行每行一个单词.每个单词由小写字母组成,N<=200,单词长度不超过10^6

Codeforces Round #422 (Div. 2) E. Liar 后缀数组+RMQ+DP

E. Liar The first semester ended. You know, after the end of the first semester the holidays begin. On holidays Noora decided to return to Vi?kopolis. As a modest souvenir for Leha, she brought a sausage of length m from Pavlopolis. Everyone knows th

SPOJ687---REPEATS - Repeats(后缀数组+RMQ)

A string s is called an (k,l)-repeat if s is obtained by concatenating k>=1 times some seed string t with length l>=1. For example, the string s = abaabaabaaba is a (4,3)-repeat with t = aba as its seed string. That is, the seed string t is 3 charac

HDU2459 后缀数组+RMQ

题目大意: 在原串中找到一个拥有连续相同子串最多的那个子串 比如dababababc中的abababab有4个连续的ab,是最多的 如果有同样多的输出字典序最小的那个 这里用后缀数组解决问题: 枚举连续子串的长度l , 那么从当前位置0出发每次递增l,拿 i 和 i+l 开头的后缀求一个前缀和val , 求解依靠RMQ 得到区间 rank(i),rank(i+l) 那么连续的子串个数应该是val/l+1 但是由于你不一定是从最正确的位置出发,那么我们就需要不断将这个i往前推l位,直到某一位字符不

POJ 3693 后缀数组+RMQ

点击打开链接 题意:问连续重复部分最多的串是什么,不能重叠,且我们要字典序最小的串如xbcabcab,有bcabca重复次数为2,cabcab重复次数也为2,那么要前边那个 思路:以前写过一个类似的,SPOJ 687,这个只是求连续重复部分最多的串的次数,并不需要将按字典序最小串输出,那么我们可以用到SPOJ687的代码,用它我们可以求出那个重复的次数和满足这个次数的串的长度,那么就只差找到字典序最小的那个串了,而我们知道后缀数组的sa数组就是按字典序来的嘛,从字典序最小开始找,找到就跳出,输出

uva 12338 - Anti-Rhyme Pairs(后缀数组+RMQ)

题目链接:uva 12338 - Anti-Rhyme Pairs 题目大意:给定若干个字符串,每次询问两个字符串的最长公共前缀. 解题思路:本来应该将每个字符串连接起来做后缀数组,但其实可以直接把一个字符串看成是一个字符,然后排序了就对应是SA数组,然后处理height即可.然后根据后缀数组的性质,字符串i和j的最长公共前缀长度即为rank[i]+1~rank[j]之间height的最小值.特判i=j的情况. #include <cstdio> #include <cstring>

【poj3693】Maximum repetition substring(后缀数组+RMQ)

自己看着大牛的论文学了一下后缀数组,看了好久好久,想了好久好久才懂了一点点皮毛TAT 然后就去刷传说中的后缀数组神题,poj3693是进化版的,需要那个相同情况下字典序最小,搞这个搞了超久的说. 先简单说一下后缀数组.首先有几个重要的数组: ·SA数组(后缀数组):保存所有后缀排序后从小到大的序列.[即SA[i]=j表示排名第i的后缀编号为j]        ·rank数组(名次数组):记录后缀的名次.[即rank[i]=j表示编号为i的后缀排名第j] 用倍增算法可以在O(nlogn)时间内得出

ZOJ1905Power Strings (KMP||后缀数组+RMQ求循环节)

Given two strings a and b we define a*b to be their concatenation. For example, if a = "abc" and b = "def" then a*b = "abcdef". If we think of concatenation as multiplication, exponentiation by a non-negative integer is defin