【后缀数组】uoj#35. 后缀排序

模板

#include<cstdio>
#include<algorithm>
#include<cstring>
using namespace std;
#define N 100001
int sa[N],t[N],t2[N],tong[N],n;
char s[N];
inline bool cmp(int *y,int i,int k)
{
	return (y[sa[i-1]]==y[sa[i]])&&((sa[i-1]+k>=n?-1:y[sa[i-1]+k])==(sa[i]+k>=n?-1:y[sa[i]+k]));
}
//构造字符串s的后缀数组，每个字符值必须为0~m-1，字符串下标为0~n-1
void build_sa(int range)
{
	int *x=t,*y=t2;
	//基数排序
	memset(tong,0,sizeof(int)*range);//清空桶
	for(int i=0;i<n;++i) tong[x[i]=s[i]]++;//把s拷贝到x中，之后插入桶
	for(int i=1;i<range;++i) tong[i]+=tong[i-1];//将桶处理成前缀和
	for(int i=n-1;i>=0;--i) sa[--tong[x[i]]]=i;
	for(int k=1;k<=n;k<<=1)
	  {
	  	int p=0;
	  	//直接利用sa数组排序第二关键字
	  	for(int i=n-k;i<n;++i) y[p++]=i;
	  	for(int i=0;i<n;++i) if(sa[i]>=k) y[p++]=sa[i]-k;
	  	//基数排序第一关键字
	  	memset(tong,0,sizeof(int)*range);
		for(int i=0;i<n;++i) tong[x[y[i]]]++;
		for(int i=0;i<range;++i) tong[i]+=tong[i-1];
		for(int i=n-1;i>=0;--i) sa[--tong[x[y[i]]]]=y[i];
		//根据sa和y数组计算新的x数组
		swap(x,y);
		p=1; x[sa[0]]=0;
		for(int i=1;i<n;++i) x[sa[i]]= cmp(y,i,k) ? p-1 : p++;
		if(p>=n) break;
		range=p;
	  }
}
int rank[N],lcp[N];
void get_lcp()
{
	int k=0;
	for(int i=0;i<n;++i) rank[sa[i]]=i;
	for(int i=0;i<n;++i) if(rank[i])
	  {
	  	if(k) --k;
	  	int j=sa[rank[i]-1];
	  	while(s[i+k]==s[j+k]) ++k;
	  	lcp[rank[i]]=k;
	  }
}
int main()
{
	scanf("%s",s);
	n=strlen(s);
	build_sa(‘z‘+1);
	for(int i=0;i<n;++i) printf("%d ",sa[i]+1);
	puts("");
	if(n>1) get_lcp();
	for(int i=1;i<n;++i) printf("%d ",lcp[i]);
	return 0;
}

时间： 2024-07-29 04:07:12

【后缀数组】uoj#35. 后缀排序的相关文章

uoj #35. 后缀排序

这是一道模板题. 读入一个长度为 n n 的由小写英文字母组成的字符串,请把这个字符串的所有非空后缀按字典序从小到大排序,然后按顺序输出后缀的第一个字符在原串中的位置.位置编号为 1 1 到 n n. 除此之外为了进一步证明你确实有给后缀排序的超能力,请另外输出 n?1 n?1 个整数分别表示排序后相邻后缀的最长公共前缀的长度. 输入格式一行一个长度为 n n 的仅包含小写英文字母的字符串. 输出格式第一行 n n 个整数,第 i i 个整数表示排名为 i i 的后缀的第一个字符在原串中的位

[UOJ#35] [UOJ后缀数组模板题] 后缀排序 [后缀数组模板]

后缀数组,解决字符串问题的有利工具,本题代码为倍增SA算法具体解释详见2009年国家集训队论文 1 #include <iostream> 2 #include <algorithm> 3 #include <cstdio> 4 #include <cstdlib> 5 #include <cstring> 6 #include <cmath> 7 #include <ctime> 8 9 using namespace

【后缀数组】关于后缀数组模板的注解续

int wa[N], wb[N], ws[N], wv[N] int rank[N], height[N] #此处N比输入的N要多1,为人工添加的一个字符,用于避免CMP时越界 void getSA(int *r, int *sa, int n, int m) int i, j, p, *x = wa, *y = wb, *t # bucket清空 for(i = 0; i < m; i++) ws[i] = 0 #进行一次基数排序 for(i = 0; i < n; i++) ws[x[i]

hdu3518---Boring counting(后缀数组，对后缀分组)

Problem Description 035 now faced a tough problem,his english teacher gives him a string,which consists with n lower case letter,he must figure out how many substrings appear at least twice,moreover,such apearances can not overlap each other. Take aa

HDU - 6704 K-th occurrence (后缀数组+主席树/后缀自动机+线段树合并+倍增)

题意:给你一个长度为n的字符串和m组询问,每组询问给出l,r,k,求s[l,r]的第k次出现的左端点. 解法一: 求出后缀数组,按照排名建主席树,对于每组询问二分或倍增找出主席树上所对应的的左右端点,求第k大的下标即可. 1 #include<bits/stdc++.h> 2 using namespace std; 3 typedef long long ll; 4 const int N=1e5+10,mod=998244353; 5 char buf[N]; 6 int s[N],sa[

后缀数组 TYVJ P1860 后缀数组

/*P1860 后缀数组时间: 1000ms / 空间: 131072KiB / Java类名: Main描述我们定义一个字符串的后缀suffix(i)表示从s[i]到s[length(s)]这段子串.后缀数组(Suffix array)SA[i]中存放着一个排列,满足suffix(sa[i])<suffix(sa[i+1]) 按照字典序方式比较定义height[i]表示suffix(sa[i])与suffix(sa[i-1])之间的最长公共前缀长度,其中height[1]=0你的任务就是求出

后缀数组模板 UOJ#35. 后缀排序

从梓轩学姐提交记录那里搞来的,简单易懂,没有那些奇奇怪怪的东西... #include<cstdio> #include<cstring> const int MAXN=100000,D=50; int n,str[MAXN+D]; int sa[MAXN+D],rank[MAXN+D],height[MAXN+D]; int p[MAXN+D],temp[MAXN+D],cnt[MAXN+D]; inline bool equ(int x,int y,int l){return

利用后缀数组构造后缀树

由于蒟蒻azui前段时间忙着准备省选,并在省选中闷声滚大粗,博客停更了好久.. 省选过后整个人各种颓,整天玩玩泥巴什么的... 前段时间学后缀数组的时候上网查相关资料,看到说后缀数组和后缀树是可以相互转化的,并且uoj上有大量通过后缀自动机建出后缀树然后dfs遍历获得后缀数组的模板,但是通过后缀数组来建后缀树的资料确实稀缺. 也许大牛们都觉得这xjbYY一下就可以写了,所以网上没找到对应的代码,那么我来补个坑吧.大牛勿喷.. 先谈谈我的理解吧.. 讲道理后缀数组和后缀树应该是完全等价的,但前两者

利用后缀数组(suffix array)求最长公共子串(longest common substring)

摘要:本文讨论了最长公共子串的的相关算法的时间复杂度,然后在后缀数组的基础上提出了一个时间复杂度为o(n^2*logn),空间复杂度为o(n)的算法.该算法虽然不及动态规划和后缀树算法的复杂度低,但其重要的优势在于可以编码简单,代码易于理解,适合快速实现. 首先,来说明一下,LCS通常指的是公共最长子序列(Longest Common Subsequence,名称来源参见<算法导论>原书第3版p223),而不是公共最长子串(也称为最长公共子串). 最长公共子串问题是在文本串.模式串中寻找共有的