hdu 3518 (后缀数组)

题目描述:
  找出一个字符串中至少重复出现两次的字串的个数(重复出现时不能重叠)。

code:

后缀数组处理,对于得到height 进行查找...  参考http://blog.csdn.net/mishifangxiangdefeng/article/details/7109211博主的详细的代码思路

  1     #include<iostream>
  2     #include<string>
  3     using namespace std;
  4     #define N 1200
  5     string s;
  6     int n, sa[4*N], rank[N], height[N];
  7     int buf[4*N], ct[N], sx[N], sax[N];
  8     inline bool leq(int a, int b, int x, int y)
  9     {
 10         return (a < x || a == x && b <= y);
 11     }
 12     inline bool leq(int a, int b, int c, int x, int y, int z)
 13     {
 14         return (a < x || a == x && leq(b, c, y, z));
 15     }
 16     inline int geti(int t, int nx, int sa[])
 17     {
 18         return (sa[t]<nx ? sa[t]*3+1 : (sa[t]-nx)*3+2);
 19     }
 20         //基数排序
 21     static void radix(int a[], int b[], int s[], int n, int k)
 22     { // sort a[0..n-1] to b[0..n-1] with keys in 0..k from s
 23         int i, t, sum;
 24         memset(ct, 0, (k + 1) * sizeof(int));
 25         for (i = 0; i < n; ++i) ct[s[a[i]]]++;
 26         for (i = 0, sum = 0; i <= k; ++i)
 27         {
 28             t = ct[i]; ct[i] = sum; sum += t;
 29         }
 30         for (i = 0; i < n; i++) b[ct[s[a[i]]]++] = a[i];
 31     }
 32
 33     /*
 34     倍增算法,构造后缀数组的最坏时间复杂度为O(nlogn)。
 35     参数:
 36     int *r:待排序的字符串放在 r 数组中 , 从 r[0] 到 r[n-1] , 长度为 n , 且最大值小于 m 。
 37     为了函数操作的方便,约定除r[n-1] 外所有的 r[i] 都大于 0, r[n-1]=0 。
 38     int *sa:函数结束后,结果放在 sa 数组中,从 sa[0] 到 sa[n-1] 。
 39     */
 40     void suffix(int s[], int sa[], int n, int k)
 41     { // !!! require s[n] = s[n+1] = s[n+2] = 0, n >= 2.
 42         int i, j, e, p, t;
 43         int name = 0, cx = -1, cy = -1, cz = -1;
 44         int nx = (n+2)/3, ny = (n+1)/3, nz = n/3, nxz = nx+nz;
 45         int *syz = s + n + 3, *sayz = sa + n + 3;
 46         for (i=0, j=0; i < n + (nx - ny); i++)
 47         if (i%3 != 0) syz[j++] = i;
 48         radix(syz , sayz, s+2, nxz, k);
 49         radix(sayz, syz , s+1, nxz, k);
 50         radix(syz , sayz, s , nxz, k);
 51         for (i = 0; i < nxz; i++)
 52         {
 53             if (s[ sayz[i] ] != cx || s[ sayz[i] + 1 ] != cy ||s[ sayz[i] + 2 ] != cz)
 54             {
 55                 name++; cx = s[ sayz[i] ];
 56                 cy = s[ sayz[i] + 1 ]; cz = s[ sayz[i] + 2 ];
 57             }
 58             if (sayz[i] % 3 == 1) syz[ sayz[i] / 3 ] = name;
 59             else syz[ sayz[i]/3 + nx ] = name;
 60         }
 61         if (name < nxz)
 62         {
 63             suffix(syz, sayz, nxz, name);
 64             for (i = 0; i < nxz; i++) syz[sayz[i]] = i + 1;
 65         }
 66         else
 67         {
 68             for (i = 0; i < nxz; i++) sayz[syz[i] - 1] = i;
 69         }
 70         for (i = j = 0; i < nxz; i++)
 71         if (sayz[i] < nx) sx[j++] = 3 * sayz[i];
 72         radix(sx, sax, s, nx, k);
 73         for (p=0, t=nx-ny, e=0; e < n; e++)
 74         {
 75             i = geti(t, nx, sayz); j = sax[p];
 76             if ( sayz[t] < nx ?leq(s[i], syz[sayz[t]+nx], s[j], syz[j/3]) :
 77                 leq(s[i], s[i+1], syz[sayz[t]-nx+1],
 78             s[j], s[j+1], syz[j/3+nx]) )
 79             {
 80                 sa[e] = i;
 81                 if (++t == nxz)
 82                 {
 83                     for (e++; p < nx; p++, e++)
 84                     sa[e] = sax[p];
 85                 }
 86             }
 87             else
 88             {
 89                 sa[e] = j;
 90                 if (++p == nx) for (++e; t < nxz; ++t, ++e)
 91                 sa[e] = geti(t, nx, sayz);
 92             }
 93         }
 94     }
 95
 96     /*
 97     后缀数组 SA 是一个一维数组,它保存 1..n 的某个排列SA[1],SA[2],……,SA[n],
 98     并且保证 Suffix(SA[i]) < Suffix(SA[i+1]) , 1 ≤ i<n 。
 99     也就是将 S 的 n 个后缀从小到大进行排序之后把排好序的后缀的开头位置顺次放入 SA 中。
100     */
101     void makesa()
102     {
103         memset(buf, 0, 4 * n * sizeof(int));
104         memset(sa, 0, 4 * n * sizeof(int));
105         for (int i=0; i<n; ++i) buf[i] = s[i] & 0xff;
106         suffix(buf, sa, n, 255);
107     }
108
109
110
111     /*
112     名次数组 Rank[i] 保存的是 Suffix(i) 在所有后缀中从小到大 排列的 “ 名次 ” 。
113     容易看出,后缀数组和名次数组为互逆运算。
114     设字符串的长度为 n 。
115     为了方便比较大小,可以在字符串后面添加一个字符,这个字符没有在前面的字符中出现过,而且比前面的字符都要小。
116     在求出名次数组后,可以仅用 O(1) 的时间比较任意两个后缀的大小。
117     在求出后缀数组或名次数组中的其中一个以后,便可以用 O(n) 的时间求出另外一个。
118     任意两个后缀如果直接比较大小,最多需要比较字符 n 次,也就是说最迟在比较第 n 个字符时一定能分出 “ 胜负 ” 。
119     */
120     void getRank()
121     {
122         for(int i = 1;i < n; ++ i)
123             rank[sa[i]] = i;
124     }
125     /*
126     对两个字符串u,v定义函数lcp(u,v)=max{i|u=iv},也就是从头开始顺次比较u和v的对应字符,对应字符持续相等的最大位置,
127     称为这两个字符串的最长公共前缀。
128     对正整数i,j定义LCP(i,j)=lcp(Suffix(SA[i]),Suffix(SA[j])),其中i,j均为1至n的整数。LCP(i,j)也就是后缀数组中第i个
129     和第j个后缀的最长公共前缀的长度。
130     定义一维数组height,令height[i]=LCP(i-1,i),1<i≤n,并设height[1]=0。
131     */
132     void lcp()
133     { // O(4 * N)
134         int i, j, k;
135         for (j = rank[height[i=k=0]=0]; i < n - 1; i++, k++)
136             while (k >= 0 && s[i] != s[ sa[j-1] + k ])
137                 height[j] = (k--), j = rank[ sa[j] + 1 ];
138     }
139     int main()
140     {
141
142         while(cin>>s && s[0] != ‘#‘)
143         {
144             n = s.length() + 1;
145             makesa();
146             getRank();
147             lcp();
148             int ans = 0, minid, maxid;
149             //枚举字串长度h
150             for(int i = 1; i <= (n >> 1); i++)
151             {
152                 minid = 1200, maxid = -1;
153                 //对于每一次的h,利用height数组,找出连续的height大于等于h的里面最左端和最右端得为之l和r。
154                 for(int j = 2; j < n; j++)
155                     if (height[j] >= i)
156                     {
157                         if (sa[j - 1] < minid) minid = sa[j - 1];
158                         if (sa[j - 1] > maxid) maxid = sa[j - 1];
159                         if (sa[j] < minid) minid = sa[j];
160                         if (sa[j] > maxid) maxid = sa[j];
161                     }
162                     else
163                     {
164                         //如果l + h - 1 < r的话,说明没有重叠,答案加1.
165                         if (maxid != -1 && minid + i <= maxid) ans++;
166                         minid = 1200, maxid = -1;
167                     }
168                 //如果l + h - 1 < r的话,说明没有重叠,答案加1.
169                 if (maxid != -1 && minid + i <= maxid) ans++;
170             }
171            cout<<ans<<endl;
172         }
173         return 0;
174     }
时间: 2024-10-14 04:27:23

hdu 3518 (后缀数组)的相关文章

hdu 3518 后缀数组

Boring counting Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 2906    Accepted Submission(s): 1201 Problem Description 035 now faced a tough problem,his english teacher gives him a string,whic

hdu 3948 后缀数组

The Number of Palindromes Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 262144/262144 K (Java/Others)Total Submission(s): 2465    Accepted Submission(s): 841 Problem Description Now, you are given a string S. We want to know how many distin

Hdu 1403(后缀数组)

题目链接 Longest Common Substring Time Limit: 8000/4000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 4077    Accepted Submission(s): 1544 Problem Description Given two strings, you have to tell the length of the Longe

HDU - 3948 后缀数组+Manacher

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3948 题意:给定一个字符串,求字符串本质不同的回文子串个数. 思路:主要参考该篇解题报告 先按照manacher的构造方法改造一遍串,然后跑一遍manacher.求出以i为中心的最长回文串长度p[i]. 然后跑一遍后缀数组,若已经求得后缀sa[i-1]对答案的贡献,然后现在计算后缀sa[i],本来是要加上以sa[i]为中心的回文串的个数p[sa[i]]. 我们可以维护一个tmp,也就是上图中蓝色的框

HDU 6194 后缀数组

题意:求出现恰好 k次的子串(可以重叠)的个数: 分析: 刚开始想到了是后缀数组,但是有什么性质,具体怎么做的没有想到.回到主题来: 连续 k 次,说明这 k 个后缀排序后在一起,每次枚举 长度的为 k 的区间,用RMQ算出最长公共前缀长度,这里就有 len 个子串是 符合满足 k 次的,但是又有可能过短而不止出现了 k次,那么有多少呢? 那么就是 a 不属于,len - height[j+1],前面也一样.也就是每次只算他独有的子串,但是你可能问 len > k 的时候,可以从新组成一组子串!

HDU - 1403 后缀数组初步

题意:求两个串的最长公共子串 两个串连接起来然后求高度数组 注意两个sa值必须分别在不同一侧 本题是用来测试模板的,回想起青岛那次翻车感觉很糟糕 #include<iostream> #include<algorithm> #include<cstdio> #include<cstring> #include<cstdlib> #include<cmath> #include<string> #include<vec

HDU 3518 Boring counting(后缀数组啊 求字符串中不重叠的重复出现至少两次的子串的个数)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3518 Problem Description 035 now faced a tough problem,his english teacher gives him a string,which consists with n lower case letter,he must figure out how many substrings appear at least twice,moreover

后缀数组 --- HDU 3518 Boring counting

Boring counting Problem's Link:   http://acm.hdu.edu.cn/showproblem.php?pid=3518 Mean: 给你一个字符串,让你求出有多少个子串(无重叠)至少出现了两次. analyse: 后缀数组中height数组的运用,一般这个数组用得很少. 总体思路:分组统计的思想:将相同前缀的后缀分在一个组,然后对于1到len/2的每一个固定长度进行统计ans. 首先我们先求一遍后缀数组,并把height数组求出来.height数组代表的

hdu 3518 Boring counting(后缀数组)

Boring counting                                                                       Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Problem Description 035 now faced a tough problem,his english teacher gives him

hdu 3518 Boring counting 后缀数组LCP

题目链接 题意:给定长度为n(n <= 1000)的只含小写字母的字符串,问字符串子串不重叠出现最少两次的不同子串个数; input: aaaa ababcabb aaaaaa # output 2 3 3 思路:套用后缀数组求解出sa数组和height数组,之后枚举后缀的公共前缀长度i,由于不能重叠,所以计数的是相邻height不满足LCP >= i的. 写写对后缀数组倍增算法的理解: 1.如果要sa数组对应的值也是1~n就需要在最后加上一个最小的且不出现的字符'#',里面y[]是利用sa数