HDU 3901 Wildcard

题目:Wildcard

链接:http://acm.hdu.edu.cn/showproblem.php?pid=3901

题意:给一个原串(只含小写字母)和一个模式串(含小写字母、?、* ,*号可替换为0到无穷个任意字母,?可替换为一个任意字母),问两个字符串是否匹配。

思路:

  这是经典题吧。。。

  AC自动机。(网上大多代码是错的,用普通kmp是不行的,不知道修改过后可不可以)。

  HDU已经加强数据了,可我前一个代码abcd ?显示是YES居然还过了,看来数据还是有点弱啊。

  *号的处理是很容易的,只需要把模式串以*号为分界分解开来,然后除了最后一段,其他尽量匹配靠前的原串子串就差不多了,比如ab*cd*ef*gh,那么原串必须以ab开头、gh结尾、然后找到最前的cd、再找到ef,如果互相不重叠就OK。

  比较难的是?的处理了,*分解开模式串分别处理。现在,根据?分解,将分解后的字符串(不含?号了)构建AC自动机。

  比如串A:abcd?abc?cd?abcd,构建AC自动机,然后在结束点记录他在串A中的位置。

  红色为根,黄色为每一个结束点,这里的fail指针与普通AC自动机相同

  现在我们创建一个数组cnt,对应原串的每一位,让原串在自动机上跑,如果遇到黄点cnt[当前位置-记录的值+1]++,比如遇到abcd,那说明原串当前位置前四位一定是abcd,满足这一段,而如果有某一个cnt值等于4,就说明他满足了所有段,那么他可以作为串A匹配的起点,a b c d _ a b c _ c d _ a b c d,只有上面这种情况才会使第一个a的cnt值为4,而cnt等于4,当前位就是该次匹配满足的最前位置了。

  上一段理解后,题目就可以得解了,注意细节就是了。

AC代码:

  1 #include<stdio.h>
  2 #include<string.h>
  3 #include<stdlib.h>
  4 #include<math.h>
  5 #include<set>
  6 #include<map>
  7 #include<list>
  8 #include<stack>
  9 #include<queue>
 10 #include<vector>
 11 #include<string>
 12 #include<iostream>
 13 #include<algorithm>
 14 using namespace std;
 15 #define lson rt<<1
 16 #define rson rt<<1|1
 17 #define N 100010
 18 #define M 26
 19 #define Mod 1000000007
 20 #define LL long long
 21 #define INF 0x7fffffff
 22 #define FOR(i,f_start,f_end) for(int i=f_start;i<=f_end;i++)
 23 #define For(i,f_start,f_end) for(int i=f_start;i<f_end;i++)
 24 #define REP(i,f_end,f_start) for(int i=f_end;i>=f_start;i--)
 25 #define Rep(i,f_end,f_start) for(int i=f_end;i>f_start;i--)
 26 #define MT(x,i) memset(x,i,sizeof(x))
 27 #define gcd(x,y) __gcd(x,y)
 28 const double PI = acos(-1);
 29
 30 struct Node
 31 {
 32   vector<int> d;
 33   int fail;
 34   int next[M];
 35 }v[N];
 36 int vNum;
 37
 38 void Init()
 39 {
 40   v[0].fail = -1;
 41   FOR(i,0,25){
 42     v[0].next[i]=-1;
 43   }
 44   vNum=1;
 45 }
 46
 47 int create()
 48 {
 49   v[vNum].d.clear();
 50   v[vNum].fail=-1;
 51   for(int i=0;i<M;i++) v[vNum].next[i]=-1;
 52   return vNum++;
 53 }
 54
 55 int getPos(char c)
 56 {
 57   return c-‘a‘;
 58 }
 59
 60 int add(char *s)
 61 {
 62   int i,ret=0,p=0;
 63   for(i=0;s[i];i++){
 64     if(s[i]==‘?‘){
 65       if(p!=0){
 66         ret++;
 67         v[p].d.push_back(i);
 68         p=0;
 69       }
 70     }
 71     int pos = getPos(s[i]);
 72     if(v[p].next[pos]==-1) v[p].next[pos]=create();
 73     p = v[p].next[pos];
 74   }
 75   if(p!=0){
 76     ret++;
 77     v[p].d.push_back(i);
 78   }
 79   return ret;
 80 }
 81
 82 queue<int> q;
 83 void makeFail()
 84 {
 85   q.push(0);
 86   while(q.size())
 87   {
 88     int p=q.front();
 89     q.pop();
 90     for(int i=0;i<M;i++)
 91     {
 92       if(v[p].next[i]!=-1)
 93       {
 94         int t=v[p].fail;
 95         while(1)
 96         {
 97           if(t == -1)  // p 已经是根了
 98           {
 99             v[v[p].next[i] ].fail = 0;
100             break;
101           }
102           else if(v[t].next[i] != -1)
103           {
104             v[v[p].next[i] ].fail = v[t].next[i];
105             break;
106           }
107           else t=v[t].fail;
108         }
109         if(t!=-1){
110           for(int j=0;j<v[t].d.size();j++){
111             v[p].d.push_back(v[t].d[j]);
112           }
113         }
114         q.push(v[p].next[i]);
115       }
116     }
117   }
118 }
119
120 int cnt[N];
121 int match(char *s,char *s1)
122 {
123   Init();
124   int duan = add(s1);
125   if(duan==0) return 0;
126
127   makeFail();
128
129   //printf("%s %s %d\n",s,s1,duan);
130
131   memset(cnt,0,sizeof(cnt));
132   int i,p=0;
133   for(i=0;s[i];i++){
134     int pos = getPos(s[i]);
135     if(p==-1){
136       p=0;
137       continue;
138     }
139     if(v[p].next[pos]==-1){
140       p = v[p].fail;
141       i--;
142       continue;
143     }
144     p = v[p].next[pos];
145     for(int j=0;j<v[p].d.size();j++){
146       cnt[i-v[p].d[j]+1]++;
147       if(cnt[i-v[p].d[j]+1]==duan) return i-v[p].d[j]+1;
148     }
149   }
150   return -1;
151 }
152
153 char s[N],s1[N],s2[N];
154 bool solve(char *s,char *s1)
155 {
156   int ls=strlen(s),ps=0;
157   int i,len=0,flag=0;
158   for(i=0;s1[i];i++){
159     if(s1[i]==‘*‘){
160       if(len!=0){
161         s2[len]=0;
162         int qi = match(s+ps,s2);
163         if(qi==-1) return false;
164         if(flag==0 && qi!=0) return false;
165         ps += qi + len;
166         if(ps>ls) return false;
167         len = 0;
168       }
169       flag=1;
170     }
171     else s2[len++]=s1[i];
172   }
173   if(len!=0){
174     len--;
175     for(i=ls-1;i>=ps && len>=0;i--){
176       if(s2[len]!=‘?‘ && s2[len]!=s[i]) return false;
177       len--;
178     }
179     if(i>=ps && flag==0 || len>=0) return false;
180   }
181   return true;
182 }
183
184 int main()
185 {
186   while(scanf("%s%s",s,s1)!=EOF)
187   {
188     printf("%s\n",solve(s,s1)?"YES":"NO");
189   }
190   return 0;
191 }
时间: 2024-10-13 05:29:00

HDU 3901 Wildcard的相关文章

【HDOJ】3901 Wildcard

1. 题目描述有两个长度为$10^5$的字符串,其中一个仅包含小写字母,称之为源串:另一个包含?与*通配符的模式串,并且通配符的个数不超过10.求模式串是否能匹配源串? 2. 基本思路这其实是一道RegularExpression-Matching问题.一般化的解法就是构建自动机,然后去在这个自动机上搜索源串,是否被接收即为答案.这个一般化方法的时间复杂度为$O(|x||y|)$.显然,这里不适用.题目中的限定条件通配符个数不超过10使得,不需要构建完整的自动机.我们可以将模式串$d$改写为$d

HDU 1829/POJ 2492 A Bug&#39;s Life

A Bug's Life Time Limit: 15000/5000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 11981    Accepted Submission(s): 3901 Problem Description Background Professor Hopper is researching the sexual behavior of a rare s

HDU 6203 ping ping ping [LCA,贪心,DFS序,BIT(树状数组)]

题目链接:[http://acm.hdu.edu.cn/showproblem.php?pid=6203] 题意 :给出一棵树,如果(a,b)路径上有坏点,那么(a,b)之间不联通,给出一些不联通的点对,然后判断最少有多少个坏点. 题解 :求每个点对的LCA,然后根据LCA的深度排序.从LCA最深的点对开始,如果a或者b点已经有点被标记了,那么continue,否者标记(a,b)LCA的子树每个顶点加1. #include<Bits/stdc++.h> using namespace std;

HDU 5542 The Battle of Chibi dp+树状数组

题目:http://acm.hdu.edu.cn/showproblem.php?pid=5542 题意:给你n个数,求其中上升子序列长度为m的个数 可以考虑用dp[i][j]表示以a[i]结尾的长度为j的上升子序列有多少 裸的dp是o(n2m) 所以需要优化 我们可以发现dp的第3维是找比它小的数,那么就可以用树状数组来找 这样就可以降低复杂度 #include<iostream> #include<cstdio> #include<cstring> #include

hdu 1207 汉诺塔II (DP+递推)

汉诺塔II Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 4529    Accepted Submission(s): 2231 Problem Description 经典的汉诺塔问题经常作为一个递归的经典例题存在.可能有人并不知道汉诺塔问题的典故.汉诺塔来源于印度传说的一个故事,上帝创造世界时作了三根金刚石柱子,在一根柱子上从下往

[hdu 2102]bfs+注意INF

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2102 感觉这个题非常水,结果一直WA,最后发现居然是0x3f3f3f3f不够大导致的--把INF改成INF+INF就过了. #include<bits/stdc++.h> using namespace std; bool vis[2][15][15]; char s[2][15][15]; const int INF=0x3f3f3f3f; const int fx[]={0,0,1,-1};

HDU 3555 Bomb (数位DP)

数位dp,主要用来解决统计满足某类特殊关系或有某些特点的区间内的数的个数,它是按位来进行计数统计的,可以保存子状态,速度较快.数位dp做多了后,套路基本上都差不多,关键把要保存的状态给抽象出来,保存下来. 简介: 顾名思义,所谓的数位DP就是按照数字的个,十,百,千--位数进行的DP.数位DP的题目有着非常明显的性质: 询问[l,r]的区间内,有多少的数字满足某个性质 做法根据前缀和的思想,求出[0,l-1]和[0,r]中满足性质的数的个数,然后相减即可. 算法核心: 关于数位DP,貌似写法还是

HDU 5917 Instability ramsey定理

http://acm.hdu.edu.cn/showproblem.php?pid=5917 即世界上任意6个人中,总有3个人相互认识,或互相皆不认识. 所以子集 >= 6的一定是合法的. 然后总的子集数目是2^n,减去不合法的,暴力枚举即可. 选了1个肯定不合法,2个也是,3个的话C(n, 3)枚举判断,C(n, 4), C(n, 5) #include <bits/stdc++.h> #define IOS ios::sync_with_stdio(false) using name

hdu 6166 Senior Pan

地址:http://acm.split.hdu.edu.cn/showproblem.php?pid=6166 题目: Senior Pan Time Limit: 12000/6000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 245    Accepted Submission(s): 71 Problem Description Senior Pan fails i