Language L语言

Description
标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的。现在你要处理的就是一段没有标点的文章。
一段文章T是由若干小写字母构成。一个单词W也是由若干小写字母构成。一个字典D是若干个单词的集合。
我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词。
例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的
因为它可以分成4个单词:‘what’, ‘is’, ‘your’, ‘name’,且每个单词都属于字典D,而文章‘whatisyouname’
在字典D下不能被理解,但可以在字典D’=D+{‘you’}下被理解。这段文章的一个前缀‘whatis’,也可以在字典D下被理解
而且是在字典D下能够被理解的最长的前缀。
给定一个字典D,你的程序需要判断若干段文章在字典D下是否能够被理解。
并给出其在字典D下能够被理解的最长前缀的位置。
Input
输入文件第一行是两个正整数n和m,表示字典D中有n个单词,且有m段文章需要被处理。
之后的n行每行描述一个单词,再之后的m行每行描述一段文章。
其中1<=n, m<=20,每个单词长度不超过10,每段文章长度不超过1M。
Output
对于输入的每一段文章,你需要输出这段文章在字典D可以被理解的最长前缀的位置。
Sample Input
4 3
is
name
what
your
whatisyourname
whatisyouname
whaisyourname
Sample Output
14
6
0
//整段文章’whatisyourname’都能被理解
前缀’whatis’能够被理解
没有任何前缀能够被理解

sol:先将字典里的单词放进Trie树,标记下单词的结束位置。

对于每一个询问,我们需要在Trie里找到可被理解的最长前缀。

定义f[i]——表示对于前i位,我们可以在Trie里找到,接下来,我们时要检查[i+1,len]是否可被找到。注意我们要使得i的值尽量大。设置边界f[0]=true,代表第0位可以找到。

如询问"whatisyourname",f[0]=1,我们检查f[1..14]是否在Trie中,先找到w-h-a-t,t为单词结束,此时给f[4]打上标记true,接着检查f[5,14],找到i-s,f[6]=1,继续检查f[7,14],找到y-o-u-r,f[10]=1,接着检查f[11,14],找到n-a-m-e,f[14]=1。因此该询问在字典中可被理解的最长前缀的位置为14.

小结:对于某个询问,我们枚举开始位置到结束位置,若f[i]=1,则检查f[i+1,len]是否为真,逐一去找出最长前缀。

再看一个样例:

代码如下:

 1 #include<cstdio>
 2 #include<cstring>
 3 #include<iostream>
 4 #define re register
 5 #define maxn 1000005
 6 char S[maxn];
 7 int son[505][27],flag[505];
 8 char T[11];
 9 int cnt;
10 bool f[maxn];
11 inline int read()
12 {
13     char c=getchar();
14     int x=0;
15     while(c<‘0‘||c>‘9‘) c=getchar();
16     while(c>=‘0‘&&c<=‘9‘)
17       x=(x<<3)+(x<<1)+c-48,c=getchar();
18     return x;
19 }
20 int n,m;
21 inline void ins()
22 {
23     int len=strlen(T+1);
24     int now=0;
25     for(re int i=1;i<=len;i++)
26     {
27         if(!son[now][T[i]-‘a‘])
28             son[now][T[i]-‘a‘]=++cnt;
29         now=son[now][T[i]-‘a‘];
30     }
31     flag[now]=1;
32 }
33 inline void check(int x,int len)
34 {
35     int now=0;
36     for(re int i=x;i<=len;i++)
37     {
38         if(!son[now][S[i]-‘a‘])
39            return;
40         now=son[now][S[i]-‘a‘]; 
41
42         if(flag[now])
43         //如果这一位是某个单词结束位置,则第I位可以匹配到
44           f[i]=1;
45     }
46 }
47 int main()
48 {
49     n=read();m=read();
50     for(re int i=1;i<=n;i++)
51     {
52         scanf("%s",T+1);
53         ins();
54     }
55     for(re int t=1;t<=m;t++)
56     {
57         scanf("%s",S+1);
58         memset(f,0,sizeof(f));
59         f[0]=1;
60         int len=strlen(S+1);
61         int ans=0;
62         for(re int i=0;i<=len;i++)
63         //枚举开始位置
64         {
65             if(!f[i])
66                 continue;
67             ans=i;//前i位是可以匹配到的
68             check(i+1,len);//从第i+1位到第Len位到TRIE上跑一下
69         }
70         if(!ans) puts("-1");
71         else printf("%d",ans),putchar(10);
72     }
73     return 0;
74 }

原文地址:https://www.cnblogs.com/cutepota/p/12593567.html

时间: 2024-08-28 23:56:48

Language L语言的相关文章

[HNOI2004]Language L语言

2777: [HNOI2004]Language L语言 Time Limit: 10 Sec  Memory Limit: 128 MBSubmit: 10  Solved: 5[Submit][Status][Web Board] Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章.一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的集合.我们称一段文章T在某个字典D下是可以被理解的,

BZOJ 1212: [HNOI2004]L语言( dp + trie )

因为单词很短...用trie然后每次dp暴力查找...用哈希+dp应该也是可以的.... --------------------------------------------------------------------------- #include<cstdio> #include<cstring> #include<cctype> #include<algorithm> #include<bitset> using namespace

1212: [HNOI2004]L语言

1212: [HNOI2004]L语言 Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 643  Solved: 252[Submit][Status] Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的集合. 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部

BZOJ 1212: [HNOI2004]L语言 [AC自动机 DP]

1212: [HNOI2004]L语言 Time Limit: 10 Sec  Memory Limit: 162 MBSubmit: 1367  Solved: 598[Submit][Status][Discuss] Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的集合. 我们称一段文章T在某个字典D下是可以被理解的,是指如果文

【BZOJ1212】L语言(AC自动机)

[BZOJ1212]L语言(AC自动机) 题面 BZOJ 题解 很自然的,既然要匹配单词,那就全部都丢到\(AC\)自动机里面去 现在想想怎么匹配 先是\(AC\)自动机正常的匹配 如果此时这个位置能够匹配上一个串 我们就需要判断一下这个串覆盖到这个文本串中 它的前一位是否恰好被覆盖 如果有的话 我们也不能直接计算 因为可能是其他不同的串拼起来的 所以,就开一个数组差分 表示当前位置可以匹配 最后,对于每个文本串 从前往后扫一遍差分数组 直到有\(0\)的地方就直接输出就行啦 #include<

bzoj1212 L语言

Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的集合. 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词. 例如字典D中包括单词{‘is’, ‘name’, ‘what’, ‘your’},则文章‘whatisyourname’是在字典D下可以被理解的 因为它可以分成4个

BZOJ1212 [HNOI2004]L语言

Description 标点符号的出现晚于文字的出现,所以以前的语言都是没有标点的.现在你要处理的就是一段没有标点的文章. 一段文章T是由若干小写字母构成.一个单词W也是由若干小写字母构成.一个字典D是若干个单词的集合. 我们称一段文章T在某个字典D下是可以被理解的,是指如果文章T可以被分成若干部分,且每一个部分都是字典D中的单词. 例如字典D中包括单词{'is', 'name', 'what', 'your'},则文章'whatisyourname'是在字典D下可以被理解的 因为它可以分成4个

【Trie】bzoj1212 [HNOI2004]L语言

枚举每个文章里已经在Trie中被标记为可能是分割处的字符,然后再从此处跑Trie,继续向后标记.由于单词数很少,因此复杂度可以接受,O(n*m*Len). #include<cstdio> #include<cstring> using namespace std; int n,m,L; char s[1024*1024+100]; int ch[21*11][26]; bool is[21*11],end[1024*1024+100]; int sz; void Insert(c

BZOJ 1212 L语言(DP+字典树)

求能被理解的最长前缀. 很显然的dp.令dp[i]=true,表示前缀i能理解.否则不能理解.那么dp[i+len]=dp[i]=true,当s[len]能匹配str[i,i+len]. 由于模式串长度为10.且匹配过程可以用字典树加速. 所以复杂度就是O(10*m*len). # include <cstdio> # include <cstring> # include <cstdlib> # include <iostream> # include &