【C/C++】字典树

引用书籍:《算法竞赛入门到进阶》清华大学出版社

字符串匹配问题

  • 有这样一个字符串的问题:在n个字符串中查找某个字符串是否存在?
  • 如果使用暴力的做法,逐个来匹配每个字符串,复杂度是O(nm),m是字符串的平均长度,这种做法效率很低。
  • 字典树:在上述问题中,如果像查字典一样,比如要查找单词"dog",先翻到字典中d对应的部分,再按顺序查找‘o‘和‘g‘。效率要高很多,字典树就是模拟这种操作的数据结构。

例题(hdu 1251)

  • 用map实现:
#include<bits/stdc++.h>

using namespace std;

int main(){
    char str[12];
    map<string, int>m;
    while(fgets(str, 12, stdin)){ //也可以使用gets函数读入字符串,循环体的内容需要做微小的改动
        int len = strlen(str);
        if(len==1) break;
        for(int i=len-1; i>0; i--){
            str[i] = '\0';
            m[str]++;
        }
    }
    while(~scanf("%s",str)) printf("%d\n",m[str]);
    return 0;
}
  • 用字典树实现(数组)
#include<bits/stdc++.h>

using namespace std;

const int maxn = 5e4 + 10;
int tire[maxn*10][26];
int book[maxn*10];
int cnt;

void Insert(char *str){
    int len = strlen(str);
    int root = 0;
    for(int i=0; i<len; i++){
        int id = str[i] - 'a';
        if(!tire[root][id]) tire[root][id] = ++cnt;
        root = tire[root][id];
        book[root]++;
    }
}

int Find(char *str){
    int len = strlen(str);
    int root = 0;
    for(int i=0; i<len; i++){
        int id = str[i] - 'a';
        if(!tire[root][id]) return 0;
        root = tire[root][id];
    }
    return book[root];
}

int main(){
    cnt = 0;
    memset(tire, 0, sizeof(tire));
    memset(book, 0, sizeof(book));
    char str[12];
    while(gets(str)){
        if(!strlen(str)) break;
        Insert(str);
    }
    while(gets(str)) printf("%d\n",Find(str));
    return 0;
}
  • 字典树还可以使用结构体指针来实现,但是空间复杂度相比于数组要差一些,因此并不常用,在此题中也会MLE
#include<bits/stdc++.h>

using namespace std;

struct Trie{
    Trie * next[26];
    int num;
    Trie(){
        for(int i=0; i<26; i++) next[i] = NULL;
        num = 0;
    }
};
Trie root;

void Insert(char *str){
    int len = strlen(str);
    Trie *p = &root;
    for(int i=0; i<len; i++){
        int id = str[i] - 'a';
        if(p->next[id] == NULL)
            p->next[id] = new Trie;
        p = p->next[id];
        p->num++;
    }
}

int Find(char *str){
    Trie *p = &root;
    for(int i=0; str[i]; i++){
        int id = str[i] - 'a';
        if(p->next[id] == NULL)
            return 0;
        p = p->next[id];
    }
    return p->num;
}

int main(){
    char str[12];
    while(gets(str)){
        if(!strlen(str)) break;
        Insert(str);
    }
    while(gets(str)) printf("%d\n",Find(str));
    return 0;
} 

原文地址:https://www.cnblogs.com/sdutzxr/p/12430994.html

时间: 2024-11-05 18:56:56

【C/C++】字典树的相关文章

hdu 1251 统计难题(字典树)

Problem Description Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀). Input 输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串. 注意:本题只有一组测试数据,处理到文件结束. Output 对于每个提

51nod round3# 序列分解(折半枚举+字典树)

小刀和大刀是双胞胎兄弟.今天他们玩一个有意思的游戏. 大刀给小刀准备了一个长度为n的整数序列.小刀试着把这个序列分解成两个长度为n/2的子序列. 这两个子序列必须满足以下两个条件: 1.他们不能相互重叠. 2.他们要完全一样. 如果小刀可以分解成功,大刀会给小刀一些糖果. 然而这个问题对于小刀来说太难了.他想请你来帮忙. Input 第一行给出一个T,表示T组数据.(1<=T<=5) 接下来每一组数据,输入共2行. 第一行包含一个整数n (2<=n<=40且为偶数). 第二行给出n

白话算法与数据结构之【字典树】

1. 什么是trie树 1.Trie树 (特例结构树) Trie树,又称单词查找树.字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树结构.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高.      Trie的核心思想是空间换时间.利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的. Trie树也有它的缺点,Trie树的内存消耗非常大.当然,或许用左儿子

[算法系列之二十]字典树(Trie)

一 概述 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计. 二 优点 利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希表高. 三 性质 (1)根节点不包含字符,除根节点外每一个节点都只包含一个字符: (2)从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串: (3)每个节点的所有子节点包含的字符都不相同. 单词列表为"apps&

poj 3764 The xor-longest Path(字典树)

题目链接:poj 3764 The xor-longest Path 题目大意:给定一棵树,每条边上有一个权值,找出一条路径,使得路径上权值的亦或和最大. 解题思路:dfs一遍,预处理出每个节点到根节点路径的亦或和rec,那么任意路径均可以表示rec[a] ^ rec[b],所以问题 就转换成在一些数中选出两个数亦或和最大,那么就建立字典树查询即可. #include <cstdio> #include <cstring> #include <algorithm> us

字典树

字典树(Trie)是一种很特别的树状信息检索数据结构,如同其名,它的构成就像一本字典,可以让你快速的进行字符插入.字符串搜索等. Trie 一词来自 retrieval,发音为 /tri:/ "tree",也有人读为 /tra?/ "try". 字典树设计的核心思想是空间换时间,所以数据结构本身比较消耗空间.但它利用了字符串的共同前缀(Common Prefix)作为存储依据,以此来节省存储空间,并加速搜索时间.Trie 的字符串搜索时间复杂度为 O(m),m 为最

字典树的简单实现

Trie树,又称为字典树,是一种树形结构,是一种哈希树的变种,是一种用于快速检索的多叉树数据结构. 用于保存大量的字符串.它的优点是:利用字符串的公共前缀来节约存储空间. Trie的核心思想是空间换时间.利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的. 它有3个基本性质: 1.根节点不包含字符,除根节点外每一个节点都只包含一个字符. 2.从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串. 3.每个节点的所有子节点包含的字符都不相同. 搜索字典项目的方法为: (1)

跳跃表,字典树(单词查找树,Trie树),后缀树,KMP算法,AC 自动机相关算法原理详细汇总

第一部分:跳跃表 本文将总结一种数据结构:跳跃表.前半部分跳跃表性质和操作的介绍直接摘自<让算法的效率跳起来--浅谈"跳跃表"的相关操作及其应用>上海市华东师范大学第二附属中学 魏冉.之后将附上跳跃表的源代码,以及本人对其的了解.难免有错误之处,希望指正,共同进步.谢谢. 跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找.插入.删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领.而且最重要的一点,就是它的编程复杂度较同类

uva 1385 - Billing Tables(字典树)

题目链接:uva 1385 - Billing Tables 题目大意:给定n个电话前缀,每个前缀是一个区域的前缀,现在要生成一个新的电话单,即对于每个电话号码,从旧的电话单上从前向后遍历,如果出现前缀匹配,则该电话号码对应的即为当前的区号,要求生成的新电话单尽量小. 解题思路:用dfs建立字典树,在区间范围内的点对应均为对应的区号,注意如果70.71.72....79都为SB的话,那么可以合并成7,并且对应区号为SB. 注意合并的条件为区号相同即可,并不是说对应旧电话单匹配位置相同. 注意这组

trie树(字典树)

1. trie树,又名字典树,顾名思义,它是可以用来作字符串查找的数据结构,它的查找效率比散列表还要高. trie树的建树: 比如有字符串"ab" ,"adb","adc"   可以建立字典树如图: 树的根节点head不存储信息,它有26个next指针,分别对应着字符a,b,c等.插入字符串ab时,next['a'-'a']即next[0]为空,这是申请一个结点放在next[0]的位置,插入字符串db时,next['d'-'a']即next[3]