Trie树的C++实现

先给出LintCode的题目:实现Trie树

Trie树就是字典树,用在搜索引擎如百度搜索词条,还比如说之前DNS域名解析系统搜索根据域名搜索IP。总之,是棵树,根据字符串搜索某一节点,同时就可获得节点存储的信息了。

Trie树的一般性质如下:

1.根节点不包含字符,除根节点外每一个节点都只包含一个字符。

2.从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串。

3.每个节点的所有子节点包含的字符都不相同。

那么既然是树,既然需要和字符串匹配,那么树的节点怎么定义?我们可以这样分析,插入一个字符串“ABCD”时我们一个一个插,且A->B->C->D,我们的节点必须要包含A等字符信息,在查找时好一一匹配。同时我们要有结束符来表示字符串末尾,这是为了ABCD和ABCDE区别开来。

实现代码如下,LintCode通过率为70%,不知道哪里有问题。

/**
 * Your Trie object will be instantiated and called as such:
 * Trie trie;
 * trie.insert("lintcode");
 * trie.search("lint"); will return false
 * trie.startsWith("lint"); will return true
 */
 #define MAX_CHILD 26
class TrieNode {
public:
    // Initialize your data structure here.
    int count;
    TrieNode *child[MAX_CHILD];
    TrieNode() {
      count=0;
    }
};

class Trie {
public:
    Trie() {
        root = new TrieNode();
    }

    // Inserts a word into the trie.
    void insert(string word) {
        if(root==NULL||word.size()==0)
        return;
        int n=word.size();
        int i=0;
        TrieNode *t=root;
        while(i<n)
        {
            if(t->child[word[i]-'a']==NULL)
            {
                TrieNode *tmp=new TrieNode();
                t->child[word[i]-'a']=tmp;
                t=t->child[word[i]-'a'];
            }
            else
            t=t->child[word[i]-'a'];
            i++;
        }
        t->count=1;
    }

    // Returns if the word is in the trie.
    bool search(string word) {
        if(root==NULL||word.size()==0)
        return false;
        TrieNode *t=root;
        int n=word.size();
        int i=0;
        while(i<n)
        {
            if(t->child[word[i]-'a']==NULL)
            return false;
            else
            {
                t=t->child[word[i]-'a'];
            }
            i++;
        }
        if((i==n)&&(t->count==1))return true;
        return false;
    }

    // Returns if there is any word in the trie
    // that starts with the given prefix.
    bool startsWith(string prefix) {
        if(root==NULL||prefix.size()==0)return false;
        int n=prefix.size();
        TrieNode *t=root;
        int i=0;
        while(i<n)
        {
            if(t->child[prefix[i]-'a']==NULL)
            return false;
            else
            {
                t=t->child[prefix[i]-'a'];
            }
            i++;
        }
       return true;
    }

private:
    TrieNode* root;
};

还有一种节点数据结构的方法,就是结构体换成map<char,TrieNode*>和bool isLeaf两个成员变量。思想一样,也可以这样来实现。

重点在插入时,顺着某一节点不断插入。上述用TrieNode*数组作为当前节点的成员变量,实则指向下一个节点,因为TrieNode*存放的是下一节点的值,数组下标表示边值。因为字母仅有26,所以数组大小可以声明为26.

map的实现机制是一样的,键保存字符,值表示下一节点的值。

时间: 2024-10-06 10:20:57

Trie树的C++实现的相关文章

poj3630 Phone List (trie树模板题)

Phone List Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 26328   Accepted: 7938 Description Given a list of phone numbers, determine if it is consistent in the sense that no number is the prefix of another. Let's say the phone catalogu

跳跃表,字典树(单词查找树,Trie树),后缀树,KMP算法,AC 自动机相关算法原理详细汇总

第一部分:跳跃表 本文将总结一种数据结构:跳跃表.前半部分跳跃表性质和操作的介绍直接摘自<让算法的效率跳起来--浅谈"跳跃表"的相关操作及其应用>上海市华东师范大学第二附属中学 魏冉.之后将附上跳跃表的源代码,以及本人对其的了解.难免有错误之处,希望指正,共同进步.谢谢. 跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找.插入.删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领.而且最重要的一点,就是它的编程复杂度较同类

Trie树学习2

数组实现的Trie树 字符容量有限,可以使用链表实现更为大容量的Trie #include <iostream> #include <cstdio> #include <string> #include <cstring> #include <vector> #include <map> #include <set> #include <algorithm> #include <cstdlib> #

trie树(字典树)

1. trie树,又名字典树,顾名思义,它是可以用来作字符串查找的数据结构,它的查找效率比散列表还要高. trie树的建树: 比如有字符串"ab" ,"adb","adc"   可以建立字典树如图: 树的根节点head不存储信息,它有26个next指针,分别对应着字符a,b,c等.插入字符串ab时,next['a'-'a']即next[0]为空,这是申请一个结点放在next[0]的位置,插入字符串db时,next['d'-'a']即next[3]

Trie树

Trie树,即字典树或单词查找树,主要用于大量字符串的检索.去重.排序等操作. 主要原理就是利用字符串的公共前缀建立一棵多叉树,牺牲空间换取时间. 1 //Trie树 2 #include <iostream> 3 #include <string> 4 using std::cin; 5 using std::cout; 6 using std::endl; 7 using std::string; 8 9 const int SIZE = 26; 10 const char B

bzoj4103异或运算 可持久化trie树

要去清华冬令营了,没找到2016年的题,就先坐一坐15年的. 因为n很小,就按照b串建可持久化trie树,a串暴力枚举. 其他的直接看代码. #include<cstdio> #include<cstring> #include<iostream> #include<algorithm> using namespace std; inline int read() { int x=0,f=1,ch=getchar(); while(ch<'0'||ch

hihoCoder 1014 Trie树

#1014 : Trie树 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进. 这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?” 身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字

HDU 1251 Trie树模板题

1.HDU 1251 统计难题  Trie树模板题,或者map 2.总结:用C++过了,G++就爆内存.. 题意:查找给定前缀的单词数量. #include<iostream> #include<cstring> #include<cmath> #include<queue> #include<algorithm> #include<cstdio> #define max(a,b) a>b?a:b #define F(i,a,b

hiho一下 第二周&amp;第四周:从Trie树到Trie图

hihocoder #1014 题目地址:http://hihocoder.com/problemset/problem/1014 hihocoder #1036 题目地址: http://hihocoder.com/problemset/problem/1036 trie图其实就是trie树+KMP #1014trie树 #include<stdio.h> #include <algorithm> #include <cstring> #include <str

剑指Offer——Trie树(字典树)

剑指Offer--Trie树(字典树) Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种.典型应用是统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高. Trie的核心思想是空间换时间.利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的. Trie树也有它的缺点,Trie树的内存消耗非常大.当然,或许用左儿子右兄弟的方法建树的话,可能会好点.可见,优