。一个最大逆向匹配分词算法的例子

原文链接地址：
http://www.52nlp.cn/maximum-matching-method-of-chinese-word-segmentation/

逆向匹配法思想与正向一样，只是从右向左切分，这里举一个例子：
　　　输入例句：S1=”计算语言学课程有意思” ；
　　　定义：最大词长MaxLen = 5；S2= ” “；分隔符 = “/”；
　　　假设存在词表：…，计算语言学，课程，意思，…；
　　　最大逆向匹配分词算法过程如下：
　（1）S2=””；S1不为空，从S1右边取出候选子串W=”课程有意思”；
　（2）查词表，W不在词表中，将W最左边一个字去掉，得到W=”程有意思”；
　（3）查词表，W不在词表中，将W最左边一个字去掉，得到W=”有意思”；
　（4）查词表，W不在词表中，将W最左边一个字去掉，得到W=”意思”
　（5）查词表，“意思”在词表中，将W加入到S2中，S2=” 意思/”，并将W从S1中去掉，此时S1=”计算语言学课程有”；
　（6）S1不为空，于是从S1左边取出候选子串W=”言学课程有”；
　（7）查词表，W不在词表中，将W最左边一个字去掉，得到W=”学课程有”；
　（8）查词表，W不在词表中，将W最左边一个字去掉，得到W=”课程有”；
　（9）查词表，W不在词表中，将W最左边一个字去掉，得到W=”程有”；
　（10）查词表，W不在词表中，将W最左边一个字去掉，得到W=”有”，这W是单字，将W加入到S2中，S2=“ /有 /意思”，并将W从S1中去掉，此时S1=”计算语言学课程”；
　（11）S1不为空，于是从S1左边取出候选子串W=”语言学课程”；
　（12）查词表，W不在词表中，将W最左边一个字去掉，得到W=”言学课程”；
　（13）查词表，W不在词表中，将W最左边一个字去掉，得到W=”学课程”；
　（14）查词表，W不在词表中，将W最左边一个字去掉，得到W=”课程”；
　（15）查词表，“意思”在词表中，将W加入到S2中，S2=“ 课程/ 有/ 意思/”，并将W从S1中去掉，此时S1=”计算语言学”；
　（16）S1不为空，于是从S1左边取出候选子串W=”计算语言学”；
　（17）查词表，“计算语言学”在词表中，将W加入到S2中，S2=“计算语言学/ 课程/ 有/ 意思/”，并将W从S1中去掉，此时S1=””；
　（18）S1为空，输出S2作为分词结果，分词过程结束。

时间： 2024-10-11 02:53:35

。一个最大逆向匹配分词算法的例子

。一个最大逆向匹配分词算法的例子的相关文章

自然语言处理最大逆向匹配分词算法

正向_逆向匹配分词

逆向最大匹配分词算法C#

中文分词算法综述

最大匹配分词算法

深度解析中文分词器算法（最大正向/逆向匹配）

分词算法-正向最大匹配算法与逆向最大匹配算法

大数据DDos检测——DDos攻击本质上是时间序列数据，t+1时刻的数据特点和t时刻强相关，因此用HMM或者CRF来做检测是必然！和一个句子的分词算法CRF没有区别！

机器学习基础——一文讲懂中文分词算法