Bag标签之一行代码实行中文分词

用法:

<Bag id=书包名 act=2words[name=key] [gap=字符] [quotes=引号]>中英文混合内容</Bag>

例0:

默认分词(无gap和quotes参数)

<bagid=pPage act=2words name=words>我喜欢黄色高领T恤衫</bag>

输出分词结果

<p><b>结果词组: </b>@{pPage:words}</p>

效果:

完整代码

<html>
<title>分词:返回以空格隔的词组</title>
<h3>分词:返回以空格隔开的词组</h3>
<chtml>
<bag id=pPage act=2words name=words>我喜欢黄色高领T恤衫</bag>
<p><b>结果词组: </b>@{pPage:words}</p>
</chtml>
</html>

(例子文件:_samples/2words.html)

只需一行代码就实行中文+英文混合智能分词,相当轻松

轻开平台资源下载及说明

平台及最新开发手册免费下载:http://download.csdn.net/detail/tx18/8464425


开发实例:轻开B2C电子商务网站,免费下载:http://download.csdn.net/detail/tx18/8318585

轻开平台会不定期升级为大家提供更多强大而Easy的功能,请留意下载最新的版本

时间: 2024-10-11 16:20:48

Bag标签之一行代码实行中文分词的相关文章

Bag标签之一行代码实行中文分词实例1

例1: 分词(返回以逗号隔开的词组,gap=",") <bagid=pPage act=2words name=words gap=",">我喜欢黄色高领T恤衫</bag> 输出分词结果 <p><b>结果词组: </b>@{pPage:words}</p> 输出结果: 完整代码 <html> <title>分词:返回以逗号隔开的词组</title> <h

Bag标签之一行代码实行中文分词实例2

例1: 分词(返回以逗号隔开每个词带上引号的词组,gap=",",quotes="'"或quotes='"') 单引号 <bag id=pPage act=2words name=words gap="," quotes="'">我喜欢黄色高领T恤衫</bag> 输出分词结果 <p><b>结果词组: </b>@{pPage:words}</p>

Bag标签之一行代码实行中文分词实例3

例3: 分词(返回一个书包,以_0._1._2 ...取出分好的词) <bag id=words act=2words>我喜欢黄色高领T恤衫</bag> 注意没有name属性 输出分词结果 <b>结果词组: </b> <for end="@{words:getWidth}"> <span>@{words:[email protected]{for:getSuffix}} </span> </for

&lt;code&gt;标签---加入一行代码

源码: <body>    <code>       var i=80;    </code></body>

Spark 大数据中文分词统计(三) Scala语言实现分词统计

Java版的Spark大数据中文分词统计程序完成之后,又经过一周的努力,把Scala版的Spark 大数据中文分词统计程序也搞出来了,在此分享给各位想学习Spark的朋友. 如下是程序最终运行的界面截图,和Java版差别不大: 如下是Scala工程结构: 当你在工程主类文件WordCounter.scala上单击右键,选择Run As Scala Application: 然后选择唐诗宋词进行分词统计,就会出现前面显示的分词结果. 工程代码已经上传CSDN:http://download.csd

Bag标签

功能: ·        把字符串按关键字放进书包 ·        把书包保存到会话中 ·        把字符串分割成数组,返回一个存放数组数据的书包(Bag) ·        删除书包中的一条数据(如Esql返回的数据记录或xml的一个节点) ·        保存xml类型的书包(bag)到给定名称的文件 ·        中文分词 ·        检验 ·        修改书包名 用法: <Bag id=书包名[suffix=整数] [state] [act=save|split

Bag标签成一条线的代码来实现中国字

说明: <Bag id=书包名 act=2words[name=key] [gap=字符] [quotes=引號]>中英文混合内容</Bag> 例0: 默认分词(无gap和quotes參数) <bagid=pPage act=2words name=words>我喜欢黄色高领T恤衫</bag> 输出分词结果 <p><b>结果词组: </b>@{pPage:words}</p> 效果: 完整代码 <html

想加入一行代码吗?使用&lt;code&gt;标签

在介绍语言技术的网站中,避免不了在网页中显示一些计算机专业的编程代码,当代码为一行代码时,你就可以使用<code>标签了,如下面例子: <code>var i=i+300;</code> 注意:在文章中一般如果要插入多行代码时不能使用<code>标签了. 语法: <code>代码语言</code> 注:如果是多行代码,可以使用<pre>标签. 示例: <!DOCTYPE HTML> <html> &

【原创】中文分词系统 ICTCLASS2015 的JAVA封装和多线程执行(附代码)

本文针对的问题是 ICTCLASS2015 的多线程分词,为了实现多线程做了简单的JAVA封装.如果有需要可以自行进一步封装其它接口. 首先ICTCLASS2015的传送门(http://ictclas.nlpir.org/),其对中文分词做的比较透彻,而且有一定的可调式性.但是应用到实际开发中的话,多线程操作是必须的,因此有了本文的初衷. 可能有的小伙伴不太清楚ICTCLASS是干嘛的,下面是一段介绍:NLPIR汉语分词系统(又名ICTCLAS2015),主要功能包括中文分词:词性标注:命名实