/*这段代码写的是JE分词器对于所输入的文本进行分词
* 这里还可以自己设定,分词的范围和单个词语,这样用户可以更加方便对想要
*处理的文本更加的灵活多变。
*这里我添加的例子是.addWord(“回首雅虎在中国”);
* */
这个截图是没有加入自己设定的分词内容时候的分词结果:
加入自己定义分词内容后的截图:
package analyzer;
import jeasy.analysis.MMAnalyzer;
public class JE {
public JE() {
// TODO Auto-generated constructor stub
try{
String test = "回首雅虎在中国走过的道路,从目录试的搜索到 "
+"综合门户的网站,再回归到搜索,之后再一次抛弃简介的搜索"
+ "引擎界面, 在主页上加入了门户元素,直至目前单独开辟搜"
+"索域名,将cn.yahoo主页定个位门户和论坛社区的结合"
+"体, 可以说雅虎走火了一条颇为曲折的道路,在这个过程"
+"中,不能说没有走出去的机会,但是自身的重重问题让雅虎一"
+ "次次与机会失之交臂,远的暂且不说只从雅虎和阿里巴"
+"巴联盟之后说起";
MMAnalyzer analyzer = new MMAnalyzer();
//这里还可以自己设定分词的每个单个的、词,这里我把”回首雅虎在中国“
//这几个字当做是一个词,那么显示出来的结果就是添加后样子
MMAnalyzer.addWord("回首雅虎在中国");
System.out.println(analyzer.segment(test, " | "));
}catch(Exception e){
e.printStackTrace();
}
}
public static void main(String[] args) {
// TODO Auto-generated method stub
JE je = new JE();
}
}