1、NLPIR简介
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。
下载地址:http://ictclas.nlpir.org/downloads
2、目录介绍
ReadMe:介绍
Data: 系统核心词库
doc: 文档,用法介绍
include:系统头文件
sample:NLPIR示例程序
lib: 不同环境下的支撑库
test: 测试数据
bin: ICTCLAS2014----------->分词系统
ICTCLAS-tools.exe-->分词的支撑工具,可用于测试,本处主要用来做用户词典导入
importuserdict.bat-->可将用户词典自动导入到系统内
NLPIR.dll-->Win32下的支撑动态链接库,其他环境的库,可以访问lib对应环境的库文件
NLPIR.lib
NLPIR_WinDemo.exe-->Win32下的演示程序,在Win8 32位下编译而成,部分环境可能不支持,或者显示异常
userdic.txt-->用户词典,用户可以自行编辑
3、java代码
3.1 新建工程fenci导入lib库文件(sample\JnaTest_NLPIR\lib\jna-4.0.0.jar)
3.2 将sample\JnaTest_NLPIR\src\目录下文件复制到工程src直接使用
3.3 修改代码
时间: 2024-11-14 13:11:37