FNLP是一个基于机器学习的中文自然语言文本处理的开发工具包,FNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。
----------百度百科
- 信息检索 文本分类 新闻聚类
- 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别
- 结构化学习: 在线学习 层次分类 聚类
在看这篇文章之前,请确定已经装好了Eclipse,如果没有安装Eclipse,请看这里JSP环境安装
因为FNLP在Github上已经有了很详尽的入门教程,所以在这里我只是把这些教程的顺序、要点和要注意的地方写出来:
FNLP在Github上的项目地址:中文自然语言处理工具包 Toolkit for Chinese natural language processing (formerly FudanNLP)
首先先下载最新的fnlp版本文件,点这里............................:)IE浏览器有可能会点不动
往下找有一个入门教程链接
入门教程有两个,我感觉第二个教程唯一有用的是一篇介绍Eclipse安装Maven插件的文章,在这里:Eclipse安装Maven插件
Maven和maven插件我已经传到了网盘里,这里是地址Maven网盘文件
现在简单的测试一下你的环境配置有没有成功,打开cmd,分别输入java -version javac -version mvn -version
进行到这一步可能有的同学会出现问题,提示没有JAVA_HOME变量,进入电脑系统属性-环境变量,新建系统变量JAVA_HOME,变量值为java/jdk的安装目录,java安装目录在cmd下可以用java -verbose查看
最后一行的地址就是你的java安装地址,以我的电脑为例,JAVA_HOME的变量名就是C:\Program Files\Java\jdk1.8.0_20
好了,现在环境已经配置好了,其实有一些步骤我也是借鉴的第一篇教程,现在开始看第一篇fnlp入门教程:
为了方便,官方给的模型文件、两个jar包的链接在这里直接贴出来http://pan.baidu.com/s/1D7CVc ,注意jar包只需要下载Trove和Commons-cli两个。
接下来按教程走
cmd进入fnlp源码目录,如我的fnlp文件放在E:/fnlp下,
执行上面的命令:mvn install -Dmaven.test.skip=true,编译fnlp
接下来就简单多了,不过要注意官方教程里命令行调用中,包与包的间隔用的 : 号,windows用户要改成 ; 号,英文状态下。
在Eclipse项目中引用FNLP中需要注意的是,新建一个java Project,如果没有找到,请注意右上角
然后只要按照Github上的第一个教程就好了
其实好多都是官方已经说明的,嗯,先感谢一下FNLP项目组成员!!!下面介绍几个常见错误解决办法(百度来的,经过验证)
一、命令行执行报错模型文件版本错误
用网盘的模型文件就好了,这种错误是因为你的模型文件和FNLP版本号不符,网盘里永远是最新的
二、命令行报错找不到或无法加载主类
首先请确定你的系统变量配置正确,Path,CLASSPATH还有JAVA_HOME
系统变量的正确配置是类似
只要把JAVA_HOME换成你的jdk目录就好了
三、如果报错空指针异常之类的错误,怎么也检查不到代码错误,或者干脆是cmd执行却还是报空指针异常
额,恭喜你,估计是源文件有问题,欢迎加群253541693,报告管理员。
四、无论是maven,fnlp或者jdk,安装目录都不要用中文,否则奇奇怪怪的问题就来了。虽然,我的是英文路径。
因为本人也是刚刚认识的FNLP,在安装使用的过程中遇到了问题,也走了弯路,所以特地将安装使用过程详细的整理了下,希望能给想要使用FNLP的同学以帮助!
最后,欢迎有问题有错误的同学到这里一起讨论,共同进步。转载请注明来自任祥磊。