自然语言处理的一些工具文档介绍

Preface:在自然语言处理的道路上,不知不觉地渐行渐远,查找资料见过很多工具,也看过很多文档,依然还是过不好这一生。积累太少了,查找资料虽多,实际应用上却很少,记录下来接触过的一些NLP的工具。更新中...

一、NER(命名实体识别)

crfsuite: http://www.chokkan.org/software/crfsuite/

crf++:

nersuite: http://nersuite.nlplab.org/

二、POS(词性标注)

crfsuite

GENIA tagger:生物领域的词性标注工具。http://www.nactem.ac.uk/tsujii/GENIA/tagger/

三、CHUNK(组块分析)

crfsuite, crf++

四、分词

中科院分词工具:ictclas

python包:jieba

斯坦福分词工具:stanford
parser

#----------------------------------

随着时间的流逝而积累。

时间: 2024-10-09 07:01:17

自然语言处理的一些工具文档介绍的相关文章

传智播客C/C++各种开发环境搭建视频工具文档免费教程

传智播客作为中国IT培训的领军品牌,一直把握技术趋势,给大家带来最新的技术分享!传智播客C/C++主流开发环境免费分享视频文档中,就有写一个helloworld程序的示范.火速前来下载吧 所谓"工欲善其事,必先利其器". 欲学C/C++,必先搭建好开发环境,欲成为C/C++高手,必先跑起来helloworld! C/C++ IDE仅仅是工具--剑,C/C++语言就是剑法.欲雄霸天下,必须精通各种剑,精通各路剑法.请大家认真关注http://c.itcast.cn最新技术视频. (有图有

esdoc 自动生成接口文档介绍

官网 ESDoc:https://esdoc.org/ JSDoc:http://usejsdoc.org/ 介绍 ESDoc 是一个根据 javascript 文件中注释信息,生成 JavaScript 应用程序或库.模块的 API 文档的工具.具有文档覆盖率统计.系统手册.一体化测试.详细接口说明等特点. ESDoc 与 JSDoc 对比 JSDoc 是目前最火的文档生成工具,它存在的时间也比较长,但是功能上还欠缺一些,比如文档覆盖率.自动测试.搜索等,都没有实现.并且它的使用比较复杂,需要

(002)XHTML文档介绍

一.引言 这里首先澄清两个术语:“文档”和“页面”.文档本质上是包含有XHTML源代码的那个纯文本文件,而页面则是图形浏览器呈现这个文档所得到的可见结果. 一个有效.合适的XHTML文档必须符合严格的结构,并按确切的格局安排一些必需的组成部分.如下代码清单则展示了一个基本的XHTML的文档结构: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DT

氚云派单文档介绍

派单管理痛点: 员工同时服务多个客户导致售后处理不及时造成客户投诉,客户对售后处理满意度不高.在流程执行效率上,无法精准考量员工服务进度.质量.销量等情况. 运用钉钉氚云版实现派单的全面管理 氚云派单一个针对中小企业,蓝领群体的工单管理工具.使用易活,不论是管理者,员工,客户都可以一目了然的了解最新的工作进度.在使用钉钉氚云版派单系统后,管理效率大大提升,售后漏单情况明细改善,让管理更加精细化,随时掌握所有单据的当前状态.   功能模块: [工单类别] 将工单进行分类管理,更加易于跟进 [服务产

氚云人事文档介绍

HR管理痛点: 伴随着企业的逐步发展和壮大,集团形态将是最重要的企业运作模式,与此相伴,组织规模将会越来越大,组织层次越来越复杂,管理幅度也会越来越多. 同时,人力资源管理也是一门专业性很强的管理技术,对人力资源从业者的素质要求也会越来越高.正是基于上述两点,人力资源管理信息化已经是很多企业的必然选择. 运用钉钉氚云版实现人力资源的全面管理 氚云HR系统是为企业持续地提升人力资源管理水平和能力而出现的信息化的支撑和平台,员工可以通过移动端,自助完成诸如请假.入职.加班.出差.外出.离职等申请,审

[环境工具文档]Android SDK下的docs文件夹不存在

看到有些同学的SDK目录下有docs文件夹,而我的确没有在网上搜索了一下,终于找到问题所在:在最新的sdk中,有一项Documentation for Android SDK,那就是docs,这个doc貌似是随着最新sdk发布的

ffmpeg文档17-视频编码器

17 视频编码器 介绍一些当前有效的视频编码器 libtheora libtheora的封装 编译需要头和库文件,还需要利用--enable-libtheora在配置中允许 更多信息参考http://www.theora.org/ libtheora选项 下面是映射给libtheora的全局选项,它们对品质和码率产生影响. b 对CBR(固定码率编码)设置码率,单位bit/s,在VBR(动态码率编码)模式下本选项被忽略. flags 设置是否允许qscale标志(恒定质量模式——VBR模式下)在

ffmpeg文档16-音频编码器

16 音频编码器 介绍当前可用的音频编码器 aac AAC(Advanced Audio Coding )编码器 当前原生(内置)编码器还处于实验阶段,而且只能支持AAC-LC(低复杂度AAC).要使用这个编码器,必须选择 ‘experimental’或者'lower' 因为当前还处于实验期,所以很多意外可能发生.如果需要一个更稳定的AAC编码器,参考libvo-aacenc,然而它也有一些负面报告. aac选项 b 设置码率,单位是bits/s,是自动恒定比特率(CBR)模式的码率 q 设置为

LINUX 内核文档地址

Set colors for man pages: 设置方法比较简单,打开/etc/bash.bashrc(需要root权限)或者~/.bashrc文件加入如下内容: # Set colors for man pagesman() {env \LESS_TERMCAP_mb=$(printf “\e[1;31m”) \LESS_TERMCAP_md=$(printf “\e[1;31m”) \LESS_TERMCAP_me=$(printf “\e[0m”) \LESS_TERMCAP_se=$