python中nltk的下载安装方式

首先去http://nltk.org/install.html下载相关的安装程序,然后

在cmd窗口中,进入到python的文件夹内的 Scripts内,运行easy_install pip
安装PyYAML and NLTK:pip install pyyaml nltk
这样就将nltk安装完成,安完可以测试下。

然后敲入下面的代码,进入NLTK数据源下载界面:

import nltk
nltk.download()

选择all,设置好下载路径(Download Directory),然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。如果有个别数据包无法下载,你可以切换到All Packages标签页,双击指定的包来进行下载:

如果都不行的话,你还可以直接到 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 去下载数据包,只要将数据包复制到你的Download Directory目录下即可。

安装NLTK

form nltk.book import  *

键入以上代码可以得到图中的显示,就说明NLTK数据包都安装好了~

实践。使用NLTK进行字符串查询

text1.concordance(‘monstrous‘)

说明:

text1为NLTK数据包中的一段数据源,是一大串字符串。(原文在数据包下载目录下的gutenberg.zip中的melville-moby_dick.txt)

text1.concordance(‘monstrous‘)这句话实现的是从这一大串字符串中找寻出包含monstrous这个单词的语句。

时间: 2024-11-09 09:30:22

python中nltk的下载安装方式的相关文章

Python中lxml模块的安装

lxml是Python中与XML及HTML相关功能中最丰富和最容易使用的库.lxml并不是Python自带的包,而是为libxml2和libxslt库的一个Python化的绑定.它与众不同的地方是它兼顾了这些库的速度和功能完整性,以及纯Python API的简洁性,与大家熟知的ElementTree API兼容但比之更优越!但安装lxml却又有点麻烦,因为存在依赖,直接安装的话用easy_install, pip都不能成功,会报gcc错误.下面列出来Windows.Linux下面的安装方法: [

Python中如何用pip安装外部主机文件

在python中安装非自带python模块,有三种方式: easy_install pip 下载压缩包(.zip, .tar, .tar.gz)后解压, 进入解压缩的目录后执行python setup.py install命令 本文主要针对pip安装时可能会碰到的一种情况,及解决办法: 假如我要安装pylint模块,该模块非python自带模块,用import肯定不能导入,需要额外安装 >>> import pylint Traceback (most recent call last)

python框架Django的下载安装及使用框架创建的第一个项目

如果还未下载Django,可以使用以下链接:https://www.djangoproject.com/download/ 下载安装解压Django压缩包后,将其压缩后的文件跟python安装目录放在同一个根目录,以下介绍两种方式安装: 进入 Django 目录,执行python setup.py install,开始安装,Django将要被安装到Python的Lib下site-packages: 打开cmd,使用已经配置好环境变量的python命令pip install Django安装,之后

Python中scrapy框架如何安装配置

在python学习群里发现很多学习网络爬虫技术的童靴都搞不懂python爬虫框架scrapy的安装配置,在学习python网络爬虫初级阶段的时候我们利用urllib和urllib2库以及正则表达式就可以完成了,不过遇到更加强大的爬虫工具--爬虫框架Scrapy,这安装过程也是煞费苦心哪,在此整理如下. Windows平台: 我的系统是Win7,首先,你要有Python,我用的是2.7.7版本,Python3相仿,只是一些源文件不同. 官网文档:http://doc.scrapy.org/en/l

Python中调用其他程序的方式

前言 在Python中,可以方便地使用os模块来运行其他脚本或者程序,这样就可以在脚本中直接使用其他脚本或程序提供的功能,而不必再次编写实现该功能的代码.为了更好地控制运行的进程, 可以使用win32process模块中的函数,如果想进一步控制进程,则可以使用ctype模块,直接调用kernel32.dll中的函数.下面介绍4种方式: 1.os.system()函数 os模块中的system()函数可以方便地运行其他程序或者脚本,模式如下: os.system(command):command:

selenium IDE的3种下载安装方式

第一种方式: 打开firefox浏览器-----点击右上角-----附加组件----插件----搜索框输入“selenium”-----搜索的结果中下拉到页面尾部,点击“查看全部的37项结果”---进入到的页面下拉到底部,点击selenium IDE出现弹框“添加到Firefox”--安装---立即重启---再次点击右上角----定制----找到“selenium IDE”直接拖动到左边------退出定制,安装与放位成功,操作方式如下: 第二种方式: 百度搜索selenium,进入seleni

python中如何使用pip安装自己的第三方模块

系统:CentOS6.8    python版本:python3.5 文本编辑器:vim python中我们很多时候,需要将自己的py文件导入到python路径中,但是我们自己的文件自身并不在python默认的库文件路径下,这时候就需要我们自己将我们的py文件import进入了 下面示例怎么导入自己的第三方模块,我们首先需要自己创建一个.py文件,名字随意明名了,但是不要和python内部模块重命,内部模块路径在/usr/lib/python3.5/site-packages.要不然使用pyth

python中函数参数的引用方式

值传递和引用传递时C++中的概念,在python中函数参数的传递是变量指向的对象的物理内存地址!!! python不允许程序员选择采用传值还是传引用.Python参数传递采用的肯定是"传对象引用"的方式.这种方式相当于传值和传引用的一种综合.如果函数收到的是一个可变对象(比如字典或者列表)的引用,就能修改对象的原始值--相当于通过"传引用"来传递对象.如果函数收到的是一个不可变对象(比如数字.字符或者元组)的引用,就不能直接修改原始对象--相当于通过"传值

python requirements.txt批量下载安装离线

有些情况下我们需要下载N个第三方包,或者下载的包依赖其它包,一个个下载非常浪费时间.这时我们可以通过如下两种方式的命令批量下载. 方式1 pip download -d /tmp/packagesdir <packagename> 方式2 pip download -d /tmp/packagesdir -r requirements.txt 其中requirements.txt是我们需要下载的包清单,例如 jinja2>=2.8 future lml>=0.0.2 jupyter