在PyCharm中安装nltk,以及nltk data的下载。

一、简介

1.Natural Language ToolKit(NLTK) 自然语言处理包:是一个用于自然语言处理和文本分析的综合性python库。用于NLP的研究和开发。

2.NLTK 文档和API 可在http://text-processing.com. 查看。

3.Tokenization(标记化)标记化是将字符串拆分成一个片段或标记列表的过程。一个符号是一个整体的一部分,所以一个单词是一个句子中的一个标记,而一个句子是一个段落中的一个标记。

4.WordNet:一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。是为自然语言处理系统编程访问而设计的词典。

它有许多不同的用例:

比如 查找单词的定义、寻找同义词(synonyms)和反义词(antonyms)、探讨词的关系与相似性、具有多种用途和定义的词的词义消歧。

NLTK包含一个Wordnet语料库阅读器(WordNet corpus reader),我们将使用它来访问Wordnet。语料库只是一个文本,而语料库阅读器的目的是使访问一个语料库比直接文件访问容易得多。

二、做好准备

安装NLTK前需要安装python环境,我电脑win10装的是python3.6 64位。编译器安的是pyCharm

这里我以pyCharm安装NLTK为例,如果不用编译器下载,则访问下面的网址下载安装

官网链接:http://www.nltk.org/

安装步骤:http://www.nltk.org/install.html

下载地址:https://pypi.python.org/pypi/nltk

第一步先装python。第二步装NumPy。

第三步装NLTK 时 会报如下错误(现在还没搞明白) 果断弃坑,转用pyCharm安装

1.打开编译器-》File-》settings 出现如下图界面

点击红圈绿色的加号,显示下图页面,搜索numpy-》点右下角安装

numpy安装完后,继续搜索nltk安装,都安装好后如下图

继续,新建个test.py 输入如下代码

1 import nltk
2 nltk.download()

用来下载 nltk data

点击运行test.py 会弹出如下页面

Server Index 将默认地址改为http://www.nltk.org/nltk_data/

Download Directory可以选择默认c盘,也可以改成 下面任意一个目录(因为查找是按下面文件顺序查找的)

- ‘C:\\Users\\dell/nltk_data‘
    - ‘C:\\nltk_data‘
    - ‘D:\\nltk_data‘
    - ‘E:\\nltk_data‘
    - ‘D:\\python36\\venv\\nltk_data‘
    - ‘D:\\python36\\venv\\lib\\nltk_data‘
    - ‘C:\\Users\\dell\\AppData\\Roaming\\nltk_data‘

选all 是全部都下载,相当慢应该要两天时间,也可以每次只下载要用的部分。

点击Download(因为我之前下过,所以状态Status为out of date,如果是第一次安状态都为 not installed)

如果嫌麻烦 也可以从百度云盘分享我下好的nltk data   链接:https://pan.baidu.com/s/1d64mVhAbMBh3U3bw34XlfA 密码:64ey

百度云盘下载完后只需将解压移动到

- ‘C:\\Users\\dell/nltk_data‘
    - ‘C:\\nltk_data‘
    - ‘D:\\nltk_data‘
    - ‘E:\\nltk_data‘
    - ‘D:\\python36\\venv\\nltk_data‘
    - ‘D:\\python36\\venv\\lib\\nltk_data‘
    - ‘C:\\Users\\dell\\AppData\\Roaming\\nltk_data‘

任意目录下就可以了。

上述步骤完成后可以敲入如下代码

from nltk.book import *

运行结果如下图说明成功

下载我百度云盘里的,运行时可能会报如下错误

找不到punkt资源

只需再单独下载punkt就可以了,代码如下

1 import nltk
2 nltk.download(‘punkt‘)

原文地址:https://www.cnblogs.com/guo7533/p/8695812.html

时间: 2024-10-11 00:45:08

在PyCharm中安装nltk,以及nltk data的下载。的相关文章

在 Pycharm 中安装 wxPython

1.下载 Pycharm 下载地址:http://www.jetbrains.com/pycharm/download/download-thanks.html?platform=windows&code=PCC 2.自动安装 wxPython图1 在 File 中选择 Settings 打开设置面板,依次打开 Project:PycharmProjects->Project Interpreter,在右侧的插件列表中点击绿色加号图2 在 Available Packages 面板的搜索框中

解决pycharm中安装scrapy提示 Microsoft Visual C++ 14.0 is required问题

安装方法: 出现问题:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools 上网搜了各种方法都不好使,主要试了以下方法: 解决方法:http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted下载对应

转载~如何在Pycharm中安装numpy等科学计算库

转载自机器小人z windows下如何快速优雅的使用python的科学计算库? Python是一种强大的编程语言,其提供了很多用于科学计算的模块,常见的包括numpy.scipy.pandas和matplotlib.要利用Python进行科学计算,就需要一一安装所需的模块,而这些模块可能又依赖于其它的软件包或库,因而安装和使用起来相对麻烦.幸好有人专门在做这一类事情,将科学计算所需要的模块都编译好,然后打包以发行版的形式供用户使用,Anaconda就是其中一个常用的科学计算发行版. 我们从网站(

win10在Pycharm中安装scrapy

查看官网说明 发现推荐是安装Anaconda 或 Miniconda,这东西有点大而全,感觉目前用不上.所以没这样做. 直接安装scrapy 如果直接装会报错的,参考文章就可以解决. 这里记一下组件下载网址. 完成安装 Pycharm的Terminal中输入scrapy命令,如果命令能找到,说明安装已成功. 原文地址:https://www.cnblogs.com/lyg-blog/p/10695284.html

LINUX系统中安装ORACLE11g的安装文档,含部分问题解答

1.无法使用命令 /usr/bin/xdpyinfo 自动检查显示器颜色 在linux as5下安装oracle11g,环境都配置好了!等运行./runInstaller的时候无法弹出安装的图形界面我几乎用了网站提到所有的方法!1.xhost +ip2.su - oracle3.export DISPLAY=ip:0.0可还是出现下面错误检查临时空间: 必须大于 80 MB. 实际为 1223 MB 通过检查交换空间: 必须大于 150 MB. 实际为 3098 MB 通过检查监视器: 监视器配

<实训|第二天>掌握linux6.7中安装vmware、vmware安装linux发行版本以及遇到的问题最后libreoffice的安装

期待已久的linux运维.oracle"培训班"终于开班了,我从已经开始长期四个半月的linux运维.oracle培训,每天白天我会好好学习,晚上回来我会努力更新教程,包括今天学到了什么知识点,用了什么方法,使用了什么工具,工具在哪里共享着等等,努力做到让每一位感兴趣的.关注我的.没关注我的老司机都能在自己闲暇的时光学到一点额外的知识,指不定那一天你就用上了少许呢! ------------------------------------------------------------

在 VirtualBox 虚拟机中安装 Arch Linux 系统指南

How to install Arch Linux on VirtualBox 本文导航 1.Arch Linux 软件仓库2.在 VirtualBox 虚拟机中安装 Arch Linux 系统1.下载 Arch Linux 系统2.在 Oracle VirtualBox 管理界面初始化安装3.磁盘分区4.引导 Arch Linux 启动5.设置主机名和网络6.安装引导加载程序7.启动进入 Arch Linux 系统 Arch Linux 是专门为 i689 和 86-64 架构的计算机而设计的

Windows下用Putty管理VMware Workstation 虚拟机中安装的Ubuntu12.04 LTS

Windows下实现用Putty登录管理VMware Workstation 虚拟机中安装的Ubuntu12.04 LTS 1.下载putty软件:http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html,下载putty.exe,该软件不许安装,下载后直接可以运行: 2.查看Ubuntu12.04 IP地址:在VMware Workstation 虚拟机中的Ubuntu12.04 LTS上使用ctrl+alt+t 快捷键开启一

在Windows Server2016中安装SQL Server2016(转)

在Windows Server2016中安装SQL Server2016(转) 转自: http://blog.csdn.net/yenange/article/details/52980135 参考: SQL Server2016企业版 附全版本key - moonpure的专栏 - CSDN博客  http://blog.csdn.net/moonpure/article/details/52066567 SQL Server2016安装硬.软件条件:点击打开链接 WinServer2016