linux下python3离线加载nltk_data,不用nltk.download()

在不能上网的服务器上把nltk_data关联到python3,已经安装anaconda3所以不需要安装nltk,环境是linux

首先没有nltk_data在使用nltk会报错

LookupError:
**********************************************************************
  Resource ‘tokenizers/punkt/PY3/english.pickle‘ not found.
  Please use the NLTK Downloader to obtain the resource:  >>>
  nltk.download()
  Searched in:
    - ‘/home/hadoopcj/nltk_data‘
    - ‘/usr/share/nltk_data‘
    - ‘/usr/local/share/nltk_data‘
    - ‘/usr/lib/nltk_data‘
    - ‘/usr/local/lib/nltk_data‘
    - ‘/home/hadoopcj/nltk_data‘
    - ‘‘

1.下载nltk_data

https://github.com/nltk/nltk_data

里面的Packages就是我们要的资源。
2.里面有部分是压缩包,需要解压。punkt就是,不解压即使路径对了还是会报上面的错误

3.将Packages文件夹改名为nltk_data,拷贝到服务器

4.进入python console(如输入/home/hadoopcj/anaconda3/bin/python3.6)在nltk添加你data的路径

>>>from nltk import data
>>>data.path.append(r"/home/hadoopcj/nltk_data(你的路径)")

5.查看nltk_data的搜索路径,如果有你添加的就成功了

>>> nltk.data.path
>>> nltk.data.path
[‘/home/hadoopcj/nltk_data‘, ‘/usr/share/nltk_data‘, ‘/usr/local/share/nltk_data‘, ‘/usr/lib/nltk_data‘, ‘/usr/local/lib/nltk_data‘]

Related

原文地址:https://www.cnblogs.com/34fj/p/9993842.html

时间: 2024-10-23 14:41:47

linux下python3离线加载nltk_data,不用nltk.download()的相关文章

Linux内核启动及加载根文件系统

</pre></h1><p><span style="font-family:KaiTi_GB2312;font-size:18px;">上接博文<<a target=_blank href="http://blog.csdn.net/gqb_driver/article/details/8931775" style="text-decoration: none; font-family: 'Mi

Linux程序动态库加载优化

作者:zhanhailiang 日期:2014-10-26 linux程序动态库加载流程简介 linux从程序(program或对象)变成进程(process或进程),简单说来需要经过三步: fork进程,在内核创建进程相关内核项,加载进程可执行文件: 查找依赖的.so,逐一加载映射虚拟地址: 初始化程序变量: 如下例通过strace查看pwd命令执行过程: [root@~/wade/codeReview/learningc]# strace pwd execve("/bin/pwd"

简单的Linux 驱动模块编译,加载过程

简单的Linux 驱动模块编译,加载过程 2010-03-14 14:48:24|  分类: Driver |  标签: |字号大中小 订阅 本文记录我的第一个Linux设备驱动程序的编译过程.遇到问题的解决方法. 环境:2.4.18-14的内核,Linux内核源码:2.4.18.       Linux内核源码路径:/usr/src/linux(这个源码是从kernel.org网站download的2.4.18版本)        按照<linux设备驱动开发详解>一书中的步骤实现经典例子&

在tomcat下使用jni加载本地库的问题总结——处理UnsatisfiedLinkError错误

最近想使用ICTCLAS分词系统,需要在myeclipse中加载dll(本地库),查阅资料使用jni,ICTCLAS官方也提供了很全面的加载方法,虽然在run as java application下运行没有问题,但是在tomcat下报UnsatisfiedLinkError的错误,错误来自System.loadLibrary("ICTCLAS50"),是jni加载本地库的语句. 之前其实为了省事将dll放在根目录下,显然也不符合tomcat的要求,重新移动到webapps下,想将IC

Android下将图片加载到内存中

Android的系统的标准默认每个应用程序分配的内存是16M.所以来说是非常宝贵的,在创建应用的时候要尽可能的去节省内存,但是在加载一些大的文件的时候,比如图片是相当耗内存的,一个1.3M的图片,分辨率是2560X1920(宽X高)图片当加载到手机内存的时候就会请求19M的一块内存,这是远远超出了系统自带的内存空间,这时候应用程序就会挂掉,所以我们要进行图片的缩放处理,下面我就来带大家创建一个用来图片缩放的应用: 应用效果图如下: 核心代码的实现: package com.examp.loadp

ie6 下图片预加载的问题

1.昨天帮同事看了一个问题 就是 ie6 下 图片预加载图片显示不出来 代码如下 var image = new Image(); image.src = "xx.jpg"; image.onload = function(){ xxxxx } 这样写的问题是 图片缓存的时间 把onload 事件错过了 所以修改一下 var image = new Image(); image.onload = function(){ xxxxx } image.src = "xx.jpg&

浏览器环境下JavaScript脚本加载与执行探析之动态脚本与Ajax脚本注入

在<浏览器环境下JavaScript脚本加载与执行探析之defer与async特性>中,我们研究了延迟脚本(defer)和异步脚本(async)的执行时机.浏览器支持情况.浏览器bug以及其他的细节问题.而除了defer和async特性,动态脚本和Ajax脚本注入也是两种常用的创建无阻塞脚本的方法.总的来看,这两种方法都能达到脚本加载不影响页面解析和渲染的作用,但是在不同的浏览器中,这两种技术所创建的脚本的执行时机还是有一定差异,今天我们再来探讨一下通过动态脚本技术和Ajax注入的脚本在这些方

Android UI--自定义ListView(实现下拉刷新+加载更多)

http://blog.csdn.net/wwj_748/article/details/12512885 Android UI--自定义ListView(实现下拉刷新+加载更多) 关于实现ListView下拉刷新和加载更多的实现,我想网上一搜就一堆.不过我就没发现比较实用的,要不就是实现起来太复杂,要不就是不健全的.因为小巫近期要开发新浪微博客户端,需要实现ListView的下拉刷新,所以就想把这个UI整合到项目当中去,这里只是一个demo,可以根据项目的需要进行修改. 就不要太在乎界面了哈:

早上研究了下jsp的加载顺序,顺便复习下jsp

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <%@ include file="