pyltp安装踩坑记录

LTP(Language Technology Platform)由哈工大社会计算与信息检索研究中心开发,提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。

LTP的源码是C++,也提供Java和Python版本。Python版本的安装方法是在cmd下输入

pip install pyltp

安装需要C++的编译环境。

然而在安装包下载下来开始安装的时候,报下面的错误

Exception:

Traceback (most recent call last):

  File "d:\ python36\lib\site-packages\pip\compat\__init__.py", line 73, in console_to_str

    return s.decode(sys.__stdout__.encoding)

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 3: invalid continuation byte

很明显是编码的问题,找到d:\ python36\lib\site-packages\pip\compat\__init__.py文件,第73行,把sys.__stdout__.encoding改成“gbk”,再次安装,这个错误消失。因为Windows中文版常用的编码就是ansi、utf-8、gbk、gb2312这几种,试两次就能确定。

之后的编译,又报了error: command ‘D:\Microsoft Visual Studio 14.0\VC\bin\cl.exe‘ failed with exit status 2错误,多次调试没通过。我就去ltp的GitHub(https://github.com/HIT-SCIR/pyltp)上找Issues,在其中一条(https://github.com/HIT-SCIR/pyltp/issues/94)下面找到了一个博客,http://mlln.cn/2018/01/31/pyltp%E5%9C%A8windows%E4%B8%8B%E7%9A%84%E7%BC%96%E8%AF%91%E5%AE%89%E8%A3%85/,博主的第二种方案提供了编译好的whl文件,正好我的python是3.6的,顺利安装上。

PS:记得把d:\ python36\lib\site-packages\pip\compat\__init__.py文件改回去。

下一步,从http://ltp.ai/download.html下载模型文件,解压到一个文件夹下,到此,安装完成。

原文地址:https://www.cnblogs.com/sunnyeveryday/p/8878059.html

时间: 2024-08-29 18:02:01

pyltp安装踩坑记录的相关文章

Manjaro (KDE)安装踩坑记录

1.如果双显卡无法安装系统可以进如BIOS屏蔽显卡后进入安装 2.如果安装kde版本后容易冻屏.死机,可以尝试安装闭源驱动 3.如果出现resolving time out 10000ms 这样的问题,可以尝试进入    /etc/resolv.conf  修改dns地址 4.如若发现屏幕菜单界面过大问题,也许是字体太大 5.KDE目前无法安装QQ可以尝试 crossover 原文地址:https://www.cnblogs.com/iwannabe/p/10029518.html

【Pysc2】Deepmind Pysc2 环境配置及其踩坑记录

1. 下载星际争霸II游戏 可以直接下暴雪战网,然后在战网内下载. 2. 下载Pysc2 cmd后在命令行输入 pip install pysc2 3. 下载sc2 cmd后在命令行输入 pip install sc2 4. 下载地图 https://github.com/ClausewitzCPU0/SC2AI 解压密码: iagreetotheeula (表示自己同意最终用户许可协议) 解压在Maps的文件夹,我是使用的暴雪战网下载的游戏,发现游戏文件夹里并没有Maps, 需要自己手动创建.

Linux Git 踩坑记录

Linux Git 踩坑记录 git cherry-pick 冲突解决 出现: error: could not apply xxxxxx(commit ID)... ***** hint: after resolving the conflicts, mark the corrected paths hint: with 'git add ' or 'git rm ' hint: and commit the result with 'git commit' 此时使用git status命令查

unionId突然不能获取的踩坑记录

昨天(2016-2-2日),突然发现系统的一个微信接口使用不了了.后来经查发现,是在网页授权获取用户基本信息的时候,unionid获取失败导致的. 在网页授权获取用户基本信息的介绍中(http://mp.weixin.qq.com/wiki/17/c0f37d5704f0b64713d5d2c37b468d75.html),unionid可以在第二步(https://api.weixin.qq.com/sns/oauth2/access_token)和第四步的2个接口中获得.其中,第四步的接口是

IDFA踩坑记录

IDFA踩坑记录: 1.iOS10.0 以下,即使打开"限制广告跟踪",依然可以读取idfa: 2.打开"限制广告跟踪",然后再关闭"限制广告跟踪",idfa会改变: 3.越狱机器安装开发证书打的包,读取的idfa正常: 4.越狱机器安装本地打的发布证书的包,读取idfa异常,第一次打开app读取的是一个错误的idfa,第二次打开会变成另外一个错误的idfa: 5.越狱机器安装Testflight的包,读取idfa异常,第一次打开app读取的是一

.NET CORE2.2 下 Ocelot+Consul服务发现踩坑记录

历史原因,笔者所在公司的项目目前还在使用 .NET CORE 2.2版本,在所有业务应用升级完成服务注册发现之后,最后剩下 Ocelot 网关服务升级.在升级过程中,遇到一些问题,记录此文,以便有相同情况的同学参考. 1. Ocelot 升级服务发现 根据官方文档 ,通过简单的添加配置,既可以将原有配置方式改为服务发现: 安装插件 Install-Package Ocelot.Provider.Consul 13.5.2,.Net Core 2.x 最后一个版本 配置服务 s.AddOcelot

微信小程序之蓝牙 BLE 踩坑记录

前言 前段时间接手了一个微信小程序的开发,主要使用了小程序在今年 3 月开放的蓝牙 API ,此过程踩坑无数,特此记录一下跳坑过程.顺便开了另一个相关的小项目,欢迎 start 和 fork: BLE_MiniProgram API简介 微信小程序目前有蓝牙 API 共 18 个,其中操作蓝牙适配器的共有 4 个,分别是 wx.openBluetoothAdapter 初始化蓝牙适配器 wx.closeBluetoothAdapter 关闭蓝牙模块 wx.getBluetoothAdapterS

vue2.0 踩坑记录之组件

- did you register the component correctly? For recursive components, make sure to provide the "name" option. 出现如上错误的原因大致有以下三点(我踩坑只踩到了这四种情况,如果还有 之后会更新) 1.未能正确的拼好components单词. 这是个低级错误,应该作为第一步排查的可能 2.定义子组件时没有在父组件的内部定义 子组件一定要在父组件中局部注册 3.局部注册的定义写在了实

CISCO配置文件的导出和导入(Timed out)问题 踩坑记录

起因: 我:这台交换机我要用. 武哥:不行,在测试,上面很多配置项都不能动! 我..... 后来武哥找了台3560交换机让我自己玩去:"拷贝一下交换机配置,就能用了" 使用工具:3CDaemon 大致流程: 1 开启3CDaemon,这样你的电脑就能作为一个tftp服务器了,监控udp 69端口 2 交换机配置文件拷贝到tftp上 #copy   源   目的: 输入tftp服务器地址 确定文件名(如果是交换机从tftp下载要输入文件名) ok 简单so 3 将tftp服务器上的配置文