NLP初试牛刀,NLTK入门第一篇

之前下载过一个PDF,书名是《用python进行自然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。于是开始了入门NLP之旅。

安装环境:Ubuntu14.04桌面版,python版本:2.7

第一步:安装nltk,首先要安装pip工具:sudo apt-get install python-pip,安装完成后用pip安装nltk:sudo pip install python-nltk。

第二步:下载nltk所有的包,在终端中进入python的交互模式,

>>> import nltk
>>> nltk.download()
>>> d
>>> all

接着就等吧,包很大,我断断续续下了两三天才下完。

第三步,安装numpy和matplotlib工具,主要是用来数据分析和图形化显示。下面是引用别人的一部分:

安装numpy相对简单,以下命令可以完成

$ sudo apt-get install python-numpy
$ sudo apt-get install python-scipy

安装matplotlib相对复杂一些

需要先安装其依赖的包libpng和freetype

安装libpng:

$ sudo apt-get install libpng-dev

安装freetype:

$ cd ~/Downloads
$ wget http://download.savannah.gnu.org/releases/freetype/freetype-2.4.10.tar.gz
$ tar zxvf freetype-2.4.10.tar.gz
$ cd freetype-2.4.10/
$ ./congfigure
$ make
$ sudo make install

安装好pip后就可以用下面的命令来查找matplotlib和查看其安装状态

$ sudo pip search matplotlib

安装matplotlib

$ sudo pip install matplotlib

完成上述的步骤,就可以正式进入NLTK学习啦!

时间: 2024-10-12 18:19:23

NLP初试牛刀,NLTK入门第一篇的相关文章

OpenCV 初试牛刀——显示图像

作者 : 卿笃军 示例:从磁盘加载并在屏幕上显示一幅图像. #include "highgui.h" int main() { IplImage *img = cvLoadImage("1.jpg"); //将图像加载至内存 cvNamedWindow("初试牛刀--显示图像",CV_WINDOW_AUTOSIZE);//创建一个窗口 cvShowImage("初试牛刀--显示图像",img); //显示图像 cvWaitKe

搜索引擎--范例:django之初试牛刀

这学期学了一门课<信息检索>,也就是传说中的搜索引擎 大作业自然而然的让我们自己做一个小型的搜索引擎.于是乎,我们本次的主题就诞生了 我也是边学边用,下面和大家一起分享我在这个过程中学到的东西,说的不对的请大家指正 这是我的成果搜索引擎--范例,大家可以点进去看看,点此下载所有文件盒源代码 按照流程,下面我给大家分享的依次是: 1:SAE创建新应用,SVN管理代码 2:新浪微博API获取最近的微博 3:中文分词算法的实现 4:谈谈django--mysql数据库的一些常用命令 搜索引擎--范例

html/css入门第一篇

1.基本教程学习 大概三天业余时间看完下面两个教程. HTML文字教程 CSS文字教程 2.练习 看完教程后,做第一练习时,总结如下: 1)div居中 需要设置属性:margin-left:auto; margin-right:auto; 2) 给图片加链接后,图片有边框,消除边框方法:给图片设置属性 border-width:0px; 3)图片相连时,图片间有距离,消除图片间距离:给图片设置属性 display: block; html/css入门第一篇

Sublime Text 3 初试牛刀

每次我在其他视频网站上看学习视频的时候,看着老师用的编辑器高大上档次,而我一般用Notepad,和Dreamweaver去编辑网页,需要每一行代码,打进去,效率低.最近看到sublime编辑器,在网上搜了一下说是最受欢迎的,就毫不犹豫的下载下来,初试牛刀一下下,把我搜索的功能和与前端浏览器交互的插件简答介绍一下.前端实时可视化开发工具:LiveStyle 支持样式文件的修改,也可以在浏览器端编辑样式代码,会自动更新到你的样式表中. 浏览器端: 下载一个chrome浏览器,在 chrome网上应用

ElasticSearch入门 第一篇:Windows下安装ElasticSearch

https://www.elastic.co/downloads/past-releases/elasticsearch-2-4-4 这是ElasticSearch 2.4 版本系列的第一篇: ElasticSearch入门 第一篇:Windows下安装ElasticSearch ElasticSearch入门 第二篇:集群配置 ElasticSearch入门 第三篇:索引 ElasticSearch入门 第四篇:使用C#添加和更新文档 ElasticSearch入门 第五篇:使用C#查询文档

Zookeeper 入门第一篇

转载原文地址: ZooKeeper学习总结 第一篇:ZooKeeper快速入门 ZooKeeper学习总结 第二篇:ZooKeeper深入探讨 ZooKeeper学习第一期---Zookeeper简单介绍 1. 概述 Zookeeper简单来说就是一个分布式协调技术的具体实现,所谓分布式协调技术就是在集群环境下,协调集群中多台机器并发访问控制,实现临界资源加锁和有序访问,防止造成"脏数据"的后果.所以Zookeeper最常见的应用就是:分布式锁.除此之外,基于Zookeerper提供的

PowerBI入门 第一篇:创建第一个PowerBI报表

PowerBI是微软新一代的交互式报表工具,把相关的静态数据转换为酷炫的可视化的,能够根据filter条件,对数据执行动态筛选,从不同的角度和粒度上分析数据.PowerBI主要由两部分组成:PowerBI Desktop和 PowerBI Service,前者供报表开发者使用,用于创建数据模型和报表UI,后者是管理报表和用户权限,以及查看报表(Dashboard)的网页平台(Web Portal).在开始PowerBI制作报表之前,请先下载 PowerBI Desktop桌面开发工具,并注册Po

JavaMail入门第一篇 邮件简介及API概述

现如今,电子邮件在我们的生活当中扮演着越来越重要的角色,我们每个人几乎都会与其打交道(至少时不时我们都会接收到莫名其妙的垃圾邮件),在工作中,使用邮件进行交流沟通,可以使我们的工作有迹可循,也显的较为正式,这是由我们人为手工操作的,在生活中,在某网站注册了一个账户之后,该网站就会自动发送一封欢迎邮件并让我们确认是否注册,以防止恶意注册,当然,这个就不可能像我们工作中手工方式来进行操作了,Java的13种核心技术中的JavaMail为我们提供了API来对邮件进行相关的操作. 一.邮件服务器 要在I

Android JNI入门第一篇——HelloJni

android支持使用NDK开发C程序,关于配置NDK环境问题应该不用再赘述了,这个网上有很多,这里通过一篇实例来讲述简单的JNI开发,大家可以参考这篇文章(Get Your Eclipse-Integrated NDK On!)搭建Eclipse编译C语言为so文件的开发环境. native方法实现步骤如下: 1.在Java中声明native()方法,然后编译(javac): 2.用javah产生一个.h文件: 3.编写包含.h文件的c文件 4.编译c文件 5.使用编译成功的so文件. 第一步