Windows环境安装tesseract-ocr 4.00并配置环境变量

最近要做文字识别,不让直接用别人的接口,所以只能尝试去用开源的类库。tesseract-ocr是惠普公司开源的一个文字识别项目,通过它可以快速搭建图文识别系统,帮助我们开发出能识别图片的ocr系统。因为Windows环境开发,我也就必须在windows环境安装系统。

第一步:下载安装包

根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安装包,好像我只看到64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记得你的安装目录,我们等会配置环境变量要用。

如果不是做英文的图文识别,还需要下载其他语言的识别包https://github.com/tesseract-ocr/tesseract/wiki/Data-Files。

简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata

繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata

第二步:安装

直接执行下载好的tesseract-ocr-setup-4.00.00dev.exe,下一步、下一步安装。

第三步:配置环境变量

注意:我的系统是win7,其他系统应该差不多,跟配置java变量一样

复制你的安装地址,我的是安装在C:\Program Files (x86)\Tesseract-OCR,界面如下:

复制安装路径“C:\Program Files (x86)\Tesseract-OCR”,进入“控制面板\系统和安全\系统”,点击

“系统保护”

进入到以下界面:

点击环境变量,进入配置以下界面:

把刚才的安装路径“C:\Program Files (x86)\Tesseract-OCR”添加到红线划的PATH和Path,注意,添加时候开头用“;”跟之前的变量隔开,结尾以“;”结尾。下面是我的配置信息样本:

C:\Users\Administrator\AppData\Roaming\Composer\vendor\bin;C:\Users\Administrator\AppData\Roaming\npm;C:\Program Files (x86)\Tesseract-OCR;

配置好了点击保存。

打开命令终端,输入:tesseract -v,可以看到版本信息

如果出现报错,估计是环境变量没配置好。

到这里,我们就算安装完成了,但是,我们的系统还是无法识别中文的,我们要去下载简体汉字、繁体汉字语言包(上文给了地址了),下载好之后放到安装目录的tessconfigs目录下即可。

补充:因为没有配置全局变量,无法跨盘执行数据转换,这里我们在环境变量那增加一个配置信息

系统变量—->新建:

增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files (x86)\Tesseract-OCR;

本人博客:Windows环境安装tesseract-ocr 4.00并配置环境变量

http://www.wangtuizhijia.com/archives/272

时间: 2024-10-25 02:34:00

Windows环境安装tesseract-ocr 4.00并配置环境变量的相关文章

Win10 环境安装tesseract-ocr 4.00并配置环境变量

一.安装: 选择对应版本,https://digi.bib.uni-mannheim.de/tesseract/ 1:下载安装包 根据https://github.com/tesseract-ocr/tesseract/wiki,我找到非官方的安装包,好像我只看到64位的安装包http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe,下载后直接安装即可,但是要记得你的安装目录,我们等会配置环境变量要用

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多.可以直接从repo获取,也可以下载压缩包.不过编译的时候往往也会出现各种奇怪的问题.这里介绍如何简单的配置和编译源码. 参考原文:How to Build Tesseract OCR Library on Windows 编译Tesseract 下载 Windows installer of tesseract-ocr 3.02.02 安装 安装过程中勾选Tesseract development files: 编译 在安装目录中找到vs2008到工程目录

windows下安装Apache、php、mysql集成环境

一.准备工作 本次安装的版本分别为:apache2.4  .php5.6 . mysql5.7 下载地址为:http://pan.baidu.com/s/1boQNIOn 密码:zarx 二.安装步骤 先安装apahce ,然后安装php,最后安装mysql. 作为一个web集成环境,必然是先安装apache的,而apche的响应得靠php来反馈,php的数据又得从mysql里面获取,因此整个流程安装,是先apache, 再php,最后mysql. 三.安装Apahce 安装    由于本次下载

LAMP坏境和LNMP环境安装Nagios4.1.1和基本配置

----------------------------------------以下内容为笔者生产环境的监控,安装都是经过一步步测试的-------------------------------- 环境:LAMP :CentOS 6.8  .Apache 2.4. Mysql 5.6 . PHP 5.6.22 LNMP: CentOS 6.8  .Nginx 1.10. Mysql 5.6 . PHP 5.6.22 软件:Nagios4.1.1 .NRPE2.15.Nagios-plugins

Fedora 20下安装官方JDK替换OpenJDK并配置环境变量

Fedora 20自带OpenJDK,所以如果安装官方的JDK的话要先删除OpenJDK,步骤如下: 1:rpm -qa|grep jdk 查看当前的jdk情况. 2:yum -y remove java java-1.7.0-openjdk* 卸载openjdk,这个过程中因为依赖原因可能会卸载一些额外的软件. 3:去Oracle官网下载官方jdk,我下载的是tar.gz格式的. 4 :解压jdk安装包tar -zxvf jdk-7u51-linux-x64.tar.gz  复制到自己的软件文

Windows 2012 安装 Oracle 11g 报错:[INS-13001]环境不满足最低要求。

问题: 在Windows Server 2012 安装上 Oracle 11g 时,安装程序报错:[INS-13001]环境不满足最低要求. 分析原因: Oracle 在发布 11g时,Winodws Server 2012还没有发布.所以Oracle的安装程序中,并没有将Windows 2012作为被认证的操作系统. 解决方案: 第一种方法: 直接忽略安装即可. 第二种方法: 修改Oracle的安装用的预配置文件cvu_prereq.xml. 用记事本打开\database\stage\cvu

转 windows下安装pycharm并连接Linux的python环境

https://www.cnblogs.com/junxun/p/8287998.html 1. 下载安装Pycharm专业版 具体方法略.Pycharm5激活方法参考http://www.cnblogs.com/snsdzjlz320/p/7110186.html 2. 添加配置连接远程服务器 2.1  打开 PyCharm,依次点开 File  → Settings → Project scripts → Project Interpreter  选择“Add Remote” 2.2  点击

Windows下安装nodejs并进一步搭建vue开发环境步骤(二)

1.  安装cnpm 说明:由于许多npm包都是在国外,我们这里用到淘宝的镜像服务器,来对我们依赖的module进行安装,因此首先安装"中国的npm"--cnpm 参考网址:http://npm.taobao.org/ 安装命令为:npm install -g cnpm --registry=https://registry.npm.taobao.org 2.  用cnpm安装vue 安装命令:cnpm install vue -g 3.  安装vue命令行工具 安装命令:cnpm i

Solr6.6环境安装及core的创建(win7环境)

1.下载solr6.6 并解压 地址: http://www.apache.org/dyn/closer.lua/lucene/solr/6.6.0 2.安装JDK1.8 地址: http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 3.配置 SOLR_JAVA_HOME 环境变量指定到JDK的安装目录 4.启动solr服务 (采用solr内嵌的jetty启动服务) 5.启动成功后,