linux 安装Tesseract-OCR

linux 安装Tesseract-OCR

准备工作:
一.编译环境:

1. gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)

yum install gcc gcc-c++ make

2. 依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)

    autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:

yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

二. leptonica 需要源码编译安装

参考资料:

http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113

http://www.leptonica.org/source/README.html

下载leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gz

解压后切换到leptonica-1.68 根目录

./configure ;make ;
make install ;

三.tesseract安装:
 依赖安装完毕后开始安装tesseract
 下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz

解压后切换到tesseract-3.01 根目录

  --如果在make时遇到类似strngs.h:1: error: stray ‘\357‘ in program 的错误,请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再重新编译

./autogen.sh

./configure

make

make install

ldconfig

tesseract英文语言包安装:  
 下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
 解压后将tesseract-ocr/tessdata 下的所有文件全部拷贝到/usr/local/share/tessdata 下

安装完毕.
测试一下:
 切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 可以做测试用)
 命令行:

tesseract phototest.tif phototest -l eng

输出:

Tesseract Open Source OCR Engine v3.01 with Leptonica

Page 0

这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字.
 
  摘自 雪人的博客

linux 安装Tesseract-OCR

时间: 2024-11-06 10:07:31

linux 安装Tesseract-OCR的相关文章

Python下Tesseract Ocr引擎及安装介绍

1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载. 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesseract  2  - 执行程序方式 tesseract.exe 由于本人也是python菜鸟一个,所以方式1暂时不会,只好采取方式2. 2.Tesseract安装包下载 Tesseract的relea

Tesseract OCR集成Android Studio实现OCR识别

Tesseract OCR集成Android Studio实现OCR识别 介绍 Tesseract OCR谷歌开源的OCR识别引擎,支持多国文字包括中文简体与繁体.最新的版本是3.x.可以通过安装程序安装在机器上然后通过命令行运行该程序识别各种图片中的文字.同时还提供二次开发包,支持二次开发包括C.C++语言.也可以被移植到Android平台实现移动应用领域的OCR识别APP. 下载 在Android平台上使用Tesseract OCR首先要下载Tess2工程,它是专门针对Android平台编译

基于Tesseract OCR的文字识别Android应用开发资料整理

前言 一.Tesseract OCR引擎 Tesseract OCR是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码.以下是它sourceforge上的网址: http://sourceforge.net/projects/tesseract-ocr/?source=directory 现在已转移到谷歌的代码服务下: https://code.google.com/p/tesseract-oc

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多.可以直接从repo获取,也可以下载压缩包.不过编译的时候往往也会出现各种奇怪的问题.这里介绍如何简单的配置和编译源码. 参考原文:How to Build Tesseract OCR Library on Windows 编译Tesseract 下载 Windows installer of tesseract-ocr 3.02.02 安装 安装过程中勾选Tesseract development files: 编译 在安装目录中找到vs2008到工程目录

linux安装(Ubuntu)——(二)

centos的安装参考: http://www.runoob.com/linux/linux-install.html Linux 安装(Ubuntu) 虚拟机:虚拟机(Virtual Machine),在计算机科学中的体系结构里,是指一种特殊的软件,他可以在计算机平台和终端用户之间建立一种环境,而终端用户则是基于这个软件所建立的环境来操作软件.在计算机科学中,虚拟机是指可以像真实机器一样运行程序的计算机的软件实现. 一.    安装Vmware 虚拟机 第一步:执行VMware-worksta

linux安装 apache2.2 django mod_wsgi

系统是ubuntu12.04 一.安装apache sudo apt-get install apache 启动:sudo apachectl start (开机默认启动的) 重启:sudo apachectl restart 关闭:sudo apachectl stop 安装之后在浏览器中访问127.0.0.1,如果出现"It works!" 这样的网页,说明安装成功啦. 二.安装mod_wsgi: 我在官网上下载的源码:https://code.google.com/p/modws

Linux安装Eclipse及项目部署

安装Eclipse 1. 首先解压Eclipse tar -zxvf eclipse-standard-kepler-SR1-linux-gtk.tar.gz -C user/local/src 2. 重新启动 加载JDK 3. 桌面创建快捷方式 Create Launcher 选择启动文件 切换图标 项目部署 1. 首先打开压缩文件 $ unzip text.zip 2. 然后修改 .sql文件的编码 查看文件编码 file bank.sql 修改文件编码 iconv -f GBK -t UT

搜狗输入法linux安装 以及 12个依赖包下载链接分享

搜狗输入法linux安装版,先安装各种依赖包,大概12个依赖,可能中途还需要其他依赖,可以效仿解决依赖问题.如图这12个文件要是手动点击下载,那也太笨点了,我们要用shell命令批量下载.命令如下:wget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs_4.2.8.5-2_amd64.debwget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs-qt_4.2.8.5-2_amd

Linux安装及服务控制

一.  版本 Red Hat 企业版   Red Hat Enterprise Linux (简称RHEL) http://www.redhat.com Fedora社区版 由Red Hat资助的社区维护,定位于个人桌面用户 http://fedoraproject.org CentOS社区版 Community Enterprise Operating System(社区企业操作系统) http://www.centos.org 二.  安装步骤 插入RHEL6安装光盘,引导安装程序 设置主机