Linux Tesseract-OCR安装与训练样本

  1. 安装对应的lib (install the libs)

参考:http://www.eefocus.com/winter1988/blog/13-03/292209_03d5b.html

sudo apt-get install autoconf automake libtool
sudo apt-get install libpng12-dev
sudo apt-get install libjpeg62-dev
sudo apt-get install libtiff4-dev
sudo apt-get install zlib1g-dev

确保安装下面的lib:

 sudo apt-get install  gcc
 sudo apt-get install  g++
 sudo apt-get install  automake

安装Leptonica:

$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
$tar zxvf leptonica-1.69.tar.gz

cd到其目录下:

./configure && make && sudo make install

安装 Tesseract:

$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
$tar zxvf tesseract-ocr-3.02.02.tar.gz

cd到其目录下:

./configure && make && sudo make install

Install 后 需要 sudo ldconfig

使用训练包的话需要先安装英文包

设置 TESSDATA_PREFIX 语言包所在的目录(语言包在Win下训练好后直接导入tessdata目录下即可)

export TESSDATA_PREFIX=/usr/tesseract-ocr/

2.训练样本

参考:http://blog.csdn.net/yasi_xi/article/details/8763385

http://blog.csdn.net/marvinhong/article/details/8459591

需要注意的是最后五个包的重命名

Linux Tesseract-OCR安装与训练样本,布布扣,bubuko.com

时间: 2024-08-07 20:31:07

Linux Tesseract-OCR安装与训练样本的相关文章

Python下Tesseract Ocr引擎及安装介绍

1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载. 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesseract  2  - 执行程序方式 tesseract.exe 由于本人也是python菜鸟一个,所以方式1暂时不会,只好采取方式2. 2.Tesseract安装包下载 Tesseract的relea

Tesseract OCR集成Android Studio实现OCR识别

Tesseract OCR集成Android Studio实现OCR识别 介绍 Tesseract OCR谷歌开源的OCR识别引擎,支持多国文字包括中文简体与繁体.最新的版本是3.x.可以通过安装程序安装在机器上然后通过命令行运行该程序识别各种图片中的文字.同时还提供二次开发包,支持二次开发包括C.C++语言.也可以被移植到Android平台实现移动应用领域的OCR识别APP. 下载 在Android平台上使用Tesseract OCR首先要下载Tess2工程,它是专门针对Android平台编译

[转]tesseract OCR Engine overview字符识别学习

原文地址:http://blog.csdn.net/viewcode/article/details/7790065 正文: 原文: An Overview of the Tesseract OCR Engine 下载地址http://code.google.com/p/tesseract-ocr/wiki/Documentation Tesseract的识别步骤大致如下: 1. 连通区域分析: 2. 检测出字符区域区域(轮廓外形),以及子轮廓: 3. 由字符轮廓,得出文本行,以及通过空格识别出

基于Tesseract OCR的文字识别Android应用开发资料整理

前言 一.Tesseract OCR引擎 Tesseract OCR是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码.以下是它sourceforge上的网址: http://sourceforge.net/projects/tesseract-ocr/?source=directory 现在已转移到谷歌的代码服务下: https://code.google.com/p/tesseract-oc

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多.可以直接从repo获取,也可以下载压缩包.不过编译的时候往往也会出现各种奇怪的问题.这里介绍如何简单的配置和编译源码. 参考原文:How to Build Tesseract OCR Library on Windows 编译Tesseract 下载 Windows installer of tesseract-ocr 3.02.02 安装 安装过程中勾选Tesseract development files: 编译 在安装目录中找到vs2008到工程目录

            Linux的 JDK 安装

mkdir  /usr/java cd /usr/java 到官网下载最新jdk http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 然后进行上传到/usr/java上 cd /usr/java rz  从window找到你下载jdk的路径 然后进行解压 tar -zxvf jdk-8u144-linux-x64.tar.gz 设置环境变量,在/etc/profile最后添加路径

在虚拟机的Linux系统下安装wineqq

|   版权声明:本文为博主原创文章,未经博主允许不得转载. 本文参考教程:http://www.ubuntukylin.com/ukylin/forum.php?mod=viewthread&tid=7688&extra=page%3D1 WineQQ下载地址:http://pan.baidu.com/s/1c2FSTsk qq是一款国内非常著名的聊天工具,但是在腾讯的官网并没有Linux操作系统下的qq安装版本,但是我们也有办法在Linux系统下安装qq,下面我们实现在Linux安装w

Arch Linux最小化安装X

Xorg Xorg-server 安装xorg-server pacman -S xorg-server 可选:xorg-server-utils pacman -S xorg-server-utils Xorg-server-utils meta-package pulls in the most useful packages for certain configuration tasks, they are pointed out in the relevant sections. Dri

Arch Linux最小化安装LXDE桌面环境

安装最小化的LXDE桌面环境: pacman -S lxde-common 安装LXDE Session: pacman -S lxsession 不安装这个没法登录进桌面环境 安装LXDE面板: pacman -S lxpanel 不安装这个,进入LXDE桌面环境后什么都没有 安装窗口管理器: pacman -S openbox 不安装这个,既不能移动窗口,也不能最大.最小化窗口 安装LXDE环境下的终端程序: pacman -S lxterminal 安装LXDE环境下的文件管理器: pac