linux安装Tesseract-OCR

安装Tesseract-OCR
1. leptonica 需要源码编译安装http://www.leptonica.org/
leptonica 包: leptonica-1.73.tar.gz
解压后切换到leptonica-1.68 根目录
./configure
make
make install
2.tesseract安装:
依赖安装完毕后开始安装tesseract
下载tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到tesseract-3.01 根目录
（如果在make时遇到类似strngs.h:1: error: stray ‘\357‘ in program 的错误，请将tesseract-3.01/ccutil/strngs.h 文件转为ANSI 编码保存,再重新编译）
./autogen.sh
./configure
make
make install
ldconfig
tesseract英文语言包安装:
下载tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata/
测试一下:
切换到解压后的tesseract-3.01 根目录(这个目录下有一个自带的phototest.tif 可以做测试用)
tesseract phototest.tif phototest -l eng
输出:1

这时应该在当前目录生成一个phototest.txt 文本文件,内容就是phototest.tif 显示的文字.

时间： 2024-10-15 21:47:32

linux安装Tesseract-OCR的相关文章

Python下Tesseract Ocr引擎及安装介绍

1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载. 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesseract 2 - 执行程序方式 tesseract.exe 由于本人也是python菜鸟一个,所以方式1暂时不会,只好采取方式2. 2.Tesseract安装包下载 Tesseract的relea

linux 安装Tesseract-OCR

linux 安装Tesseract-OCR 准备工作:一.编译环境: 1. gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yum install gcc gcc-c++ make 2. 依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上) autoconf automake libtool libjpeg-devel l

Tesseract OCR集成Android Studio实现OCR识别

Tesseract OCR集成Android Studio实现OCR识别介绍 Tesseract OCR谷歌开源的OCR识别引擎,支持多国文字包括中文简体与繁体.最新的版本是3.x.可以通过安装程序安装在机器上然后通过命令行运行该程序识别各种图片中的文字.同时还提供二次开发包,支持二次开发包括C.C++语言.也可以被移植到Android平台实现移动应用领域的OCR识别APP. 下载在Android平台上使用Tesseract OCR首先要下载Tess2工程,它是专门针对Android平台编译

基于Tesseract OCR的文字识别Android应用开发资料整理

前言一.Tesseract OCR引擎 Tesseract OCR是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码.以下是它sourceforge上的网址: http://sourceforge.net/projects/tesseract-ocr/?source=directory 现在已转移到谷歌的代码服务下: https://code.google.com/p/tesseract-oc

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多.可以直接从repo获取,也可以下载压缩包.不过编译的时候往往也会出现各种奇怪的问题.这里介绍如何简单的配置和编译源码. 参考原文:How to Build Tesseract OCR Library on Windows 编译Tesseract 下载 Windows installer of tesseract-ocr 3.02.02 安装安装过程中勾选Tesseract development files: 编译在安装目录中找到vs2008到工程目录

linux安装(Ubuntu)——（二）

centos的安装参考: http://www.runoob.com/linux/linux-install.html Linux 安装(Ubuntu) 虚拟机:虚拟机(Virtual Machine),在计算机科学中的体系结构里,是指一种特殊的软件,他可以在计算机平台和终端用户之间建立一种环境,而终端用户则是基于这个软件所建立的环境来操作软件.在计算机科学中,虚拟机是指可以像真实机器一样运行程序的计算机的软件实现. 一．安装Vmware 虚拟机第一步:执行VMware-worksta

linux安装 apache2.2 django mod_wsgi

系统是ubuntu12.04 一.安装apache sudo apt-get install apache 启动:sudo apachectl start (开机默认启动的) 重启:sudo apachectl restart 关闭:sudo apachectl stop 安装之后在浏览器中访问127.0.0.1,如果出现"It works!" 这样的网页,说明安装成功啦. 二.安装mod_wsgi: 我在官网上下载的源码:https://code.google.com/p/modws

Linux安装Eclipse及项目部署

安装Eclipse 1. 首先解压Eclipse tar -zxvf eclipse-standard-kepler-SR1-linux-gtk.tar.gz -C user/local/src 2. 重新启动加载JDK 3. 桌面创建快捷方式 Create Launcher 选择启动文件切换图标项目部署 1. 首先打开压缩文件 $ unzip text.zip 2. 然后修改 .sql文件的编码查看文件编码 file bank.sql 修改文件编码 iconv -f GBK -t UT

搜狗输入法linux安装以及 12个依赖包下载链接分享

搜狗输入法linux安装版,先安装各种依赖包,大概12个依赖,可能中途还需要其他依赖,可以效仿解决依赖问题.如图这12个文件要是手动点击下载,那也太笨点了,我们要用shell命令批量下载.命令如下:wget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs_4.2.8.5-2_amd64.debwget -c http://http.kali.org/pool/main/f/fcitx/fcitx-libs-qt_4.2.8.5-2_amd

Linux安装及服务控制

一. 版本 Red Hat 企业版 Red Hat Enterprise Linux (简称RHEL) http://www.redhat.com Fedora社区版由Red Hat资助的社区维护,定位于个人桌面用户 http://fedoraproject.org CentOS社区版 Community Enterprise Operating System(社区企业操作系统) http://www.centos.org 二. 安装步骤插入RHEL6安装光盘,引导安装程序设置主机

猜你喜欢

SQL存储过程删除数据库日志文件的方法

--日志文件收缩至多少M DECLARE @DBLogSise AS INT SET @DBLogSise=0 --查询出数据库对应的日志文件名称 DECLARE @strDBName AS NVAR ...

dubbo连接zookeeper注册中心因为断网导致线程无限等待问题

最近维护的系统切换了网络环境,由联通换成了电信网络,因为某些过滤规则导致系统连不上zookeeper服务器(应用系统机器在深圳,网络为电信线路,zookeeper服务器在北京,网络为联通线路),因为我 ...

easyui datagrid在IE洌览器下reload不能刷新数据

在IE下,当调用reload时,数据不刷新,通过数据库追踪可发现并没有执行数据库检索.google浏览器正常. 原因:IE下,请求的地址与原来相同,界面从缓存中加载,不执行数据检索. 查找到的解决方法 ...

【UVA】10534 - Wavio Sequence（LIS最长上升子序列）

这题一看10000的数据量就知道必须用nlog(n)的时间复杂度. 所以特意去看了最长上升子序列的nlog(n)的算法. 如果有2个位置,该位置上的元素为A[i]和A[j],并且他们满足以下条件: 1 ...

二叉树的所有路径

九章答案 // version 1: Divide Conquer public class Solution { /** * @param root the root of the binary t ...

图像旋转的原理

图像旋转是指图像以某一点为中心旋转一定的角度,形成一幅新的图像的过程.当然这个点通常就是图像的中心.既然是按照中心旋转,自然会有这样一个属性:旋转前和旋转后的点离中心的位置不变. 根据这个属性,我们可 ...

使用Anthem.NET 1.5中的FileUpload控件实现Ajax方式的文件上传

Anthem.NET刚刚发布了其最新的1.5版本,其中很不错的一个新功能就是对文件上传功能的Ajax实现.本文将简要介绍一下该功能的使用方法. Anthem.NET的下载与安装 Anthem.NET可 ...

Android中的软件Watchdog

由于Android的SystemServer内有一票重要Service,所以在进程内有一个软件实现的Watchdog机制,用于监视SystemServer中各Service是否正常工作.如果超过一定时 ...

如何让Geometry应用Transfrom

参考https://stackoverflow.com/questions/249971/wpf-how-to-apply-a-generaltransform-to-a-geometry-data- ...

一名高效程序员应该有的7个习惯

花的时间越多就能写出越可靠的代码吗?不一定.那如何才能写出优秀代码的呢? 提示:懒惰是一个良好的开始哦. Perl 编程语言的原作者 Larry Wall 曾说过,伟大的程序员都有三个优点:懒惰.急躁 ...

项目管理师备考知识点精讲之信息系统开发基础考情分析

信息系统项目管理师考试是计算机软件水平考试中的一个高级资格考试,是软考中的大热门.信息系统项目管理师证书含金量高,可以评高级职称,是申请高级项目经理的必要条件,还可以挂靠.下面希赛软考学院为您带来信息 ...

Openstack folsom installation

rpm -Uvh http://download.fedoraproject.org/pub/epel/6/i386/epelrelease-6-8.noarch.rpm 前提:本文档中涉及到的所有主 ...

OSChina 技术周刊第二十三期 —— 每周技术精粹

每周技术抢先看,总有你想要的! 移动开发 [软件]Android 调试工具 Stetho 前端开发 [翻译]25 个超棒的 HTML5 & JavaScript 游戏引擎开发库 [翻译]什么时 ...

BroadcastReceiver详解(一)

今天我们来讲一下Android中BroadcastReceiver的相关知识. BroadcastReceiver也就是“广播接收者”的意思,顾名思义,它就是用来接收来自系统和应用中的广播. 在And ...

刚开始接触脚本，一道脚本练习

题目:编写一个脚本/root/bin/createuser.sh,脚本的执行语法必须是:createuser.sh -u username -m password,选项与参数间可支持多空格,但不能顺序 ...

vuejs2

<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http ...

Linux 文件管理（C语言库函数）

打开和关闭文件 FILE * fopen(const char *path,const char *mode); int fclose(FILE *stream) fopen以mode模式打开名为pa ...

程序员在页面上常犯的错误以及改正方法

我是一个性情乖戾的Web用户,但我想这也帮助促使我成为了一名优秀的Web开发人员.当我看到一个网站上有让人不爽的设计时就会非常的恼怒,一些很简单的东西为什么做不好?下面是5种常见的可用性方面的错误,以 ...

Php5.5新特性 Generators详解

在**PHP5.5.0**版本中,新增了生成器*(Generators)*特性,用于简化实现迭代器接口*(Iterator)*创建简单的迭代器的复杂性. 通过生成器,我们可以轻松的使用foreach迭 ...

生理期遇到高考怎么办女人一定要学的排卵期自测

生理期遇到高考怎么办女人一定要学的排卵期自测 http://baozoumanhua.com/users/10781344/followingshttp://baozoumanhua.com/use ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.045 s.