Tesseract-OCR text2image.exe x86 win32

Tesseract-OCR 工具中的 text2image.exe ,下载其他人编译的在 win 系统都无法正常运行.
折腾了好久终于编译出能正常运行的.
--font="font name"  指定字体名字时需要用双引号, 不能用单引号.
--text="input file" 要输入的文本文件需要用 UTF-8 格式.

字体名字需要先运行 text2image --list_available_fonts 命令, 查看有效字体.
比如:
$ text2image --list_available_fonts
  0: Agency FB
  1: Agency FB Bold
  2: Agency FB Bold Oblique
  3: Agency FB Oblique
  4: Algerian
  5: Arial
  6: Arial Black, Heavy
  7: Arial Black, Heavy Oblique

想用第6个字体, 字体名字要写成 --font="Arial Black, Heavy"
字体名字中的逗号也一定要写.

_Tesseract-3.05-training-bin-win32-20160805.7z

时间： 2025-01-06 01:39:20

Tesseract-OCR text2image.exe x86 win32的相关文章

Python下Tesseract Ocr引擎及安装介绍

1.Tesseract介绍 tesseract 是一个google支持的开源ocr项目,其项目地址:https://github.com/tesseract-ocr/tesseract,目前最新的源码可以在这里下载. 实际使用tesseract ocr也有两种方式:1- 动态库方式 libtesseract 2 - 执行程序方式 tesseract.exe 由于本人也是python菜鸟一个,所以方式1暂时不会,只好采取方式2. 2.Tesseract安装包下载 Tesseract的relea

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多.可以直接从repo获取,也可以下载压缩包.不过编译的时候往往也会出现各种奇怪的问题.这里介绍如何简单的配置和编译源码. 参考原文:How to Build Tesseract OCR Library on Windows 编译Tesseract 下载 Windows installer of tesseract-ocr 3.02.02 安装安装过程中勾选Tesseract development files: 编译在安装目录中找到vs2008到工程目录

Tesseract——OCR图像识别入门篇

今天来给大家分一下一下自己觉得还是挺不错的jar包下载网址,it-tidalwave-semantic-aux-1.0.13.jar,作为java开发者可能时时刻刻都在跟jar包打交道,即使这会用不上,大家也都记录一下,以便于以后能够用得着,这个网站叫59biye网也是我找了好久才找到看了一下上面有几十万个jar包可供大家下载,今天跟大家一起分享一下,希望对大家有所帮助.Tesseract--OCR图像识别入门篇

Tesseract OCR集成Android Studio实现OCR识别

Tesseract OCR集成Android Studio实现OCR识别介绍 Tesseract OCR谷歌开源的OCR识别引擎,支持多国文字包括中文简体与繁体.最新的版本是3.x.可以通过安装程序安装在机器上然后通过命令行运行该程序识别各种图片中的文字.同时还提供二次开发包,支持二次开发包括C.C++语言.也可以被移植到Android平台实现移动应用领域的OCR识别APP. 下载在Android平台上使用Tesseract OCR首先要下载Tess2工程,它是专门针对Android平台编译

[转]tesseract OCR Engine overview字符识别学习

原文地址:http://blog.csdn.net/viewcode/article/details/7790065 正文: 原文: An Overview of the Tesseract OCR Engine 下载地址http://code.google.com/p/tesseract-ocr/wiki/Documentation Tesseract的识别步骤大致如下: 1. 连通区域分析: 2. 检测出字符区域区域(轮廓外形),以及子轮廓: 3. 由字符轮廓,得出文本行,以及通过空格识别出

基于Tesseract OCR的文字识别Android应用开发资料整理

前言一.Tesseract OCR引擎 Tesseract OCR是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码.以下是它sourceforge上的网址: http://sourceforge.net/projects/tesseract-ocr/?source=directory 现在已转移到谷歌的代码服务下: https://code.google.com/p/tesseract-oc

Tesseract ocr 3.02学习记录一

光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是印刷.打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料.关于中文OCR,目前国内水平较高的有清华文通.汉王.尚书,其产品各有千秋,价格不菲.国外OCR发展较早,像一些大公司,如IBM.微软.HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的软件系统.对于

SBCL x86 win32版本‘alien callback’的bug及解决方案

前言 SBCL win32版的官方发布版本,最近几个版本(从1.2.8到最新的1.2.13),一直存在一个很烦人的bug,在控制台界面输入Ctrl+C组合键时,SBCL就会异常退出.在SBCL里面,使用Ctrl+C本来可以中断/停止正在运行的程序. 我从1.2.11版本开始注意到有这个问题,在1.2.11之前我使用的1.2.7版本是正常的.现在发布了1.2.13问题仍然没有解决.Google了一下,原来也有人发现了这个问题,并且和SBCL的开发人员有过交流,不过没有找到问题原因.他们的讨论可以参

Tesseract OCR win 32位编译

https://github.com/tesseract-ocr/tesseract/wiki/Compiling 找到该标题:Develop Tesseract 按照上面的步骤执行即可,最后使用 vs2015 打开 sln 工程文件,编译. 编译过程中,会报一些错,把报错的文件编码格式更改 gbk 的即可. 然后下载数据文件 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files 这里就下载英文和中文, eng.traineddat