VintaSoft Imaging .NET使用教程:如何将OCR设置为只识别数字

VintaSoftImaging.NET SDK是一个为.NET开发人员开发的,强大而易于使用的图像工具包。它可以让你加载、查看、处理、打印和保存数字图像,可将它们转换为不同的图像格式,可用多种TIFF和动态GIF文件提高您的工作效率。

并且该产品还可以添加多个模块:图片注释模块、PDF模块、JBIG2模块、JPEG2000模块、文档清洁模块、DICOM模块、OCR模块和表单处理模块,结合这些模块开发人员可以开发出现代化的商业应用程序 这篇文章主要介绍VintaSoft Imaging .NET怎么和OCR模块结合,OCR识别模块识别率高,支持多国语言包含中文,并且可以自定义多种功能,下面的代码主要讲述了怎么设置OCR只对图片中的数字进行识别,具体如下:

using System;
using Vintasoft.Imaging;
using Vintasoft.Imaging.Ocr;
using Vintasoft.Imaging.Ocr.Results;
using Vintasoft.Imaging.Ocr.Tesseract;

class TesseractOcrSetVariableExample
{
    // Required assemblies to run this code:
    // Vintasoft.Imaging.dll, Vintasoft.Imaging.Ocr.dll, Vintasoft.Imaging.Ocr.Tesseract.dll
    public static void OcrImageWithDigits(string filename)
    {
        // load image(s)
        ImageCollection images = new ImageCollection();
        images.Add(filename);

        Console.WriteLine("Create Tesseract OCR engine...");
        using (TesseractOcr tesseractOcr = new TesseractOcr())
        {
            Console.WriteLine("Initialize OCR engine...");
            tesseractOcr.Init(new OcrEngineSettings(OcrLanguage.English));

            // set white list
            tesseractOcr.SetVariable(
                "tessedit_char_whitelist", "01234567890");

            // foreach image
            foreach (VintasoftImage image in images)
            {
                Console.WriteLine("Recognize the image...");
                OcrPage page = tesseractOcr.Recognize(image);

                Console.WriteLine("Page Text:");
                Console.WriteLine(page.GetText());
                Console.WriteLine();
            }

            // shutdown OCR engine
            tesseractOcr.Shutdown();
        }

        // free resources
        images.ClearAndDisposeItems();
        images.Dispose();
    }
}

本文转自VintaSoft Imaging .NET

查看产品详情evget.com/product/1750

时间: 2024-10-19 13:45:59

VintaSoft Imaging .NET使用教程:如何将OCR设置为只识别数字的相关文章

导出Excel之Epplus使用教程4(其他设置)

导出Excel之Epplus使用教程1(基本介绍) 导出Excel之Epplus使用教程2(样式设置) 导出Excel之Epplus使用教程3(图表设置) 导出Excel之Epplus使用教程4(其他设置) 1.嵌入VBA代码 首先将vba代码保存成txt文本格式,然后用epplus去调用这个txt文本文件即可,非常简单,当然要想vba调用成功,前提是你的vba代码是没问题的喽! worksheet.CodeModule.Name = "sheet" ; worksheet.CodeM

导出Excel之Epplus使用教程2(样式设置)

导出Excel之Epplus使用教程1(基本介绍) 导出Excel之Epplus使用教程2(样式设置) 导出Excel之Epplus使用教程3(图表设置) 导出Excel之Epplus使用教程4(其他设置) 1.公式计算 excel中离不开各种各样的公式计算,在Epplus中运用公式有两种方式,你都可以尝试一下: worksheet.Cells["D2:D5"].Formula = "B2*C2";//这是乘法的公式,意思是第二列乘以第三列的值赋值给第四列,这种方法

导出Excel之Epplus使用教程3(图表设置)

导出Excel之Epplus使用教程1(基本介绍) 导出Excel之Epplus使用教程2(样式设置) 导出Excel之Epplus使用教程3(图表设置) 导出Excel之Epplus使用教程4(其他设置) Epplus的图表实现是很简单的,它支持的图表类型也很多,基本上能满足我们的需求.创建图表分为三步(以柱状图举例): 1.创建图表 ExcelChart chart = worksheet.Drawings.AddChart("chart", eChartType.ColumnCl

【web开发】☆★之利用POI操作Excel表格系列教程【8】设置单元格对其方式

[web开发]☆★之利用POI操作Excel表格系列教程[8]设置单元格对其方式 package csg.xiaoye.poidemo; import java.io.FileOutputStream; import org.apache.poi.hssf.usermodel.HSSFCellStyle; import org.apache.poi.hssf.usermodel.HSSFRichTextString; import org.apache.poi.hssf.usermodel.HS

iOS Sprite Kit教程之场景的设置

iOS Sprite Kit教程之场景的设置 Sprite Kit中设置场景 在图2.8所示的效果中,可以看到新增的场景是没有任何内容的,本节将讲解对场景的三个设置,即颜色的设置.显示模式的设置以及测试信息的设置. Sprite Kit中设置场景的背影颜色 backgroundColor属性可以用来对场景的背影颜色进行设置,其语法形式如下: var backgroundColor: CGColor! UIColor类给开发者提供了一些便利的方法快速制作常见的颜色的名称,而不是使用确定的RGB值.

OCR移动端车牌识别SDK:打造优质APP

为了达到:方便,快捷,精准提高前端人员工作效率.增强C端用户产品体验价值和目的. OCR移动端车牌识别-即通过手机/iPad/PDA手持终端,内置摄像头视频预览(扫一扫)模式,本地离线识别保存车牌号码. OCR移动端车牌识别(利用OCR光学字符分割识别技术)通过手机/iPad/PDA手持终端,内置摄像头视频预览(扫一扫)模式,将需要识别的车牌图像文件中的车牌号码,车牌颜色,车牌类型等自动采集处理并转换成可以编辑的文本格式,供软件开发商二次编辑调用,提供车牌识别SDK软件开发包. 车牌识别 机动车

OCR移动端车牌识别SDK:打造优质APP;

我们为了达到:方便,快捷,精准提高前端人员工作效率.增强C端用户产品体验价值和目的. OCR移动端车牌识别-即通过手机/iPad/PDA手持终端,内置摄像头视频预览(扫一扫)模式,本地离线识别保存车牌号码. OCR移动端车牌识别(利用OCR光学字符分割识别技术)通过手机/iPad/PDA手持终端,内置摄像头视频预览(扫一扫)模式,将需要识别的车牌图像文件中的车牌号码,车牌颜色,车牌类型等自动采集处理并转换成可以编辑的文本格式,供软件开发商二次编辑调用,提供车牌识别SDK软件开发包. OCR移动端

数据挖掘入门系列教程(八)之使用神经网络(基于pybrain)识别数字手写集MNIST

目录 数据挖掘入门系列教程(八)之使用神经网络(基于pybrain)识别数字手写集MNIST 下载数据集 加载数据集 构建神经网络 反向传播(BP)算法 进行预测 F1验证 总结 参考 数据挖掘入门系列教程(八)之使用神经网络(基于pybrain)识别数字手写集MNIST 在本章节中,并不会对神经网络进行介绍,因此如果不了解神经网络的话,强烈推荐先去看<西瓜书>,或者看一下我的上一篇博客:数据挖掘入门系列教程(七点五)之神经网络介绍 本来是打算按照<Python数据挖掘入门与实践>

【转】机器学习教程 十四-利用tensorflow做手写数字识别

模式识别领域应用机器学习的场景非常多,手写识别就是其中一种,最简单的数字识别是一个多类分类问题,我们借这个多类分类问题来介绍一下google最新开源的tensorflow框架,后面深度学习的内容都会基于tensorflow来介绍和演示 请尊重原创,转载请注明来源网站www.shareditor.com以及原始链接地址 什么是tensorflow tensor意思是张量,flow是流. 张量原本是力学里的术语,表示弹性介质中各点应力状态.在数学中,张量表示的是一种广义的"数量",0阶张量