如何在ABBYY FineReader中创建正则表达式

ABBYY FineReader是一款OCR文字识别软件,在识别文本时,可通过创建自定义语言,识别包含很多非常用元素(如代码编号)的文本字符,今天就为大家列出了在ABBYY FineReader用于创建自定义语言词典的正则表达式具体方法。

若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-zhengzebds.html

注:

1、要将正则表达式符号作为正常字符使用,请在符号前添加反斜线。例如,[t-v]x+ 代表tx、txx、txx 等和ux、uxx等,而\[t-v\]x+则代表[t-v]x、[t-v]xx、[t-v]xxx等。

2、要分组正则表达式元素,请使用括号。例如,(a|b)+|c代表c或任何类似abbbaaabbb、ababab的组合(任何长度非零、其中可能有按任意顺序排列的任意个数的a和b的单词),而a|b+|c则代表a、c和b、bb、bbb等。

示例:

假设识别包含三列的表格:出生日期、姓名、电子邮件地址,在这种情况下,可以创建两种新语言、数据和地址,并为它们指定以下正则表达式:

日期的正则表达式:

表示日的数字可由一位数字(1、2 等)或两位数字(02、12)组成,但不能为零(00 或 0),日的正则表达式应显示为:((|0)[1-9])|([1|2][0-9])|(30)|(31);

月的正则表达式应显示为:((|0)[1-9])|(10)|(11)|(12);

年的正则表达式应显示为:([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。

接下来,需要将所有这些组合起来并用句点隔开数字(如 1.03.1999),句点也是正则表达式符号,所以必须在前面添加反斜线 (\),因此,完整日期的正则表达式应显示为: ((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

 电子邮件地址的正则表达式

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

以上就是用于创建自定义语言词典的正则表达式的具体方法了,希望同属上述内容的描述能够帮助大家对于ABBYY FineReader中关于自定义语言词典的正则表达式中正则表达式的创建以及运用,有一个更详细的认识和运用。

时间: 2024-08-08 04:09:20

如何在ABBYY FineReader中创建正则表达式的相关文章

用户语言该怎么在ABBYY FineReader中创建

ABBYY FineReader是一款OCR文字识别软件,在识别文本时使用文档语言相关的数据,对于包含很多非常用元素(如代码编号)的文本,程序可能无法识别某些字符,因为文档语言可能没有包含此类字符,要识别此类文档,可创建自定义语言,其中包括了所有需要的字符,也可分配多种语言给语言组,然后使用这些组进行识别,那么我们该如何在ABBYY FineReader中创建用户语言. 欲了解更多内容请前往:http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-cj

如何处理ABBYY FineReader 中许多布局相似的文档

如果您需要使用ABBYY FineReader处理大量布局相同的文档(例如表格或问卷),分析每个页面的布局是一件很费时的事情.为了节省时间,可仅分析一组相似文档中的其中一个,并将检测到的区域保存为模板.然后在此组的其他文档中使用该模板. 若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/fr-bujuxiangsi.html 要创建区域模板: 1. 打开图像,然后让程序自动分析布局或手动绘制该区域. 2. 在区域菜单上,单击保存区域模板-.在

如何在ABBYY FineReader pdf识别软件中编辑超链接

ABBYY FineReader 会检测超链接,并在输出文档中重新创建它们的目标地址,检测到的超链接带下划线,显示为蓝色.那么该如何在ABBYY FineReader这款OCR文字识别软件中编辑超链接呢? 在文本窗口中查看已识别文档时,可将鼠标指针放在超链接之上来查看它的地址.要打开超链接,请从超链接的快捷菜单中单击打开超链接,或按住Ctrl 并单击超链接. 要添加.删除.更改超链接的文本或地址: 1. 在文本窗口中,选择所需超链接的文本. 2. 要删除超链接,请右键单击该超链接并从快捷菜单中单

怎样制作ABBYY FineReader中屏幕截图和识别文本

ABBYY Screenshot Reader 可创建计算机屏幕上选定区域的屏幕截图,并将这些截图保存到文件.复制到剪贴板或发送到 ABBYY FineReader,那么在ABBYY FineReader中怎样才能完成这个屏幕计入的功能呢? 若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/fr-shibie-jietu.html 启动 ABBYY Screenshot Reader 时,计算机屏幕上会显示 ABBYY Screenshot

如何在oracle 12c中创建普通用户

-------如何在oracle 12c中创建普通用户------- [[email protected] ~]$ sqlplus / as sysdba SQL*Plus: Release 12.1.0.2.0 Production on Sun Nov 29 21:43:50 2015 Copyright (c) 1982, 2014, Oracle. All rights reserved. Connected to: Oracle Database 12c Enterprise Edit

IAR模板--如何在IAR工程中创建和使用模板

如何在IAR工程中创建和使用模板 1.编辑和使用模板的方式: 路径为:Edit -> Code Templates -> Edit Templates  如下图: 创建好模板后,可以在文件中单击右键,选择Insert Template 来插入你编辑好的代码模板. 2.如果创建编辑各种模板: 定义代码模板的语法是:模板<template name> ,<field> [=默认值] <field> ... ... 模板组成元素:模板名称,参数名称和参数的默认值,

ABBYY FineReader中这些问题你解决了吗?

ABBYY FineReader是一款OCR文字识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,但软件使用过程中,不少用户发现每次重启系统或者不同的用户登录时,ABBYY FineReader都提出激活要求,本文将为大家解决ABBYY FineReader每次重启和更改用户后要求激活的问题. 问题描述: 每次重启Windows系统或者不同的用户登录时,ABBYY FineReader都要求激活. 问题解决: 确保启动程序的用户有权访问以下文件夹: 1.

ABBYY FineReader中识别结果该怎么进行保存

在ABBYY FineReader中, 识别结果可以保存至一个文件.发送至另一应用程序.复制到剪贴板或通过电子邮件发送.您也可以将 OCR 结果发送至 Kindle.com,该结果将在此处转换为 Kindle 格式,以便您可以下载到 Kindle 设备.您可保存整个文档或仅保存选定页面.本文介绍如何保存识别结果. 若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/fr-shibie-jieguo.html 重要!确保在单击"保存"之

图像自动预处理怎样在ABBYY FineReader中进行

扫描图像和数码照片中常见的扭曲文本行.歪斜.噪声和其他缺陷可能会降低识别质量,ABBYY FineReader 可自动消除这些缺陷,也允许手动消除. ABBYY FineReader 有几个图像预处理功能,如果启用这些功能,则程序将会自动确定如何根据类型改进图像质量,并应用任何必要的增强操作:消除噪声.更正歪斜.校正文本行并校正梯形失真. 注意:这些操作可能会花费比较多的时间. 若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/tuxiang