文档章节

如何在ABBYY FineReader中创建正则表达式

ABBYY
 ABBYY
发布于 2015/10/28 11:27
字数 656
阅读 36
收藏 0

        ABBYY FineReader是一款OCR文字识别软件,在识别文本时,可通过创建自定义语言,识别包含很多非常用元素(如代码编号)的文本字符,今天就为大家列出了在ABBYY FineReader用于创建自定义语言词典的正则表达式具体方法。

       若有疑问可直接访问:http://www.abbyychina.com/FRshiyongjiqiao/abbyyfr-zhengzebds.html


注:

        1、要将正则表达式符号作为正常字符使用,请在符号前添加反斜线。例如,[t-v]x+ 代表tx、txx、txx 等和ux、uxx等,而\[t-v\]x+则代表[t-v]x、[t-v]xx、[t-v]xxx等。

        2、要分组正则表达式元素,请使用括号。例如,(a|b)+|c代表c或任何类似abbbaaabbb、ababab的组合(任何长度非零、其中可能有按任意顺序排列的任意个数的a和b的单词),而a|b+|c则代表a、c和b、bb、bbb等。 

 

示例:

        假设识别包含三列的表格:出生日期、姓名、电子邮件地址,在这种情况下,可以创建两种新语言、数据和地址,并为它们指定以下正则表达式:

日期的正则表达式:

        表示日的数字可由一位数字(1、2 等)或两位数字(02、12)组成,但不能为零(00 或 0),日的正则表达式应显示为:((|0)[1-9])|([1|2][0-9])|(30)|(31);

        月的正则表达式应显示为:((|0)[1-9])|(10)|(11)|(12);

        年的正则表达式应显示为:([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。

        接下来,需要将所有这些组合起来并用句点隔开数字(如 1.03.1999),句点也是正则表达式符号,所以必须在前面添加反斜线 (\),因此,完整日期的正则表达式应显示为: ((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

        电子邮件地址的正则表达式

        [a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

        以上就是用于创建自定义语言词典的正则表达式的具体方法了,希望同属上述内容的描述能够帮助大家对于ABBYY FineReader中关于自定义语言词典的正则表达式中正则表达式的创建以及运用,有一个更详细的认识和运用。



© 著作权归作者所有

ABBYY
粉丝 7
博文 347
码字总数 188111
作品 0
南京
私信 提问
用户语言该怎么在ABBYY FineReader中创建

ABBYY FineReader是一款OCR文字识别软件,在识别文本时使用文档语言相关的数据,对于包含很多非常用元素(如代码编号)的文本,程序可能无法识别某些字符,因为文档语言可能没有包含此类字符...

ABBYY
2015/10/20
62
0
ABBYY FineReader中如何使用在线存储服务

ABBYY FineReader是一款OCR文字识别软件,使用该软件识别文本时,可以从在线存储服务中打开图像或PDF文件,并将已识别文本保存至在线存储服务中,如 Dropbox、SkyDrive或Google Drive等,通过...

ABBYY
2015/10/26
42
0
FineReader Pro for Mac中的Automator工具的用法

  ABBYY FineReader 12是一款图片文字识别软件,能够快速、准确、便捷地将扫描文件、PDF格式、数字或数码图像等转换成可编辑的格式。其中简体中文版和Professional版适合个人安装使用,而A...

ABBYY
2016/04/18
97
0
ABBYY FineReader 12你可能经常会遇见的问题(二)

ABBYY FineReader 12是市场领先的OCR文字识别软件,可快速方便地将扫描纸质文档、PDF文件和数码相机的图像转换成可编辑、可搜索的文本,初次接触该软件的用户可能会有很多疑问,上文为大家整...

ABBYY
2016/01/06
555
0
如何在ABBYY FineReader中创建屏幕截图和识别文本

ABBYY Screenshot Reader 可创建计算机屏幕上选定区域的屏幕截图,并将这些截图保存到文件、复制到剪贴板或发送到 ABBYY FineReader,那么在ABBYY FineReader 12 这款OCR识别软件中该怎么使用...

ABBYY
2015/11/04
121
0

没有更多内容

加载失败,请刷新页面

加载更多

[top]cpu内存

%Cpu(s): 96.0 us用户进程整理cpu的占比,按整个cpu算。 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND ......

Danni3
18分钟前
3
0
JavaScript权威指南笔记2

第二章、词法结构 1、字符集 JavaScript程序:Unicode字符集编写 Unicode:ASCII和Latin-1的超集,支持所有在用的语言。 ECMAScript 3要求JavaScript的实现必须支持Unicode 2.1及后续版本 EC...

_Somuns
26分钟前
4
0
数据安全管理:RSA算法,签名验签流程详解

本文源码:GitHub·点这里 || GitEE·点这里 一、RSA算法简介 1、加密解密 RSA加密是一种非对称加密,在公开密钥加密和电子商业中RSA被广泛使用。可以在不直接传递密钥的情况下,完成加解密操...

知了一笑
今天
7
0
Podman 使用指南

> 原文链接:Podman 使用指南 Podman 原来是 CRI-O 项目的一部分,后来被分离成一个单独的项目叫 libpod。Podman 的使用体验和 Docker 类似,不同的是 Podman 没有 daemon。以前使用 Docker...

米开朗基杨
今天
6
0
拯救 项目经理个人时间的5个技巧

优秀的项目经理都有一个共同点,那就是良好的时间管理能力。专业的项目经理会确保他们的时间投入富有成效,尽可能避免时间浪费。 时间管理叫做GTD,即Getting Things Done——“把事情做完”...

Airship
今天
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部