文档章节

.NET图像处理库ImageGear for .NET v23发布,新增AcroForm功能和亚洲OCR丨附下载

Harriet666
 Harriet666
发布于 2017/06/06 14:38
字数 1889
阅读 13
收藏 1

ImageGear for .NET是一款图形图像处理控件,可以轻松地为程序添加扫描/压缩/条形码识别/PDF/文件查看与处理/图形编辑与处理等功能。具有扫描,压缩,浏览、添加注释,打印,图像编辑,OCR以及PDF和矢量图像支持,使开发人员可以快速地开发出图像处理程序,可用于.NET Framework2.0、3.0、3.5、4.0,ASP.NET,WPF,SilverLight,DirectX 10和Direct3D 10。支持超过100种图片格式,包含:TIFF, JPEG, CAD, Vector, 3D PDF, PDF/A, PS等。

最新版本的ImageGear.NET v23,为开发人员提供了新的AcroForm功能;将亚洲光学字符识别(OCR)输出添加到PDF,通过将中文、日文和韩文OCR输出结合到PDF中,扩大了适应性和在全球无缝创建PDF的能力;并通过合规性检查加强了PDF/A转换。

【ImageGear.NET v23最新版下载>>>】

新增功能

PDF AcroForms——创建、读取和写入PDF表单字段和数据

d353839346c4441381fb5d0d1e386b06o.jpg
高级AcroForms SDK提供强大的表单功能

.NET开发中AcroForms SDK *可以将AcroForm字段添加、更新或删除到新的或现有的PDF中。这为你的用户提供从表单域读取和写入数据的方式,而无需离开你的网站或应用程序。如果他们需要更新现有的PDF,SDK会通过注释工具提供帮助。

使用表单增强你的应用程序

需要让你的用户访问数字表单?预先填充表单域允许用户直接从你的网站或应用程序将数据写入表单。将表单字段添加到PDF,包括:

·  复选框

·  文本字段

·  列表框

·  组合框

·  状态设置框

ImageGear还允许低级别访问PDF,以便用户可以直接从你的网站或应用程序访问任何文档或AcroForm。

 

亚洲OCR——包括中文、日文和韩文的语言自动检测和PDF输出
274011dbdffa41fba34c89f02c47a271o.jpg

 

ImageGear增加了其先进的光学字符识别功能。ImageGear支持亚洲语言,提供中文、日文和韩文的OCR。

语言支持

亚洲OCR支持横向和纵向文字的亚洲语言。支持的语言有:

·  传统中文

·  简体中文

·  日语

·  韩语

自动语言检测技术

ImageGear使用自动语言检测技术来完成文档的OCR,包括含有亚洲语言的文档。此功能可以帮助你的业务在亚洲市场取得成功。

亚洲OCR输出格式

通过使用所有识别信息(字体细节、定位的图像区域和识别的表格结构信息)来创建格式化的输出,以重述原始文档的含义。亚洲版利用OCR引擎的强大功能,用亚洲语言创建文档图像的强大格式化输出。

亚洲版输出格式:

·  TXT

·  Word

·  Excel

·  HTML

·  PDF 

 

功能增强

OCR——改进OCR布局、分区顺序和文档

21c94ebab7e64b349fc0a74e76e8c3c0o.jpg

.NET,C,C ++和C#OCR

ImageGear OCR可用于Windows上的多种平台和语言,包括C,C ++,C#和其他.NET语言。ImageGear提供超过100种语言的全页光学字符识别(OCR),包括西方和亚洲语言如中文、日文和韩文。ImageGear的自动语言检测功能使OCR功能完善。

OCR可作为附件购买,为应用程序开发提供完整的文档图像库。我们的C#OCR SDK:

·  包括100多种不同的语言

·  检测并读取中文、韩文和日文

·  识别单个图像中的多种语言的字符

·  OCR样本可用于C#,VB.NET,C和C ++

全页OCR

·  通过我们的自动分区和细分功能,你的用户可以:

·  将页面自动分割为各个区域进行处理

·  根据流程、表格或图形将类型分配给定位的区域

·  用先进技术检测表格,改善数据结果重构

·  处理页面的全幅图像或单个区域

·  由用户定义区域,从文件加载或由引擎自动检测

最大精度的图像预处理

OCR之前会发生什么?看看OCR的预处理步骤:

·  高级图像处理方法可用于提高OCR精度

·  自动反转功能检测图像是否需要反转以获得最高精度

·  自动图像方向检测和调整图像

·  纠错方法检测图像并自动校正,提高分割和识别精度

·  去斑方法去除图像捕获过程中的污点和缺陷

·  分辨率增强提高了低分辨率图像的质量

预定义和可定制的字典

ImageGear的OCR在扫描文档时使用预定义的字典和数据字典。ImageGear使用17种不同语言的高级拼写检查,每种语言都在特定字典中。17个词典中的每一个都包含100,000到200,000个条目。垂直字典可以改善医疗和法律行业的拼写检查和OCR准确性。

卓越的结果处理

ImageGear OCR引擎以Unicode格式处理所有数据。可以为具有多个输出选项的特定代码页格式化数据输出,如:

·  PDF上的图像

·  基于文本的PDF

·  Microsoft Office 2007

·  Microsoft Office 97(Word,Excel和Powerpoint)

·  RTF

·  HTML

·  XML

OCR版本:ImageGear的功能选项

ImageGear有三个不同的功能选项。三个选项之间的主要区别是OCR引擎创建的输出格式。你的开发选项如下:

1、标准版

标准版为西方语言(如英语)创建输出格式。标准版仅输出文本文件并生成PDF。它包括的文件格式是可搜索的文本PDF和文本文档。

2、标准版Plus

标准版本Plus为西方语言(如英语)创建格式化输出。使用识别技术创建格式化的输出,以识别字体细节、定位图像区域并识别表格结构以创建原始文档。它包括的文件格式有Word、Excel、HTML、可搜索的PDF和文本文档。

3、亚洲版

亚洲版为亚洲语言(如中文,日语和韩语)创建格式化的输出。这种格式化的输出是使用与标识字体相同的识别技术来创建的,它标识字体细节、定位图像区域,并识别表格结构。格式包括Word、Excel、HTML、可搜索的PDF和文本文档。

*目前该功能仅适用于ImageGear for .NET。

 

PDF/A——丰富的PDF/A,并具有PDF/A转换的合规性检查

55374f37758442cbb78dd8962f7c570do.jpg

将PDF文件转换成PDF/A文件

PDF/A是一种ISO标准类型的PDF文件,用于存档和长期保存文件,以便它们能够与原始文件完全一致。元素(如字体)必须是独立的或嵌入的,以保留原始文件的格式和属性。PDF/A已经在欧洲流行,在美国正成为更广泛使用的文件格式。

ImageGear PDF/A特点:

·  根据光栅图像文件和扫描的图像创建PDF/A文件

·  验证PDF/X(PDF/X-1a,PDF/X-3和PDF/X-4)和PDF/A(PDF/A-1a和PDF/A-1b)合规性的PDF文件

·  将不合格的PDF文件转换为符合PDF/A-1b的PDF文件

·  新的增强功能可以改善从PDF到PDF / A的合规检查和转换过程

*目前PDF到PDF/A转换仅在ImageGear .NET中可用。

 

 

© 著作权归作者所有

共有 人打赏支持
Harriet666
粉丝 2
博文 313
码字总数 220187
作品 0
私信 提问
NET图像处理库ImageGear for .NET更新至v23.4,添加增强版的数字签名技术

文档图像解决方案的领导者Accusoft发布最新版本的图像查看和处理工具包ImageGear for .NET v23.4,新版本专注于PDF文件的数字签名功能。数字签名使用特定的安全协议来确保安全性。该软件可以...

Harriet666
2017/11/06
0
0
Apache PDFBox 2.0.4,Java 的 PDF 处理类库

Apache PDFBox 2.0.3 发布了。Apache PDFBox库是一个开源的Java工具用于处理PDF文档。该版本修复了一些bug以及功能的提升。 更新内容: Bug 修复: [PDFBOX-3300] - 缺少字形时的显示空格 [P...

达尔文
2016/12/18
2.7K
4
python 验证码问题

tesseract-ocr-setup-3.02.02.exe 下载地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-setup-3.02.02.exe/download?usemirror=jaist&r=https%3A%2F%2Fsourc......

lweihua
2017/06/12
0
0
深入学习使用ocr算法识别图片中文字的方法

  公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python。一个小白在网上遨游了一天,终于找到一...

战争热诚
08/08
0
0
如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多。可以直接从repo获取,也可以下载压缩包。不过编译的时候往往也会出现各种奇怪的问题。这里介绍如何简单的配置和编译源码。 参考原文:How to Build Tesserac...

yushulx
2015/01/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

EOS docker开发环境

使用eos docker镜像是部署本地EOS开发环境的最轻松愉快的方法。使用官方提供的eos docker镜像,你可以快速建立一个eos开发环境,可以迅速启动开发节点和钱包服务器、创建账户、编写智能合约....

汇智网教程
今天
12
0
《唐史原来超有趣》的读后感优秀范文3700字

《唐史原来超有趣》的读后感优秀范文3700字: 作者:花若离。我今天分享的内容《唐史原来超有趣》这本书的读后感,我将这本书看了一遍之后就束之高阁了,不过里面的内容一直在在脑海中回放,...

原创小博客
今天
19
0
IC-CAD Methodology知识图谱

CAD (Computer Aided Design),计算机辅助设计,指利用计算机及其图形设备帮助设计人员进行设计工作,这个定义同样可以用来近似描述IC公司CAD工程师这个岗位的工作。 早期IC公司的CAD岗位最初...

李艳青1987
今天
19
0
CompletableFuture get方法一直阻塞或抛出TimeoutException

问题描述 最近刚刚上线的服务突然抛出大量的TimeoutException,查询后发现是使用了CompletableFuture,并且在执行future.get(5, TimeUnit.SECONDS);时抛出了TimeoutException异常,导致接口响...

xiaolyuh
今天
9
0
dubbo 搭建与使用

官网:http://dubbo.apache.org/en-us/ 一,安装监控中心(可以不安装) admin管理控制台,monitor监控中心 下载 bubbo ops 这个是新版的,需要node.js环境,我没有就用老版的了...

小兵胖胖
今天
20
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部