文档章节

.NET图像处理库ImageGear for .NET v23发布,新增AcroForm功能和亚洲OCR丨附下载

Harriet666
 Harriet666
发布于 2017/06/06 14:38
字数 1889
阅读 12
收藏 1
点赞 0
评论 0

ImageGear for .NET是一款图形图像处理控件,可以轻松地为程序添加扫描/压缩/条形码识别/PDF/文件查看与处理/图形编辑与处理等功能。具有扫描,压缩,浏览、添加注释,打印,图像编辑,OCR以及PDF和矢量图像支持,使开发人员可以快速地开发出图像处理程序,可用于.NET Framework2.0、3.0、3.5、4.0,ASP.NET,WPF,SilverLight,DirectX 10和Direct3D 10。支持超过100种图片格式,包含:TIFF, JPEG, CAD, Vector, 3D PDF, PDF/A, PS等。

最新版本的ImageGear.NET v23,为开发人员提供了新的AcroForm功能;将亚洲光学字符识别(OCR)输出添加到PDF,通过将中文、日文和韩文OCR输出结合到PDF中,扩大了适应性和在全球无缝创建PDF的能力;并通过合规性检查加强了PDF/A转换。

【ImageGear.NET v23最新版下载>>>】

新增功能

PDF AcroForms——创建、读取和写入PDF表单字段和数据

d353839346c4441381fb5d0d1e386b06o.jpg
高级AcroForms SDK提供强大的表单功能

.NET开发中AcroForms SDK *可以将AcroForm字段添加、更新或删除到新的或现有的PDF中。这为你的用户提供从表单域读取和写入数据的方式,而无需离开你的网站或应用程序。如果他们需要更新现有的PDF,SDK会通过注释工具提供帮助。

使用表单增强你的应用程序

需要让你的用户访问数字表单?预先填充表单域允许用户直接从你的网站或应用程序将数据写入表单。将表单字段添加到PDF,包括:

·  复选框

·  文本字段

·  列表框

·  组合框

·  状态设置框

ImageGear还允许低级别访问PDF,以便用户可以直接从你的网站或应用程序访问任何文档或AcroForm。

 

亚洲OCR——包括中文、日文和韩文的语言自动检测和PDF输出
274011dbdffa41fba34c89f02c47a271o.jpg

 

ImageGear增加了其先进的光学字符识别功能。ImageGear支持亚洲语言,提供中文、日文和韩文的OCR。

语言支持

亚洲OCR支持横向和纵向文字的亚洲语言。支持的语言有:

·  传统中文

·  简体中文

·  日语

·  韩语

自动语言检测技术

ImageGear使用自动语言检测技术来完成文档的OCR,包括含有亚洲语言的文档。此功能可以帮助你的业务在亚洲市场取得成功。

亚洲OCR输出格式

通过使用所有识别信息(字体细节、定位的图像区域和识别的表格结构信息)来创建格式化的输出,以重述原始文档的含义。亚洲版利用OCR引擎的强大功能,用亚洲语言创建文档图像的强大格式化输出。

亚洲版输出格式:

·  TXT

·  Word

·  Excel

·  HTML

·  PDF 

 

功能增强

OCR——改进OCR布局、分区顺序和文档

21c94ebab7e64b349fc0a74e76e8c3c0o.jpg

.NET,C,C ++和C#OCR

ImageGear OCR可用于Windows上的多种平台和语言,包括C,C ++,C#和其他.NET语言。ImageGear提供超过100种语言的全页光学字符识别(OCR),包括西方和亚洲语言如中文、日文和韩文。ImageGear的自动语言检测功能使OCR功能完善。

OCR可作为附件购买,为应用程序开发提供完整的文档图像库。我们的C#OCR SDK:

·  包括100多种不同的语言

·  检测并读取中文、韩文和日文

·  识别单个图像中的多种语言的字符

·  OCR样本可用于C#,VB.NET,C和C ++

全页OCR

·  通过我们的自动分区和细分功能,你的用户可以:

·  将页面自动分割为各个区域进行处理

·  根据流程、表格或图形将类型分配给定位的区域

·  用先进技术检测表格,改善数据结果重构

·  处理页面的全幅图像或单个区域

·  由用户定义区域,从文件加载或由引擎自动检测

最大精度的图像预处理

OCR之前会发生什么?看看OCR的预处理步骤:

·  高级图像处理方法可用于提高OCR精度

·  自动反转功能检测图像是否需要反转以获得最高精度

·  自动图像方向检测和调整图像

·  纠错方法检测图像并自动校正,提高分割和识别精度

·  去斑方法去除图像捕获过程中的污点和缺陷

·  分辨率增强提高了低分辨率图像的质量

预定义和可定制的字典

ImageGear的OCR在扫描文档时使用预定义的字典和数据字典。ImageGear使用17种不同语言的高级拼写检查,每种语言都在特定字典中。17个词典中的每一个都包含100,000到200,000个条目。垂直字典可以改善医疗和法律行业的拼写检查和OCR准确性。

卓越的结果处理

ImageGear OCR引擎以Unicode格式处理所有数据。可以为具有多个输出选项的特定代码页格式化数据输出,如:

·  PDF上的图像

·  基于文本的PDF

·  Microsoft Office 2007

·  Microsoft Office 97(Word,Excel和Powerpoint)

·  RTF

·  HTML

·  XML

OCR版本:ImageGear的功能选项

ImageGear有三个不同的功能选项。三个选项之间的主要区别是OCR引擎创建的输出格式。你的开发选项如下:

1、标准版

标准版为西方语言(如英语)创建输出格式。标准版仅输出文本文件并生成PDF。它包括的文件格式是可搜索的文本PDF和文本文档。

2、标准版Plus

标准版本Plus为西方语言(如英语)创建格式化输出。使用识别技术创建格式化的输出,以识别字体细节、定位图像区域并识别表格结构以创建原始文档。它包括的文件格式有Word、Excel、HTML、可搜索的PDF和文本文档。

3、亚洲版

亚洲版为亚洲语言(如中文,日语和韩语)创建格式化的输出。这种格式化的输出是使用与标识字体相同的识别技术来创建的,它标识字体细节、定位图像区域,并识别表格结构。格式包括Word、Excel、HTML、可搜索的PDF和文本文档。

*目前该功能仅适用于ImageGear for .NET。

 

PDF/A——丰富的PDF/A,并具有PDF/A转换的合规性检查

55374f37758442cbb78dd8962f7c570do.jpg

将PDF文件转换成PDF/A文件

PDF/A是一种ISO标准类型的PDF文件,用于存档和长期保存文件,以便它们能够与原始文件完全一致。元素(如字体)必须是独立的或嵌入的,以保留原始文件的格式和属性。PDF/A已经在欧洲流行,在美国正成为更广泛使用的文件格式。

ImageGear PDF/A特点:

·  根据光栅图像文件和扫描的图像创建PDF/A文件

·  验证PDF/X(PDF/X-1a,PDF/X-3和PDF/X-4)和PDF/A(PDF/A-1a和PDF/A-1b)合规性的PDF文件

·  将不合格的PDF文件转换为符合PDF/A-1b的PDF文件

·  新的增强功能可以改善从PDF到PDF / A的合规检查和转换过程

*目前PDF到PDF/A转换仅在ImageGear .NET中可用。

 

 

© 著作权归作者所有

共有 人打赏支持
Harriet666
粉丝 2
博文 313
码字总数 220187
作品 0
Apache PDFBox 2.0.4,Java 的 PDF 处理类库

Apache PDFBox 2.0.3 发布了。Apache PDFBox库是一个开源的Java工具用于处理PDF文档。该版本修复了一些bug以及功能的提升。 更新内容: Bug 修复: [PDFBOX-3300] - 缺少字形时的显示空格 [P...

达尔文 ⋅ 2016/12/18 ⋅ 4

python 验证码问题

tesseract-ocr-setup-3.02.02.exe 下载地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-setup-3.02.02.exe/download?usemirror=jaist&r=https%3A%2F%2Fsourc......

lweihua ⋅ 2017/06/12 ⋅ 0

图形图像库集合

Google三维API O3D   O3D 是一个开源的 Web API 用来在浏览器上创建界面丰富的交互式的 3D 应用程序。这是一种基于网页的可控3D标准。此格式期望真正的基于浏览器,独立于操作系统之外,并...

Mario_Q ⋅ 2013/12/20 ⋅ 1

tesseract OCR工具的图形化前端软件YAGF 0.9.3 发布

YAGF 0.9.3 发布,此版本改进了图像处理过程,OCR 引擎能识别损坏或者 poorly-scanned 图像的文本;添加了新 recognition 语言;其他一些 bug 修复;程序更稳定。 YAGF 是 cuneiform 和 tess...

oschina ⋅ 2014/02/20 ⋅ 0

如何在windows上编译Tesseract OCR

获取Tesseract源码的方式有很多。可以直接从repo获取,也可以下载压缩包。不过编译的时候往往也会出现各种奇怪的问题。这里介绍如何简单的配置和编译源码。 参考原文:How to Build Tesserac...

yushulx ⋅ 2015/01/08 ⋅ 0

SmartZoneOCR识别控件免费下载地址

SmartZone™光学字符识别工具包,使开发人员能够进行带状区域光学字符识别,带状区域在表单处理应用程序中经常使用。本产品所包含的.NET控件以及ActiveX COM组件在内部使用两种单独的识别技术...

yidongkaifa ⋅ 2014/10/15 ⋅ 0

Python 实现识别弱图片验证码

图片来自 unsplash 目前,很多网站为了防止爬虫肆意模拟浏览器登录,采用增加验证码的方式来拦截爬虫。验证码的形式有多种,最常见的就是图片验证码。其他验证码的形式有音频验证码,滑动验证...

猴哥Yuri ⋅ 2017/12/23 ⋅ 0

微软亚洲研究院五位院友当选 2018 IEEE Fellow

     编者按:11月21日,国际电子电气工程协会(IEEE)发布了 2018 年度新入选院士 (Fellow) 名单,微软亚洲研究院的五位院友谢涛、徐东、贾佳亚、林宙辰和王海勋光荣入选。想了解更多消...

微软亚洲研究院 ⋅ 2017/11/24 ⋅ 0

ICEpdf 6.2.1 P01 发布,Java 的 PDF 类库

ICEpdf 6.2.1 P01 发布了。ICEpdf 是一个轻量级的开源 Java 语言的 PDF 类库。通过 ICEpdf 可以用来浏览、内容提取和转换 PDF 文档,而无须一些本地PDF库的支持。 改进日志如下: Rendering ...

达尔文 ⋅ 2017/01/31 ⋅ 0

Kodi 17.0 正式版发布,开源软件媒体中心

Kodi 17.0 正式版发布了,Kodi (以前称为 XBMC™)是一个免费和开源(GPL)的软件媒体中心,用于播放视频、音乐、图片、游戏等。 Kodi 可在 Linux、OS X、Windows、iOS 和 Android 上运行,...

王练 ⋅ 2017/02/06 ⋅ 1

没有更多内容

加载失败,请刷新页面

加载更多

下一页

JVM堆的理解

在JVM中,我们经常提到的就是堆了,堆确实很重要,其实,除了堆之外,还有几个重要的模块,看下图: 大 多数情况下,我们并不需要关心JVM的底层,但是如果了解它的话,对于我们系统调优是非常...

不羁之后 ⋅ 昨天 ⋅ 0

推荐:并发情况下:Java HashMap 形成死循环的原因

在淘宝内网里看到同事发了贴说了一个CPU被100%的线上故障,并且这个事发生了很多次,原因是在Java语言在并发情况下使用HashMap造成Race Condition,从而导致死循环。这个事情我4、5年前也经历...

码代码的小司机 ⋅ 昨天 ⋅ 1

聊聊spring cloud gateway的RetryGatewayFilter

序 本文主要研究一下spring cloud gateway的RetryGatewayFilter GatewayAutoConfiguration spring-cloud-gateway-core-2.0.0.RC2-sources.jar!/org/springframework/cloud/gateway/config/G......

go4it ⋅ 昨天 ⋅ 0

创建新用户和授予MySQL中的权限教程

导读 MySQL是一个开源数据库管理软件,可帮助用户存储,组织和以后检索数据。 它有多种选项来授予特定用户在表和数据库中的细微的权限 - 本教程将简要介绍一些选项。 如何创建新用户 在MySQL...

问题终结者 ⋅ 昨天 ⋅ 0

android -------- 颜色的半透明效果配置

最近有朋友问我 Android 背景颜色的半透明效果配置,我网上看资料,总结了一下, 开发中也是常常遇到的,所以来写篇博客 常用的颜色值格式有: RGB ARGB RRGGBB AARRGGBB 这4种 透明度 透明度...

切切歆语 ⋅ 昨天 ⋅ 0

CentOS开机启动subversion

建立自启动脚本: vim /etc/init.d/subversion 输入如下内容: #!/bin/bash## subversion startup script for the server## chkconfig: 2345 90 10# description: start the subve......

随风而飘 ⋅ 昨天 ⋅ 0

Nginx + uwsgi @ubuntu

uwsgi 安装 sudo apt-get install python3-pip # 注意 ubuntu python3默认没有安装pippython3 -m pip install uwsgi 代码(test.py) def application(env, start_response): start_res......

袁祾 ⋅ 昨天 ⋅ 0

版本控制工具

CSV , SVN , GIT ,VSS

颖伙虫 ⋅ 昨天 ⋅ 0

【2018.06.19学习笔记】【linux高级知识 13.1-13.3】

13.1 设置更改root密码 13.2 连接mysql 13.3 mysql常用命令

lgsxp ⋅ 昨天 ⋅ 0

LVM

LVM: 硬盘划分分区成物理卷->物理卷组成卷组->卷组划分逻辑分区。 1.磁盘分区: fdisk /dev/sdb 划分几个主分区 输入t更改每个分区类型为8e(LVM) 使用partprobe生成分区的文件:如/dev/sd...

ZHENG-JY ⋅ 昨天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部