藏文识别 维文识别

原创
2015/05/04 18:53
阅读数 871


2014年12月1日,“高性能维吾尔文识别与理解系统”成果鉴定会在清华大学举行,标志着我国维吾尔文识别进入了新的时代。据悉,该系统解决了维吾尔文文档经扫描图像识别输入计算机、并以汉语为目标语言的跨文种输出难题,可广泛应用于维吾尔文办公自动化、电子出版、互联网信息资源建设等领域,将促进少数民族文化交流,并对我国民族文化信息化事业发展的具有重要意义。

 


 

无切分的维吾尔文识别和理解系统是国家民族文化交流的迫切需要,在意识到这一问题的重要性后,由清华大学电子工程系丁晓青教授主持研制、清华大学与新疆大学、北京文通科技有限公司合作共同攻克这一难关,在国家自然基金委重点项目支持下完成了系统的开发与调试工作,并将于近期投入使用。鉴定会上专家委员会一致认为“高性能维吾尔文识别与理解系统”总体性能指标国内领先并填补了国内空白,技术水平国际领先。

据悉,这一系统首次实现了基于隐含马尔可夫模型的高性能无切分印刷维吾尔文文档识别系统,并首次研制成功结合维汉对照关键词检索系统,以及结合全文翻译的维吾尔文文档识别理解综合系统,并在多个方面进行了创新,比如,提出了多种维吾尔文字形结构特征提取新方法,首创基于序列线性鉴别分析的特征降维方法,使手写维吾尔文识别达到国际领先水平;提出了基于状态信息熵与距离度量的模型状态优化方法,以及基于聚类算法的引导式模型预训练策略,极大提高了维吾尔文模型的鉴别能力;提出了基于文字书写规则的限制性HMM模型解码网络,通过利用语言知识提高了解码准确率。


除了维吾尔文,“高性能维吾尔文识别与理解系统”还支持将多文种民族文字印刷文档识别转换为可编辑、检索的高质量电子文档,集图像导入、扫描、图像处理、识别、校对、导出以及翻译、检索功能于一体,并将首次推出民族文字识别与翻译无缝连接的网络服务平台。


文通科技负责人表示,将继续联合清华大学、新疆大学等高校的科研力量,深入少数民族语言识别技术研究与产业化应用,秉承“合作共赢”的理念,不断为业界提供最先进的OCR识别技术,为我国民族文化信息化交流发展做出应有的贡献。

 

OCR功能技术集成合作联系人:

任经理:(010)62800286805
           
手机:15010372383

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部