MS-OCR文档批量识别软件软件介绍。

MS-OCR文档批量识别软件

MS-OCR文档批量识别软件

OCR识别系统是纸质档案数字化的必备功能,可以借助OCR识别功能实现纸质档案的内容检索(全文检索),从而提高档案资料的查全率。OCR识别系统目前主要包括批量OCR识别引擎。

批量OCR识别用于纸质档案工业化数字化生产过程中,将大批量已经扫描形成的电子文件(TIFF、JPG、BMP等格式)中的文字信息,使用强大的OCR识别引擎生成纯文本的txt文件或合成双层PDF文件。双层PDF文件。所谓双层PDF就是上层是图像,下层是隐藏文字的PDF格式。即PDF文件的每一页都包含两层,上层是从纸质文件扫描出来的原始图像,下层是用OCR识别软件对扫描图像进行识别后产生的文字结果。这样用户在阅读PDF文件时看到的是扫描图像,可以100%保留原始版面效果(包括公章、签名),在需要的时候,又可以通过下层的文字信息支持选择、复制、检索等功能。

相关新闻

联系我们

联系我们

QQ:951076433

在线咨询:点击这里给我发消息

邮件:951076433@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

分享本页
返回顶部