发票信息识别系统的研究现状及不足

OCR技术，从原理上说，就像查字典，OCR系统对从纸质材料扫描过的文字信息图像进行分析，通过切分，把文字一个个分割出来，通过将这些信息和字库里的资源进行对比匹配，再调出资源库中的相应信息。OCR技术在不断地成熟发展，从一开始的机械识别发展到如今的以数字化信息为特征的识别模式，现在相比以前的模式可以发挥更大的价值，在信息化的社会起着更大的作用。

德国科学家Tausheck早在1929年就提出OCR（光学字符识别）这一概念，他的“阅读机”在德国获得专利，西方较早便开始了对自动识别字符的研究。不久之后，美国人Handel关于光学技术应用于文字识别也提出了自己的概念模型，他因研制“统计机”在美国获得了专利。64870

因为市场强大的需求，在欧美国家对票据信息识别的探讨工作也开始的比较早，每年的国际会议ICDAR以及著名的学术期刊Pattern Recognition等都发表了很多关于OCR技术的研究和应用的论文。随着科技、研发水平的进步，目前很多成熟而成功的产品在金融行业也得到了应用，例如，Check Quest（Mite Systems研发的系统）,它已经被Thayer银行、Ann Arbor州立银行、Michigan银行采用。

我国的发票信息识别研究与国外相比起步相对较晚，研究文献数量不多，开发、投入使用的产品系统就更不多了。不过目前，我国有不少如“汉王”、“清华紫光”等著名的具有自主知识产权的汉字识别软件。以“汉王”为主的企业有一系列的较为成熟具有代表性的产品，这些软件成功的应用于各行各业。也有不少学者论文提出的汉字识别方法在试验中取得了论文网令人较为满意的95%到99%的识别率[1]。但是，现在很多公司的票据管理系统大部分是在这些商业软件的基础上再进行开发的，这样一来也随之带来了问题：如果直接使用成熟的商业OCR产品，可能并不能直接获得理想的结果，而且在开发过程中要支付不少的授权费用。

最近几年，不少研究机构、学者都开始致力于开发不同类型的号码自动化检测系统，在号码、条码检测的方面得到了令人满意的进展。西安理工大学提出的一种基于DSP的印刷号码自动识别系统，该方法在对图像预处理后，使用模板匹配法和字符特征识别法进行字符识别，并引入置信度的概念，较大提高了字符识别率[2]。沈阳工业大学利用图像处理和模式识别技术，针对数字和号码的特点，利用 VC++6.0编写了发票数字定位、分割、识别程序，建立了基于摄像头的身份证号码识别系统[3]和智能发票数字识别系统[4]。南京理工大学提出的票据自动处理系统将脱机文字识别技术应用于金融领域，可以对支票及其他银行票据中所包含的中文大小写金额、流水号、日期等信息进行识别，为银行提供金融票据的自动核对、校验、检查等功能[5]。

一些文献针对类似的名片信息的识别，也提出了一些方法，文献[6]提出了一种多阶段识别方法，采用不同类型的神经网络进行识别信息；文献[7]采用模板匹配的方法分析版面，因此只能处理固定版面。这些方法引入到发票信息识别系统中，还有一些因素要考虑到，如，中文、英文、数字混排。不同类型的发票排版也不一样，本文仅讨论增值税发票的信息识别。

发票信息识别系统的研究现状及不足:http://www.751com.cn/yanjiu/lunwen_72259.html