光学字符识别(Optical Character Recognition)技术诞生于上个实际50年代,是模式识别领域的一个重要分支,它涉及了图象处理、模糊数学、计算机、形式语言、自动机、组合论、信息论、人工智能等多个学科,是介于基础研究和应用研究之间的综合性技术。随着模式识别和人工智能研究的发展,字符识别技术已逐步趋于成熟,并且广泛应用到各个领域,它的应用又反过来推动了模式识别的发展,促进了计算机及自动化应用的普及。8676
国外的字符识别技术研究起步较早,在1929年Tausheck就取得了光学字符识别专利。几年后,美国科学家Handel也提出了利用光学技术进行识别的想法。到20实际50年代字符识别技术开始受到人们的广泛关注,并逐步成为模式识别研究领域的焦点,随后出现了一些简单的识别系统,如751七十年代,日本Toshiba等公司研制出了邮政编码自动分拣机等OCR系统。
我国70年代末才开始OCR技术方面的研究,但由于我国政府对汉字自动识别的研究从80年代开始给予了充分的重视和支持,经过科研人员二十多年的辛勤努力,使得OCR的应用取得了重大突破:从简单的单体识别发展到多种字体混排的多体识别,从中文印刷材料的识别发展到中英混排印刷材料的双语识别。各个系统可以支持简、繁体汉字的识别,解决了多体多字号混排文本的识别系统,对于简单的版面可以进行有效的定量分析,同时汉字识别率已达到了98%以上。
目前印刷体汉字识别系统的应用已经相当成熟,如清华TH-OCR97综合集成汉字识别系统,对中等质量的样本,识别率已经可以达到99%左右或更高。字符识别的研究也已看是从印刷体向手写体进发。
如今,OCR已经逐步进入人们日常学习、生活、工作等各个领域,已经广泛应用在金融、保险、报业、税务、工商等行业。
随着我国自动化程度的提高,字符识别技术应用的范围也越来越宽。然而特定领域里的应用必定存在该领域的特殊性,针对不同领域的需求需要采用不同的解决办法。因此数字字符识别的研究仍具有理论价值和实践意义。 字符识别技术的国内发展研究现状:http://www.751com.cn/yanjiu/lunwen_7104.html