光学字符识别(Optical Character Recognition)技术诞生于上个实际50年代,是模式识别领域的一个重要分支,它涉及了图象处理、模糊数学、计算机、形式语言、自动机、组合论、信息论、人工智能等多个学科,是介于基础研究和应用研究之间的综合性技术。随着模式识别和人工智能研究的发展,字符识别技术已逐步趋于成熟,并且广泛应用到各个领域,它的应用又反过来推动了模式识别的发展,促进了计算机及自动化应用的普及。8676
国外的字符识别技术研究起步较早,在1929年Tausheck就取得了光学字符识别专利。几年后,美国科学家Handel也提出了利用光学技术进行识别的想法。到20实际50年代字符识别技术开始受到人们的广泛关注,并逐步成为模式识别研究领域的焦点,随后出现了一些简单的识别系统,如751七十年代,日本Toshiba等公司研制出了邮政编码自动分拣机等OCR系统。
我国70年代末才开始OCR技术方面的研究,但由于我国政府对汉字自动识别的研究从80年代开始给予了充分的重视和支持,经过科研人员二十多年的辛勤努力,使得OCR的应用取得了重大突破:从简单的单体识别发展到多种字体混排的多体识别,从中文印刷材料的识别发展到中英混排印刷材料的双语识别。各个系统可以支持简、繁体汉字的识别,解决了多体多字号混排文本的识别系统,对于简单的版面可以进行有效的定量分析,同时汉字识别率已达到了98%以上。
目前印刷体汉字识别系统的应用已经相当成熟,如清华TH-OCR97综合集成汉字识别系统,对中等质量的样本,识别率已经可以达到99%左右或更高。字符识别的研究也已看是从印刷体向手写体进发。
如今,OCR已经逐步进入人们日常学习、生活、工作等各个领域,已经广泛应用在金融、保险、报业、税务、工商等行业。
随着我国自动化程度的提高,字符识别技术应用的范围也越来越宽。然而特定领域里的应用必定存在该领域的特殊性,针对不同领域的需求需要采用不同的解决办法。因此数字字符识别的研究仍具有理论价值和实践意义。
- 上一篇:图象处理与数字识别的研究现状与发展
- 下一篇:视觉自由曲面国内外研究现状
-
-
-
-
-
-
-
当代大学生慈善意识研究+文献综述
中考体育项目与体育教学合理结合的研究
java+mysql车辆管理系统的设计+源代码
酸性水汽提装置总汽提塔设计+CAD图纸
电站锅炉暖风器设计任务书
河岸冲刷和泥沙淤积的监测国内外研究现状
十二层带中心支撑钢结构...
杂拟谷盗体内共生菌沃尔...
大众媒体对公共政策制定的影响
乳业同业并购式全产业链...