(1)车牌实时定位。现在车辆越来越多,交警要管理车辆记住车票费时费力,通过安装摄像头捕获公路场景,虽然能记住车辆车牌,但是都是视频文件,需要人工去读取车牌,效率很低,主观误差大,采用车牌自动识别系统进行分析和处理录像,不仅可以提高交警部门的工作效率,而且能够对路况进行实时监控,自动实时识别出违法交通的车辆车牌号,进而提高了运输部门的工作效率,也更好的监督各位司机,能够大大降低路面事故率。
(2)视觉辅助功能。随着各种数码设备如数码相机,摄像机、PAD广泛应用。而且还有现有的手机基本都自带摄像功能。使得获取现实生活中的文本变得越来越容易。很多视觉障碍患者不能看到现实中的各种文字带来很多不便,这种情况视觉障碍患者可以使用摄像设备和识别系统来获得较大的改善。对现实场景中文本定位和识别可以帮助视觉障碍患者增加对环境的感知能力,为他们生活提供很大的方便。他是通过文字定位和识别系统和一个机器翻译系统组合,并利用现在数码设备的摄像功能可以帮助出国旅游的游客理解旅游地标识文字。比如,各种警告牌,门牌和提示牌等。而且也可以用于汽车上,用来辅助驾驶,提醒司机一些道路指示牌,各种警告设置路标和一些商店信息等等。
(3)视觉监控功能。小区车辆进入,各种收费停车场以及单位的车辆进入监控。而且各种文字信息物品可以通过文字定位和识别系统来进行有效的管理。比如码头上集装箱运输的管理等。
(4)网络安全过滤方面。很多不良网络信息发布人将一些不良文字信息嵌入到图像中,或者直接用图像甚至视频的形式来显示文本来避开网络管理者的检测。文字定位和识别的引用就可以获取图像中的文字从而对图像内容进行过滤。很多淫秽图像也有许多不良信息,同样可以通过图片上的文字来进行屏蔽,从而创造绿色健康的网络环境。
(5)图像和视频文件的管理和检索。随着计算机应用的普及,多媒体技术的发展和计算网络的推广,越来越多的信息以数字图像或者视频的形式进行传播。主要因为图像和视频更加生动直白,为此图像和视频的检索成为现代计算机视觉领域的重要研究课题。传统关键字检索只能检索网页和文档,已经不能满足现代人民的需求了,基于内容的图像和视频的检索被提出,图像和视频中文字是图像和视频高层语义的重要信息来源。文字识别技术的引用可以使如百度、必应、谷歌等搜索更加强大,而且图像和视频更加容易存储管理。
(6)一些证件或票据的实时处理。现代社会追求高效率,高速度。比如出国旅游的人流量越来越大,飞机场每天会有很多游客的出入,对护照的实时处理就迫切需要。还有有时候需要处理大量的票据、身份证等类似物件。通过拍照和扫描实实时识别来获取他们所包含的关键信息越来越重要。
(7)互联网上的应用。Web服务器数量以惊人的速度增长,网站数量更是海量的增加。而且文本是Web网页的重要内容信息,但是很多网页上的一半以上文本内容嵌入到了图像中,这个比例是非常大的,图像中的文本很多时候决定了该网页的主要信息内容,对Web网页的搜索和管理的影响很大。
1.5 本课题的研究内容和方法及组织结构
综合考虑到已经存在的一些问题,本文采用了一种既新颖又通用的图像文字提取方法,并获得了令人满意的结果。
论文各章节的内容和安排如下:
第一章:绪论,简单介绍了图像文字定位的研究背景和意义,并具体列举了文字定位的常用的一些应用领域,最后阐明了本文的内容和结构安排。