第二章:介绍了几种常用而且比较明显的文本提取特征和文本验证特征,并对国内外学者提出的各种代表性算法进行了分类和研究。对各算法优劣进行简单的分析。
第三章:描述了基于边缘图像处理的主要流程,并详细介绍了经典常用的几个边缘检测器算子。先通过边缘检测算子检测,然后连通域分析,最后文本区定位和合并。
第四章:主要介绍本文的研究方法,一种由粗到细的文字定位方法。详细描述了粗检测流程和原理,以及文本区域优化原理和过程。最后给出了实验结果,并做了简单的分析说明。
最后对本论文进行了总结和分析。
2 图像中的文本提取算法依据和流程
现实生活中人眼能够很快辨别出图像中的文本区域而不需要逐个的识别每个字符,这是因为人眼很快能发现文本特征,正是由于这些特征才使文本不同于其他背景对象。因此我们可以利用这些文本特征提取出文本区域,然后对文本进行识别。
2.1 文本的特征
文本特征可以归纳为:
a.文本和背景之间有较大的对比度;文本一般为凸显,灰度为最大值或者最小值。
b.文本拥有较多的频率和方向信息;
c.文本一般具有空间上的聚合性:而且在一定距离内的字符都会沿着某条虚拟的直线对齐,并且同一个字符串内的字符都有相似的高度、方向和大小。
文本上面的几个特征能够为我们提取文本提供很多信息。一般文本特征可以分为两类:用于文本检测的特征和用于文本验证的特征。前者可以帮助我们从图像中找到候选的文本区域,而后者可以从候选区域中剔除错误,找到真正包含文本的区域。但是这些特征区分的不是很明显,文本检测的特征有时候也可以用来验证是否是文本,一般来说验证文本的特征会比较宽松点,不过一定条件和情况下也能用于文本的检测。
2.1.1 用于文本检测的特征
(1)原始像素的灰度级
Shin[6]建议使用原始图像像素的灰度级来做为图像的特征。
(2)像素灰度的局部变化
P.Clark[7]使用了半径为3的圆形领域内像素灰度图H的变化测量局部信息:
V=S*(I-S*V)^2 (2-1)
其中I是输入的图像,S是圆形领域模板,*表示卷积。文本区域的局部变化依赖于区域。含有小中等区域只会产生中等程度的变化。一般这样文本处于文字和背景灰度值混合的边界处,从而导致对比度不是很强那种。
(3)局部边缘强度
边缘强度用来测量对比度,文本一般被假设为凸显的,及拥有足够强烈的对比度来保证它们能很快被识别出来,强对比度使文本区域拥有较高的边缘强度。假设局部强度为E