下面介绍几种常用的预处理和特征提取的方法。
2.1 图像二值化
通过图像的二值化处理,可以从背景中分离出数字目标。将图像上点的灰度值设为0或者255,使得整个图像呈现出明显的黑白效果[11]的过程称为图像的二值化。二值化后的图像性质由灰度值为0或255的点的位置决定,图像的信息得到了有效压缩,但其仍然能够保持原有图像的整体和局部特征,因此是图像处理过程中较为关键的一步。
为了使图像二值化取得理想的处理效果,需要选择合适的阀值。如果阀值选择过大,会造成图片信息的缺损,而如果阀值选择过小,则会造成信息的冗余。具体操作中,有时会用算法来实现阀值的选取,即动态阀值法。在要求不高的情况下,也可以人工设定阀值。
本文选用手写体数字图像的灰度平均值作为阀值,首先将原始图像处理成包含256个亮度等级的灰度图像,然后将其灰度值与选定的阀值比较。当灰度值大于或者等于阀值时,将其置为255;当灰度值小于阀值时,将其置为0,之后输出新的二值化图像。 几种常用手写体数字识别算法的对比研究(3):http://www.751com.cn/zidonghua/lunwen_19039.html