摘要采用图像识别技术对纸质文档进行自动处理是一项具有挑战性的工作。当文档中的文字印在色彩丰富的背景底纹上时,这一工作变得更加困难。本论文完成了一个基于K-means算法的字符与底纹分离方法。首先,采用K-means算法对彩色图像进行聚类以获得多个彩色分量的子图像;然后对每个分量子图像进行连通域分析,用连通域标记进行字符的判定和筛选,最后将筛选的结果合成显示在一张图像中,便获得了去除底纹的图像。论文采用viLib工具库,在VC++平台上实现了该算法,并对通过网络查找资料搜集的20幅图像进行了测试,证明了算法的可行性。64479
关键字 图像识别技术 连通域标记 字符与底纹分离 K-means算法 彩色分量
毕业设计说明书(论文)外文摘要
Title Color document images of characters and shading separation algorithm research investigate
Abstract
Using image recognition technology for automatic processing of paper documents is a challenging task. When the text in the document is printed on colorful background shading, this work becomes more difficult. This thesis has completed the character and shading separation methods based on a K-means algorithm. First, it uses the K-means algorithm to cluster color image for obtaining a plurality of sub-images which have color components, then performes connected component analysis on each component sub-image. Then the algorithm uses connected component labeling for the character of determination and screening. Finally, the filtered results syntheses and displays in an image, to obtain the removal of shading images. The thesis uses viLib tool library and achieve the algorithm in VC + + platform, tests 20 images which are collected through the network. And demonstrate the feasibility of the algorithm.
Keywords Image Recognition Technology Connected component labeling Separation of characters and shading K-means algorithm Color component
1 绪论 1
1.1 毕业设计的意义及目的 1
1.2 毕业设计所完成的工作及论文安排 2
2 基于K均值的字符与底纹分离算法研究 2
2.1 总体算法流程 2
2.2 基于K-means算法的设计 3
2.3 团块处理及筛选 7
2.4 小结 9
3 实验结果及分析 9
3.1 实验图像 9
3.2 实验结果 9
3.3 结果分析 21
结 论 22
致 谢 23
参考文献 24
1 绪论
1.1 毕业设计的意义及目的
随着计算机技术的发展,数字图像处理技术也在飞速发展,人们意识到图像信息处理技术是认识世界、改造世界的重要手段。
目前,图像处理技术[9]已经广泛用于很到领域,比如农业、工业、国防、医疗、通讯邮电等。从技术层面上讲,主要是对各类图像进行改善、识别、压缩、重建等[7]。比如一些典型的应用自动驾驶,导弹精确制导,机器人,远程监控,资源规划与探测等。