摘要在网页、图片和视频的文本中包含高层语义信息,是信息索引和检索所需要的重要线索。大多数现有的文本提取方法依赖于文本的语言类型和文本的外观。在本文中,提出了一种新的普遍的方法提取图像中所包含的文字,采用了一种由粗到细的文本定位方法。首先提取图像的边缘信息。其次,利用边缘点的分布特点粗略定位文字的位置,最后,将边缘轮廓往水平和垂直两个方向上投影用于细化定位结果。我们采用新闻视频中的图形帧做实验,结果表示本方法可以比较精确的定位出图像中的文字区域。60135
毕业论文关键词 由粗到细 边缘检测 文字定位
毕业设计说明书(论文)外文摘要
Title Text localization in images based on edge information
Abstract
Texts in web pages, images and videos contain important clues for information indexing and retrieval. Most existing text extraction methods depend on the language type and text appearance. In this paper, a novel and universal method of image text extraction is proposed. A coarse-to-fine text location method is implemented. Firstly, edge map is extracted from images. Secondly, the distribution of edge points in the edge map is used to locate text coarsely. Finally, projection profiles to the horizontal axis and the vertical axis are used in location refinement step. We use frames in news videos to test our method, and the experiment results show that our method is effective in text localization in the images.
Keywords coarse-to-fine edge-detection Text-Location
1 绪论 1
1.1 概述 1
1.2 文字提取的研究背景 1
1.3 文字定位的研究现状 2
1.4 文字定位的具体应用 3
1.5 本课题的研究内容和方法及组织结构 5
2 图像中的文本提取算法依据和流程 5
2.1 文本的特征 5
2.1.1 用于文本检测的特征 6
2.1.1 用于文本验证的特征 7
2.2 文本定位流程 7
2.2.1 文本特征选择 8
2.2.2 文本特征提取 8
2.2.3 文本特征聚集形成文本区域 8
2.2.4 提取候选文本区域 9
2.2.5 验证文本区域 9
2.3 文本定位的常用算法 9
2.3.1 基于连通域的方法 10
2.3.2 基于纹理的文本定位方法 11
2.3.3 基于边缘的文本定位方法 13
2.3.4 基于机器学习的方法 14
2.4 本章小结 14
3 基于边缘检测的文本定位方法研究 15
3.1 引言 15
3.2 边缘检测介绍 15
3.2.1 经典的边缘检测算子 15
3.3 连通区域分析 23
3.4 文本区域定位与合并