4.3 文字识别 .. 21
4.4 运动特征 .. 23
4.4.1 活动轮廓技术 .. 24
4.4.2 帧间跟踪原理 .. 25
4.4.3 利用活动轮廓技术进行帧间跟踪 . 26
4.5 其他特征 .. 27
4.5.1 形状特征 27
4.5.2 空间关系特征 .. 28
5 基于文本特征的视频提取 29
5.1 文本区域定位 . 29
5.2 视频文本识别 . 30
5.2.1 图像二值化 . 31
5.2.2 视频文本识别 .. 31
6 总结与展望 32
6.1 总结 32
6.2 展望 32
致 谢.. 33
参考文献 . 34
1 引言
1.1 研究背景
随着信息化社会的到来以及信息高速公路的实施,人们越来越多的接触到大
量的视频信息,大容量高速存储系统为视频的海量存储提供了基本保障,各行各
业对视频的使用越来越广泛,视频信息资源的管理和检索显得日益重要。视频数
据库的研究对多媒体数据库、电子图书馆、医疗学图像管理、罪犯识别系统、卫
星遥感图像、地理信息系统、商标版权管理等方面提供有力的支持。
在传统的数据库系统中,信息的检索一般以数值和字符型为主,而在多媒体
数据库中集成图像、视频、音频等非格式化信息,它们具有数据量大、信息不定
长、结构复杂等特点。每一种媒体数据都有一些难以用字符和数字符号描述的内
容线索,如图像中某一对象的形状、颜色和纹理,视频中的运动,声音的音调等。
当用户要利用这些线索对数据进行检索时,首先要将其人工转化为文本或关键词
形式,这种转换带有一定的主观性,且极其费时,因而仅仅基于关键词的检索己
不能满足用户的检索要求。数据库及其它信息系统不仅要能对图像、视频和声音
等媒体进行存储以及基于关键字的检索,而且要对多媒体数据内容进行自动语义分析、表达和检索。
所以理想的做法是让计算机能够自动的对非结构化的视频进行结构化的分
析和处理,提取出视频包含的内容,并进行组织、管理和存储,从而方便用户检
索。因此,视频有效特征的提取越来越得到研究者们的重视。该项研究涉及到视
频镜头分割、关键帧提取、故事检测以及如何利用这些信息进行检索的问题,由
此可见,这是一门涉及到很多领域的交叉学科,需要利用图像处理、模式识别、
计算机视觉、图像理解等方面的知识,还需利用人工智能、数据库管理、人机交
互、信息检索、大数据组织等领域知识,才能设计出可靠有效的检索系统以及友好的交互界面。
1.2 本课题的研究目的和意义
视频数据具有人类视觉最敏感、最易接受的特点,在多媒体数据中占有绝对
重要的地位,同时它又是最复杂、数据量最大的媒体,为了更好地对视频数据进
行检索,基于内容的视频检索仍有许多需要进一步研究的内容:
第一,视频处理是视频检索的基础,而视频数据是动态的,具有动态特征。
而动态特征的描述和提取以及动态特征的匹配等都不同于静态特征,仅仅代表帧
的特征很难完全说明运动序列的情况。因此提取动态特征和处理动态特征对视频
更有意义。
第二,由于视频的数据结构不同于其它媒体数据,使得传统的数据索引方式
已不适合视频数据的检索,研究基于时空的多文索引方法将更有助于视频检索速
- 上一篇:基于云平台的应用研究+文献综述
- 下一篇:关于群决策中专家意见分歧状况下的意见汇总问题的研究
-
-
-
-
-
-
-
大众媒体对公共政策制定的影响
十二层带中心支撑钢结构...
酸性水汽提装置总汽提塔设计+CAD图纸
当代大学生慈善意识研究+文献综述
乳业同业并购式全产业链...
java+mysql车辆管理系统的设计+源代码
电站锅炉暖风器设计任务书
河岸冲刷和泥沙淤积的监测国内外研究现状
杂拟谷盗体内共生菌沃尔...
中考体育项目与体育教学合理结合的研究