基于内容的视频检索的工作流程
图1 视频检索系统基于结构图
由图1可以看出:(1)视频数据库生成模块。主要完成视频源数据的生成,视频数据的预处理及视频特征库的生成等。对视频数据的预处理包括视频分割,关键帧提取以及特征提取等。(2)视频查询和检索模块。该模块将根据用户需要完成用户指定的查询和检索任务,主要包括用户查询接口,匹配过滤操作和结果反馈及表现部分。
视频的镜头分割不仅要将镜头间的突变检测出来,还要将渐变分割出来。若手工对视频流进行镜头分割,相当耗费时间,不利于实用化。研究人员正致力于自动分割镜头技术[3]。
目前视频镜头分割技术主要根据镜头在发生切换时其视频数据所反映的变化来分割。由于一个镜头内的相信帧间的变化不会很大,它们之间的特征差值总会限定在某个阈值内。而在镜头突变时突变点前后两个相信帧通常在内容上都显示着很大的量的变化,如果特征差值超过了给定的阈值,则意味着出现一个分割边界。对于镜头的渐变切换,由于相信帧之间的特征差值很小,很难用单个的阈值来检测,因此需要一个更复杂的分割方法[4]。
3.相关技术介绍本文来自辣*文!论(文&网,
毕业论文 www.751com.cn 加7位QQ324'9114找源文
3.1 MPEG-7标准
MPEG-7 标准的正式名称为多媒体内容描述接口,它是MPEG继制订MPEG-1 ,MPEG-2,MPEG-4 标准之后制订的又一个ISO/IEC标准。MPEG-7已于2001年9月被采纳为国际标准ISO/IEC 15938。MPEG-7的目标是确立各种媒体信息的标准描述方法,支持对用户感兴趣材料的快速高效的检索。MPEG-7标准的制定,旨在提供一种有效的多媒体描述机制,规范多媒体描述的接口,实现多媒体描述的标准化[5]。
3.2 镜头边界检测
1. 概述
镜头检测是实现基于内容的视频检索的首要问题,文中在讨论镜头切变与渐变检测算法的基础上,实现了基于MPEG视频的镜头检测系统[6]。
镜头切变是将两个镜头直接连接在一起而得到的,中间没有使用任何摄影编辑效果。切变一般对应于两帧图像间某种模式(由于场景亮度或颜色的改变,目标或背景的运动,边缘轮廓的变化等产生/造成)的突变。
镜头渐变是通过加入一些时间或空间编辑效果来改善视觉效果,从一个镜头缓慢地变化到另一个镜头。
2. 镜头的边界检测方法
镜头的边界检测方法大体上可以分为以下几类:
(1)基于像素的检测方法
基于像素比较的方法是最简单的计算帧间距离的方法。它是直接计算两帧之间对应像素的灰度绝对之差,设两帧相邻的帧图像为:f(x,y,t)和f(x,y,t+1),则其对应位置上两像素的灰度差的计算公式如式(2.1)所示:
D= 式(2.1)
式中,f(x,y,t)是t帧中像素点在位置(x,y)上的灰度值,x,y分别是帧图像在x和y轴上以像素点为单位的高度和宽度。在上式中,如果这两帧图像中灰度绝对差值大于某个阈值的像素数目,超过了设定值,则认为有切变存在。
(2)基于直方图的检测方法
基于直方图的检测方法是一种统计方法,利用的是帧图像的全局特征。最基本的基于直方图的方法就是直接计算前后两帧图像直方图的对应差,视频帧图像的直方图为H [ f(x,y,t),k ],其中k=0,1…,K一1,前后相邻两帧图像直方图的差计算公式如式(2.2)所示:
D= 式(2.2)
如果这两幅图像的D大于某个预先确定的阈值,那么通常可认为存在切变。
(3)基于边缘的检测方法
基于边缘的镜头检测算法主要考虑帧图像中的边缘或轮廓信息,是通过分别计算两帧图像中进入的边缘像素消失的边缘像素并比较它们之间的距离来判断是否发生了镜头变化。具体方法如下:设两帧连续图像f(x,y,t)和f(x,y,t+1),对其进行平滑滤波之后,提取出边缘像素。然后,计算在f(x,y,t)中有多少边缘像素与它们在帧f(x,y,t+1)中的最邻边缘像素接近可得出进入的边缘像素M,而在帧f(x,y,t+1)中又有多少边缘像素与它们在帧f(x,y,t)中的最邻边缘像素接近可得出消失的边缘像素N,故帧间的不相似性可定为D=max(M,N)。给定一个时间窗口,若D曲线在某处有明显的孤立峰值,就可判定该处有切变[7]。
上一页 [1] [2] [3] [4] 下一页
基于MPEG-7视频检索技术在数字家庭中的应用 第2页下载如图片无法显示或论文不完整,请联系qq752018766