目前主要有两种视频检索系统:一种是基于文本标识的检索系统,即人工以文字标注视频,通过文本匹配来找到视频的方法;另一种是基于视频内容的检索系统,包括了视频结构分析和视频语义分析[8]。80212
基于内容的视频信息检索认为,一个有语义的视频序列是由一系列的镜头构成,镜头是视频制作、剪辑、索引和查询的最基本单位,是表示视频内容的基本单元,用镜头可表示在一定时间和空间内的连续动作,是摄像机一次连续动作所记录的图像序列。两个相邻镜头的衔接方式有突变和渐变两种。突变也叫切变、硬切,是故事片和新闻视频最常见的镜头变换方式,指相邻两个镜头之间没有过渡,后一个镜头的第一帧直接出现在前一个镜头的最后一帧之后。突变使动作画面直接跳跃,也是所有视频场景内使用最多的变换方式,比如在同一个场景内不同景别、不同角度镜头之间的组接,两个不同主体之间镜头的组接等多用切变方式转换。渐变包括很多种具体形式,如叠化、翻页、划像、星光、拉伸、开门等等,渐变切换是一种逐渐过渡的过程,没有明显的镜头跳跃,多用于场景的切换之间或者表示在同一场景内时间的延续性,如几个镜头的叠化就可以表示时间上春夏秋冬的变化[8]。
由于新闻视频受拍摄、编辑的及时性和时间限制,新闻视频中突变镜头占90%以上,而渐变镜头一般出现在节目的头尾及接缝处。所以我们只需要考虑突变镜头的检测。目前用到的镜头分割技术主要分为压缩域与非压缩域两种。非压缩域中有:像素对差值法、直方图最小帧差值法和基于边缘变化率的方法[9,10]。1。2。1像素对差值法
像素对差值法[11,12]方法定义相邻帧图像间的差异为:论文网
0,其他情况是图像两个方向的像素个数,T1是预定义的阈值。
此方法首先计算相邻帧图像对应位置的像素差,若像素差超过阈值Ti的像素对数目达到一定比例T′,则认为发生一个切变。此方法优点在于算法简单,易
于实现,但对镜头和目标运动敏感,查准率很高,即使通过图像平滑也难以有效降低查准率。
2直方图最小帧差值法
直方图最小帧差值法[11,13]方法定义相邻帧图像之间的差异为是图像的直方图;K是图像灰度级数。
即定义帧差为相邻两帧的某一灰度的像素点个数的较小值之和与第二帧的
像素点个数之比。如果两帧相似,那么帧差接近于1;如果两帧发生了切变,那么帧差应该接近于0。
当帧差超过阈值