matlab基于视觉的多媒体描述系统设计与实现(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

matlab基于视觉的多媒体描述系统设计与实现(4)


 2.2 镜头边缘检测算法简介及实现
(1) 基于像素灰度特征
       图像中像素的灰度值和亮度值是直接体现图像内容的两个度量值。所以,在比较相邻两帧之间差异时,最简单且直接的方法就是比较相邻两幅图像中像素的变化个数,当变化值大于一定阈值时,则判定为发生了镜头突变。
注: 分别表示图像中的宽度大小、高度大小、第 帧中 处像素点的灰度值、第 帧中 处像素点的灰度值。
这种算法的优点在于,当计算两幅视频帧图像的帧间差时考虑到了像素的位置,因此计算的图像帧间差较为精准。与此同时,该方法也存在着缺点。主要集中在以下几个方面:首先,实验结果的精度会受选取阈值大小的影响。而对于阈值的确定,需要人工判定。其次是这种方法并不能区分一个较大区域内发生了微小变化和局部区域内的巨大变化两种情况,这可能会导致检测结果出错。这一缺点可以通过只计算灰度变化达到一定阈值的像素个数加以改进。还有一点在于这种方法对摄像机运动很敏感,如平移、缩放等。对于视频序列内的物体运动也很敏感。这个问题可以通过滤波器的使用来降低摄像机及目标运动的干扰,提高算法对于摄像机及目标运动的容忍度。在比较相邻两帧的每个像素之前,用它邻近的像素区域的平均值来代替,这也就过滤掉了输入图像的一部分噪声。
(2) 基于颜色直方图差异
      同一个镜头里的相邻图像帧一般都表达着相同的图像内容。这也就意着,这些相邻图像帧在颜色空间分布上表现的很相似。相反的是,属于不同镜头的图像帧在颜色空间分布上会表现出很低的相似度。反映在直方图上的就是:同一镜头中的图像帧之间的直方图差异值比较小,不同镜头里的图像帧之间的直方图差异值比较大[9]。虽然从理论上来说,存在有两张图像内容完全不同,但它们的颜色分布相同,因此直方图没有差异的情况,但在一段连续的视频中,这种情况的出现概率是非常小的。此种算法是将图像帧的颜色直方图差异作为比较特征,用直方图差异值来确定图像帧的相似度。当颜色直方图的相似率低于一定的阈值时,则判定为镜头突变。
第 帧和第 帧的帧间差为:
                                           (3)
然而,这种方法的缺点是:它不能检测整个图像中所有像素的空间信息,对图像中运动目标也不敏感。
(3) 感知哈希法
      感知哈希法(PHA)是哈希算法中的一种,是一种可以用来进行相似图片搜索的快速算法。因为镜头边缘检测算法的检测对象也是大量的图像帧,所以这种算法也能用于镜头边缘检测。实验主要步骤如下:
①缩小尺寸:将图片缩小是去掉图像中细节部分和高频部分的最快的手段,首先将一幅图片缩小至8*8的大小,共有64个像素点。这时,我们不需要保持图像的纵横比,只需将其转变成8*8大小的新正方形图像。这样,我们就能比较任意尺寸的图片,方便操作。
②简化图像色彩:将上一步中的8*8大小的图像转化为灰度图像。
③计算像素平均值:计算出上面的灰度图像中64个像素点的平均灰度值。
④比较像素的灰度:将每个像素点的灰度值,与阈值 进行比较。如果大于或等于 ,则该像素点的新值为1;如果小于 ,则该像素点的新值为0( 可以取平均灰度值)。 (责任编辑:qin)