图1 基于内容的视频检索系统
基于内容的视频检索的工作流程,即将视频分割为镜头,再从镜头中提取关键帧。而关键帧严格上来说,就是图像。即对视频的检索实际上是对关键帧图像的检索。然后提取镜头的运动特征和关键帧中的视觉特征,作为一种检索机制存入视频数据库。最后根据用户提交的查询按照一定特征进行视频检索,将检索结果按相似性程度交给用户。根据用户向系统提交的查询视频内容不同,视频检索一般分为镜头边界检索和视频片段检索目前,视频检索方面的研究主要集中在镜头边界检索上,而视频片段检索则处于初步阶段。
2.视频镜头边界检测
2.1镜头边界检测的概述
镜头边界检测是利用镜头发生变换时表现出的特性找到发生边界的位置,即把整个视频分割成一个个独立的镜头。镜头是视频流在编辑制作及检索中的基本结构单元。
2.2镜头边界检测的方法
镜头边缘检测常用算法主要有两大类,即:非压缩域的和压缩域的镜头边界检测。
2.2.1非压缩域的镜头边界检测方法
非压缩域镜头边缘检测技术首先将视频解压缩,再对解压缩后的视频进行分析处理,通常采用的方法有:
(1)颜色直方图法
直方图(Histogram),基于颜色直方图特征的镜头边缘检测就叫做颜色直方图法。颜色直方图采用计算帧间差的方法,它丢失了颜色的位置信息,因此抗噪声能力比较强。缺点是:两幅图像可能内容完全不同但直方图相似,也容易造成误识别。
(2)像素差异法
像素差异法的基本思想是把图像分割成小的图像区域,然后比较这些区域中像素的变化量。当发生镜头切换时,两个连续帧的颜色信息会出现很大的变化,可统计颜色数值发生改变的像素数目,如果该数目超过某个阈值,则被认为发生了镜头的切换,但这种方法对摄像机运动很敏感。
2.2.2压缩域的镜头边界检测方法
目前越来越多的视频是以压缩格式获取、传输及存储的,所以直接检测压缩域镜头边界成为一个重要的研究课题。
(1)基于DCT系数的方法
由于频域中的变换系数是与像素域紧密相关的。因此,DCT系数可以用于压缩视频序列中的镜头边界检测。首先计算相邻帧间的DCT系数的差值,然后将其与某一预先设定的阀值进行比较,从而做出场景切换的判决。若该差值大于某一预先设定的阀值,就认为发生了场景切换。
(2)时空分析法
该方法利用图像在空间上的特点以及其在时间上与前后帧图像间的相关性来检测渐变过渡。目前,有学者对MPEG压缩视频流中宏块的空时分布进行分析,用B帧中的前向宏块和前向/后向宏块的空间分布比率来检测溶解过渡,取得了70%以上的检测率。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] 下一页
基于内容的视频片段检索系统技术研究+边界检测+相似度 第3页下载如图片无法显示或论文不完整,请联系qq752018766