matlab基于视觉的多媒体描述系统设计与实现(3)
时间:2018-07-18 20:51 来源:毕业论文 作者:毕业论文 点击:次
(5) 运动目标检测与跟踪 运动比赛视频中常常会有运动的目标存在于图像帧中。将这些移动的目标检测出来,有助于提取出运动目标的位置等信息数据,方便做进一步的数据加工,例如可以提供给教练员分析本场比赛等。运动目标检测的主要目的是对当前的一系列图像帧中使用差分的方法,奖背景图像中的运动目标分离并提取出来。对运动目标进行精确有效的分割,这一步对于接下来的处理,比如目标跟踪和行为检测与分析等,是至关重要的。目前有几种主流的运动目标检测的算法:背景减除法、光流法、基于形态学的场景变化检测等算法。 1.4 本文组织安排 本文一共包括五章,每一章的详细行文安排如下所述: 第一章中,先描述了本课题的研究背景和选题意义,并分析了该研究领域的国内外的发展状况。同时对视频语义分析涉及的相关概念作了阐述。 第二章,讨论了视频结构化分析的相关内容,这其中包括了镜头边缘检测、关键帧提取、镜头分类三个部分。通过研究与分析网球比赛的规则与特征,本文使用了一种基于图像主色率、球场边界线以及图像边缘像素的镜头分类算法。 第三章对视频字幕检测与识别进行了分析与研究,通过使用最大极值稳定区域探测,边缘检测,笔划宽度,形态学操作来定位文本所在区域位置,最后借助OCR字符识别来提取出文字信息。 第四章讨论了运动目标检测与跟踪的有关内容[6]。为了检测到画面中的运动目标,首先通过背景建模的方法提取出镜头中的背景图片。有两种方法,混合高斯模型和中值滤波提取背景,然后通过背景差分的方法来圈出运动目标并跟踪。实验证明,该方法效果良好。 第五章是本文的结束语以及对未来研究方向的展望。 2 视频结构化分析与研究 2.1 镜头边缘检测 一般来说,我们所使用和观看的视频从结构上来看都是由一个个的场景所组成。它们在时间或者空间上都具有关联性。而每一个场景,都是由许多个镜头所形成。这些镜头从不同的角度,不同的视角,来对同一个场景进行描述,如图1所示。 镜头作为视频数据结构的一种基本单位,是存在于视频中的物理边界。如何将每个独立的镜头检测并切分出来,是视频结构化分析的一项基础且重要的工作[7]。镜头边缘检测的任务就是将视频中的镜头变化情况检测出来,并加以分割。一般地,我们将镜头变化分成镜头突变和镜头渐变两种。其中,镜头突变是指当一个镜头即将结束时,整个画面直接变换为另外一个镜头,中间不存在时间上的停留,这是视频中最常出现的一种镜头变换。镜头渐变则是在两个镜头交界处加入了一些画面变化的效果,从一个镜头渐渐变换成另一个镜头,变换过程会持续多帧,常见的变换方法有溶解等。 图1 视频序列组织结构图 运动比赛视频的镜头中,大多数的镜头变化为镜头突变,同时也夹杂有少量的镜头渐变。通常使用的一种简单且有效的镜头边缘检测的方法是:先计算视频中相邻两帧间的差异,然后根据帧间差检测出镜头变换的类型,如果帧间差值较大,在图像上表现为一个突起尖峰,则判定为发生了镜头突变,若帧间差值较小,图像上表现的比较平缓,则认为发生了镜头渐变变化。 镜头边缘检测的主要任务是检测出视频中发生镜头突变和渐变变换的边界。通常来说,同一个镜头中的图像帧在时间和空间上存在着连续相似性,因此我们可以通过计算相邻图像帧间的变化差异来实现边缘检测功能。以下列出的是几种常见的镜头边界检测算法,如何定义图像的特征,如何判定相似,是这些算法中非常重要的两点内容[8]。 (责任编辑:qin) |