4.3 文字识别 .. 21
4.4 运动特征 .. 23
4.4.1 活动轮廓技术 .. 24
4.4.2 帧间跟踪原理 .. 25
4.4.3 利用活动轮廓技术进行帧间跟踪 . 26
4.5 其他特征 .. 27
4.5.1 形状特征 27
4.5.2 空间关系特征 .. 28
5 基于文本特征的视频提取 29
5.1 文本区域定位 . 29
5.2 视频文本识别 . 30
5.2.1 图像二值化 . 31
5.2.2 视频文本识别 .. 31
6 总结与展望 32
6.1 总结 32
6.2 展望 32
致 谢.. 33
参考文献 . 34
1 引言
1.1 研究背景
随着信息化社会的到来以及信息高速公路的实施,人们越来越多的接触到大
量的视频信息,大容量高速存储系统为视频的海量存储提供了基本保障,各行各
业对视频的使用越来越广泛,视频信息资源的管理和检索显得日益重要。视频数
据库的研究对多媒体数据库、电子图书馆、医疗学图像管理、罪犯识别系统、卫
星遥感图像、地理信息系统、商标版权管理等方面提供有力的支持。
在传统的数据库系统中,信息的检索一般以数值和字符型为主,而在多媒体
数据库中集成图像、视频、音频等非格式化信息,它们具有数据量大、信息不定
长、结构复杂等特点。每一种媒体数据都有一些难以用字符和数字符号描述的内
容线索,如图像中某一对象的形状、颜色和纹理,视频中的运动,声音的音调等。
当用户要利用这些线索对数据进行检索时,首先要将其人工转化为文本或关键词
形式,这种转换带有一定的主观性,且极其费时,因而仅仅基于关键词的检索己
不能满足用户的检索要求。数据库及其它信息系统不仅要能对图像、视频和声音
等媒体进行存储以及基于关键字的检索,而且要对多媒体数据内容进行自动语义分析、表达和检索。
所以理想的做法是让计算机能够自动的对非结构化的视频进行结构化的分
析和处理,提取出视频包含的内容,并进行组织、管理和存储,从而方便用户检
索。因此,视频有效特征的提取越来越得到研究者们的重视。该项研究涉及到视
频镜头分割、关键帧提取、故事检测以及如何利用这些信息进行检索的问题,由
此可见,这是一门涉及到很多领域的交叉学科,需要利用图像处理、模式识别、
计算机视觉、图像理解等方面的知识,还需利用人工智能、数据库管理、人机交
互、信息检索、大数据组织等领域知识,才能设计出可靠有效的检索系统以及友好的交互界面。
1.2 本课题的研究目的和意义
视频数据具有人类视觉最敏感、最易接受的特点,在多媒体数据中占有绝对
重要的地位,同时它又是最复杂、数据量最大的媒体,为了更好地对视频数据进
行检索,基于内容的视频检索仍有许多需要进一步研究的内容:
第一,视频处理是视频检索的基础,而视频数据是动态的,具有动态特征。
而动态特征的描述和提取以及动态特征的匹配等都不同于静态特征,仅仅代表帧
的特征很难完全说明运动序列的情况。因此提取动态特征和处理动态特征对视频
更有意义。
第二,由于视频的数据结构不同于其它媒体数据,使得传统的数据索引方式
已不适合视频数据的检索,研究基于时空的多文索引方法将更有助于视频检索速 视频有效视觉特征提取与实验研究(2):http://www.youerw.com/jisuanji/lunwen_6627.html