度和精确度的提高。
第三,由于视频表现方式复杂,为适合不同用户的要求,必须以可视化和多
层次的用户查询接口来帮助用户浏览和检索,同时需具备导航功能,使得用户能
在需要的时候进入适当的视频片断、视频镜头乃至代表帧。
第四,随着英特网的迅速发展,网络上的信息越来越丰富,视频必将成为网
上一种很重要的资源,为了让人类能够在浩如烟海的信息海洋中自如的畅游,基
于网络的视频检索技术将成为一个研究的主要内容。因此网络信息的有效组织和
存储管理将为基于内容的多媒体信息检索提供方便的途径。
2 视频检索技术的现状
目前国内外已经开发出多种视频数据检索系统,这些系统虽然大多没有成为
商用化系统,但也反映了视频数据检索系统研究的主要成果。目前国内外开发的
视频检索系统有:
2.1 QBIC 系统
QBIC 系统是 IBM Almaden 研究中心研究开发的基于内容的检索系统,此系
统提供了对静止图像及视频信息基于内容的检索手段,是第一个功能齐全的视频
数据库系统,对视频数据库发展有较深远的影响[1]。
在 QBIC 系统中,静态图像经过对象识别模块以自动、半自动方式由场景中
识别出对象,场景与对象均送入特征提取部分,从中提取出相关特征(如颜色、
纹理、形状、草图等)与图像一并送入数据库中,视频序列送入镜头提取模块,
由此模块把视频流分割为镜头,并从中提取出代表帧及运动对象,然后送入特征
提取部分,从视频镜头及对象中提取有关特征(由代表帧中提取颜色、纹理、形
状等特征及从镜头中提取的有关对象运动特征)送入数据库中。在进行查询时,
用户可以从查询接口输入以图形化或示例方式表示的查询对象特征,与数据库中
存储的对象的内容特征进行比较匹配,寻找出具有相似特征的图像和视频。查询
结果是以相似性顺序排列的图像集合。
2.2 JACOB 系统
JACOB 系统是基于内容的视频数据库查询系统,分为两个功能模块:第一个
模块用于视频数据库中的分段,第二个模块用于数据库查询。视频序列通过镜头
抽取模块划分为镜头,从每一个镜头中抽取一些代表帧(R-帧) ,并通过它们的
颜色和纹理内容对镜头加以描述。从视频中抽取的镜头以及从镜头中抽取的 R-
帧都存储在镜头 DB 中。在进行视频查询时,当一个直接查询或示例查询到达了
查询接口,匹配引擎开始通过分析存储在特征DB中的数据来查找最相似的R-帧,
最终将根据用户选择的n值显示出 n个最接近的R-帧[2]。
2.3 Visual SEEK 系统
美国哥伦比亚大学图像和高级电视实验室开发的。它实现了互联网上的“基
于内容”的图像、视频检索系统,提供了一套工具供人们在Web上搜索和检索图像和视频。
2.4 CORE 系统
新加坡国立大学开发的一个基于内容的检索机。其显著技术特色包括:多种
特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、
建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。
另外还有许多类似的系统,例如加利福尼亚大学 Santa Barbara 分校的
Netra、伊利诺依大学的 MARS、CMU 的 Infomedia、哥伦比亚大学的 Video Q 以
及清华大学计算机系结合 863 高技术研究发展项目“Web 上基于内容图像检索”
的研究所建立的Internet网上的图像检索系统。 视频有效视觉特征提取与实验研究(3):http://www.youerw.com/jisuanji/lunwen_6627.html