基于内容的图像检索的图像摘要技术研究(3)
时间:2018-08-09 10:41 来源:毕业论文 作者:毕业论文 点击:次
另外,图像的动态更新使得我们必须经常性的对网络进行重新检索,删除一些无效的链接地址,添加新的记录等。 最后因为互联网图像检索系统面对的是庞大的用户群,二十四小时不停接受用户的点击。因此对它的稳定性,响应速度和检索效率都有很高的要求。 说完搜索引擎的特点,接下来讲的是图形检索引擎的系统模块。 图形检索引擎按照工作过程来分,可以分为四个模块:一,图形获取模块[17],互联网上充斥着大量图像资源,图形搜索引擎需要搜集用户可能感兴趣的图像以供使用。其中,图像获取模块包括高效的图形搜索器和图形分析器[18]。前者能根据选定的代表性站点自动进行图像搜集。它能根据预先设定的域名和IP地址划分网络空间来进行穷尽搜索。然后对站点内的所有页面都送给页面分析器进行分析,根据其结果进行分别处理,若是发现网页上的图像内容发生变化又或是出现新的图像便获取该网页,并且页面内的所有内容都会以链接的形式存储在相应的数据库中。二,图像处理模块,该模块包含有图像索引,对象库。其中索引库是对搜集到的图形进行特征抽取。对象库和索引库相互结合来进行快速搜索。特征抽取又可分为底层特征抽取和语义特征抽取。特征抽取图形的低特征包括颜色、纹理、形状等特征。其中最直观而明显的特征是颜色特征,一般包括颜色直方图和颜色矩等。纹理特征即物体的视觉模式。因此图形便可看成是不同的纹理区域组合,并且由于纹理通常是定义为某种局部性质,或者是局部区域中像素关系的一种度量,可以进行一定程度的定量描述对图像中的空间信息。它还包含了物体表面组织结构以及周围环境之间的关系。主要考虑纹理特征的粗糙度、对比度。方向特征等特性。形象特征包括基于边界的形状特征[20]和基于区域的形状特征两种。通过各种方法将这些低层的特征抽取出来,形成一组特征向量建立索引并放入相关数据库中。 语义图像就是指使用自然语言的名词、形容词和动词描绘的图像内容属性,其中包括图像的主题、背景、主体等等。其中图像主题是一种关键词用来描述图像内容或图像关键字。图像背景就是指背景内容。最后图像主体就是突出表现的物体。网络中的图形语义层是用网页中与图像相关的文字信息来表示图像的语义特征。其具体内容包含图像的文件名、网址、相应的替代文字、周围的文字、超链接以及所在网页之间的链接。 所有的特征都会被页面分析器从网页中提取出来。并且被赋予不同的重要性。然后可以建立图像的特征语义向量按照传统的文本信息检索技术[16]。向量的每个分量所对应的关键词取决于与图像有关的网页分部。三,图像检索模块主要有用户界面和查询接口。其中前者用于连接用户与查询接口,而查询接口用于实现检索匹配过程,运用相关度计算方法使提问与记录的匹配与筛选能够实现。反馈出符合用户界面要求的结果。之后通过用户界面返回给用 户检索的结果按照相似度来进行输出排序。也可以进一步基于得到的检索结果再进行查询。四,知识库,其主要是为了限制搜索范围。为了避免不同的检索要求或不同的背景可能会对媒体内容语义产生出不同的要求。 1.2.2 图像检索分类 按照图形检索资源范围来分类的主要有面向互联网的图形数据库搜索引擎和互联网图形数据库搜索引擎。其中前者与普通的图形数据库不同,其是建立在网络的基础上,面向的用户是网络用户。但是它的存储方式与检索方式是和普通数据库相似的。并且还提供有以下几种检索方式:基于颜色、颜色图层、纹理、形状的检索;基于例子的检索;基于草图的检索;基于文本的检索和图片分类浏览。 (责任编辑:qin) |