对图像检索的研究在二十世纪七十年代就已经开始了,当时对图像检索的研究都是基于文本信息,这种技术简称TBIR ( Text-based Image Retrieval)。该方法是根据图像的内容特征使用文本进行标注,为每幅图像制作文本标签,然后使用图像的文本标签建立检索数据库以供检索图像使用。基于文本的图像检索在应用到大量图像的检索时又有一些不足之处:对图像的标注是通过图像内容、上下文内容的因素人工设置标签的,这使得基于文本的图像检索带有较强的主观性,由于地域差异、文化差异等原因会使人们对一些图像有不同的认识而贴上不同的标签;有些图像的内容过于复杂或过于抽象,很难使用准确的文本去标注这些图像。这些不足之处影响着基于文本的图像检索的效果。此外,随着图像数量的增加,人工标注文本信息是非常耗时耗力的。
问题的出现推动着新技术的出现,二十世纪九十年代在图像检索领域中提出了基于内容的图像检索(CBIR, Content-based Image Retrieval),该技术彻底抛弃了使用文本对图像进行描述,而是采用将图像中的颜色、纹理、形状或空间信息转化成矢量特征来对图像进行描述。
我们平时在搜索图片时使用到的搜索引擎,如Google、百度、Bing等,一般使用的是基于文本的图像检索技术,而Google、百度也都推出了基于内容检索图像的功能。不管采用的是哪种技术,这些图像搜索产品在检索原理上大都是三个环节:⑴ 收集图像资源,对图像进行处理,提取并分析图像的特征,为图像建立索引;⑵ 得到用户的需求,通常情况用户来搜索图片时都是通过输入关键字来向系统提出需求,系统再将用户的寻求分析转化成可以在索引库中查找的形式;⑶ 根据一定的查找算法,将转化后的用户需求在索引数据库进行查找,提取出满足阈值的记录作为结果,按照与用户需求的相似度降序的方式输出。这种检索方式会使得在搜索结果中会有许多几乎相同或近似的图片存在 具有缩放功能的图像检索系统设计(2):http://www.youerw.com/jisuanji/lunwen_25729.html