总而言之,基于内容的图像检索技术是可视化角度图像检索的一大进步,然而,由于现实的一些原因,它本身还是具有一些缺陷:首先就是用户查询接口的不完善。在一个比较理想的图像检索系统中,用户的查询接口的交互能力必须是丰富的,并且还需要很直观易用,简单易上手。反观目前的图像搜索引擎,其用户查询接口并不丰富,反而比较趋于单一化,用户交互能力也不是特别的强,甚至一些搜索引擎只提供了基于文本描述查询接口,也就是我们平时经常使用的关键词搜索。其次是图像的查询率低,例如,用户在进行搜索之后还需要自己的在搜索引擎返回的很多很多为数上百甚至上千的图像中人为筛选出自己需要的,而且在有些情况下,搜索引擎返回的根本就没有你的期望图像。再来是目前基于图像颜色特性、纹理特性、形状特征等特征的提取方法千差万别,但这些算法的存储量都非常的大且容易造成很严重的丢失信息,图像间的相似程度并不能通过这些算法很准确的表达出来。
1.3 研究意义
与传统的电子商务网站通过关键字来搜索商品相比,电子商务网站使用“以图搜图”搜索将具有更大的优势,主要表现在以下方面:
(1)当你在看杂志的时候,看到一件很喜欢的衣服,或者说你最喜爱的某个明星带了一件你很喜欢的配件,但是当时你能获取到的就仅仅是物品的图片信息,其他信息一概不知,比如像在哪里能够买到它,它的价格又是多少,就当只有图片信息的时,如果有了“以图搜图”的功能,你就能很快找到喜爱的宝贝,并且知道哪里可以买到,需要花多少预算。
(2)“以图搜图”搜索能够快速的搜出电子商务网站中相同或者相似的产品。在已有的电子商务网站中,比如淘宝,商品数量的庞大,内容的繁杂,没有“以图搜图”功能的话,很难在很短的时间内找到自己喜欢的东西。
(3)“以图搜图”功能还能够给你提供更多的选择以及更多的对比,你不需要一家店一家店的跑,也不需要计算各家店里商品的价格差。比如,你在淘宝上看中了一件衣服,你通过“以图搜图”就能快速准确的找到有出售这件衣服的店家,并且能够一目了然的看到各店家提出的价格。这样,你就会更加的快速正确的买到你想买的物品。
2 相关技术的研究发展状况
本图像检索系统所涉及的核心技术主要包括所检测图像特征的提取以及图像之间的相似度距离。待检测的图像特征的提取是判断图像相似的依据,图像之间的相似度距离则是关于图像之间的相似的程度。
2.1 图像特征提取技术
图像特征的表达与提取是基于内容的图像检索技术的基础,一般来说,基于内容的图像检索主要是依据图像的视觉特征,如图像自身的图形颜色的分布、图形形状、图形纹理等特征[2]。也就是说有针对图像颜色特征进行的特征提取、也有针对图像形状特征进行的特征提取,依此类推。“一千个人有一千个哈姆雷特”,人们的主观认识会千差万别,对于某个图像没有一个大众普遍认同的最佳表现方法。因此,图像特征表现方法的多样性才能从各个角度来描述图像特性。
2.1.1 颜色特征
基于颜色直方图的检索方法是最早被用来进行基于颜色的图像检索的方法。人类看到不同物体的差别的时候一般首先使用的都是颜色特征,因为颜色特征是图像具有的最直观的一种特征,人一眼就能看出来,颜色描述了图像中景物的表面所反映的性质。所以说,在通常情况下,颜色是图像最直观的、最高效的表示方法。同时,颜色特征也是图像检索中比较广泛使用的,颜色特征较其他的来说稳定性更好,一般来讲,不会根据图像质量的退化、旋转、尺寸和方向改变而改变,这些都说明了其实颜色特征的鲁棒性很强。