20
结论 22
参考文献 23
致谢 24
附录 25
1 前言
1。1 选题背景及研究意义
在Web2。0时代,尤其是随着Instagram、Facebook等社交网站的风靡,图像等数据每天都在以惊人的速度增长。例如,Facebook注册用户超过10亿,每月上传远远超越10亿的图片;照片分享服务Instagram每天分享逾9500万张照片;中国最大的电子商务系统淘宝网的后端系统上保存着286亿多张图片。面对着如此大规模的蕴含大量视觉信息的数字图片库,怎样从海量的图像库中疾速、高效而精确的进行检索反馈给用户真正所需的或感兴趣的图像,成为数字图像检索畛域钻研的难点和热点。基于内容的图像检索技术能够很好的满足用户的需求。
随着我国社会科技的提高和经济的繁荣发展,多媒体技术和因特网技术的应用融入自然和社会的各个领域,最终将实现智能化自动化管理各种生产和生活资料。国内代表性的系统有:浙江大学的基于图像颜色的检索系统PhotoNavigator、清华大学的Internet上静态图像的基于图像内容检索的原形系统等。国外著名系统如:IBM公司的QBIC系统、哥伦比亚大学的VisualSEEK和WEBSEEK查询系统等[1]。
1。2 图像检索技术分类
按描绘图像内容模式的不同,图像检索可以分为两类:一是基于文本的图像检索技术(TextBasedImageRetrieval),二是基于内容的图像检索技术(ContentBasedImageRetrieval)。
1。2。1 基于文本的图像检索
基于文本的图像检索技术始于20世纪70年代末。其主要内容是人工剖析图像,按照图像的物理特征、内容特征来对文本进行标引,建立了文本文献注录的索引数据库,经过检索索引数据库取得图像编号,然后通过编号取得检索图像。广泛应用TBIR的技术的搜索引擎有baidu、sogou、google、yahoo等。用户进行检索通过提交查询关键字,检索系统依照用户关键字获得数据库中标注着对应关键字的图片,返回给用户最终的搜索查询结果。
这类基于文本的图像检索形式尽管易于完成,且因为人工介入标注,查准率比较高。但是它也有非常明显的缺陷,主要有以下两个局限性:
(1)人工介入标注过程使它局限于小规模的图片库,应用大规模图片库时费时费力。
(2)不同的人对同一图片的主观判断、认知理解和言语使用是不同的,形成文本信息描绘图片的差别,从而用户的关键词和数据库中的关键词不匹配而搜索查询失败。
1。2。2 基于内容的图像检索
为了处理基于文本的图像检索技术浮现的问题[2],人们逐渐建立了基于图片自身内容的图片索引技术。基于内容的图像检索技术创立并获到了急速的发展。
运用计算机对图像进行剖析,将创立图像的特征矢量进行描绘和存储图像特征库,只需人们确定一张查询图像,就采纳与之同样的特征提取方法来提取查询图像的特征从而得到查询向量,运用相似性度量准则从查询向量到特征库进行计算各个特征的相似性大小,依照相似性的大小结果进行排序而且按次序输出与之对应的图片。基于内容的图像检索技术克服了采纳文本进行图像检索所面临的局限性[3]。基于内容的图像检索技术有如下几个特点:
(1)直接提取线索从图像的内容中,直接进行分析并提取图像特征,使得用户能够更加接近检索目标。 数字图像检索技术的研究(2):http://www.youerw.com/tongxin/lunwen_199198.html