毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

深度学习基于内容的图像检索

时间:2023-03-19 20:23来源:毕业论文
深度学习基于内容的图像检索。提出一个有效的深度学习框架去生成二值哈希码,运用于快速图像检索。文章的想法是,当数据标签可用时,通过利用隐层表示控制类别标签的潜在概念

Abstract 最近邻检索是一个适用于大规模图像检索的有效策略。基于最近CNNs网络的流行,本文提出一个有效的深度学习框架去生成二值哈希码,运用于快速图像检索。文章的想法是,当数据标签可用时,通过利用隐层表示控制类别标签的潜在概念,可以学习到一个二进制码。CNN的利用也可以学习到图像表示,不同于其他监督策略需要成对的输入来学习二进制码,本文的方法通过“点对”的方式学习哈希码和图像表示,使其更适用于大规模的数据库。实验结果表明本文策略在CIFAR10和MNIST数据库上优于state-of-the-art的哈希算法。87944

Introduction

基于内容的图像检索旨在通过分析图像内容来寻找相似图像,因此图像表示和相似度度量方法成为此课题的关键。因循这样的研究路线,最有挑战性的问题是联系像素级别的信息和来自于人类感知的语义信息。尽管一些手工制作的特征被用来表征图像,但这些视觉描述自仍然有所局限,一直到深度学习的突破。近来的研究表明深度CNN在许多课题上显著提升了性能,例如目标检测,图像分类,分割。这些成果都归功于深度CNN学习了丰富的中层图像表示。From~优Y尔R论^文W网wWw.YoUeRw.com 加QQ7520.18766A  因为深度CNN学习了丰富的图像的中层特征描述子,Krizhevsky等人将CNN第七个layer的特征向量用于图像检索,在ImageNet上得到了不错的效果。但也因为CNN特征维度较高,直接计算4096维向量之间的相似性效率很低,Babenko等人提出采用PCA降维的方法,取得了不错的效果。

在CBIR(content based image retrieval ,基于内容的图像检索)中,图像表示和计算开销骑着额至关重要的作用,由于近来视觉内容的增长,基于大规模数据库的快速搜索成为迫切需要。许多研究致力于解决怎样在大规模数据库上有效地检索出相关数据。因为大量的计算开销,传统的线性搜索(或者穷举搜索)不再适用于大规模的数据搜索。取而代之的是ANN(Approximate Nearest Neighbor ,近似最近邻)和基于散列(hashing)的方法来提高速度。这种方法将高维特征映射到地位空间,产生简洁的二进制码。通过这些二进制码,快速图像搜索能够通过二进制模式匹配或者汉明距离来进行,显著降低计算开销并且优化搜索效率。这些策略一部分属于“配对”策略,通过利用相似矩阵描述图像对(或者数据对)之间的关系,利用这种相似信息取学习hash函数。但当处理一个大规模数据库时,需要构建矩阵和码。源-于,优Y尔O论U文.网wwW.youeRw.com 原文+QQ75201,8766

 本文利用CNN来实现hashing的想法,通过深度CNN产生简洁的二进制codes。在数据被标记的前提下,设计CNN模型能够同时产生图像表示和二进制码,也就是有监督的学习。我们认为深度CNN能够学习并且数据标签可用,二进制编码能够通过利用一些隐层所代表的决定了结构中的类别标签的潜在概念实现学习(通过sigmoid等二进制激活函数)。这和其他一些监督策略不同,其他策略需要成对的输入以考虑数据标签来实现学习。也就是说本文以“点对”的方式学习哈希编码,利用了CNN的增量学习性质(随机梯度下降)。深度框架的采用也实现了高效率的检索特征的学习。适用于大规模的数据集。论文网

        本文方法具有以下特性:

        `引入了一种简单有效的监督学习框架适用于图像检索

        `通过网络模型的微调,能够同时学习区域特定的图像表示和一系列hashing-like函数

        `提出的方法超过了现有的baseline 深度学习基于内容的图像检索:http://www.youerw.com/jisuanji/lunwen_150247.html

------分隔线----------------------------
推荐内容