摘要深度学习是近年来的热门研究课题,图像检索技术有着很重要的应用价值。本文的主 要工作是将深度学习技术应用于图像检索中。在图像检索的研究中,采用了如下的技术路 线:首先根据待检索的目标,采用深度学习的方法对图片进行目标检测,以提取候选目 标,再对候选目标进行匹配以实现最终的检索。在目标检测中,本文使用了最新提出的 Faster R-CNN 方法提取目标区域,以行人为例,在 2015 智慧城市跨摄像头多目标检测数 据集上,检测准确率为 87。53%,召回率为 60。72%。图像匹配方面,本文采用 Liang Zheng 等人在 CVPR2014 提出的基于二维索引的方法,将图像的 SIFT 特征值与 Color Name 特征 值相结合,建立一个二维索引,对索引中每个坐标进行投票来计算匹配得分,在 2015 智 慧城市跨摄像头多目标检测数据集上得到的结果中,前十张图片的准确率达到 90。18%。77213
毕业论文关键词 目标检测 图像匹配 卷积神经网络 SIFT 特征值
Title Image retrieval based on convolutional neural networks
Abstract Deep Learning is one of the hottest research topics in these years and image retrieval technology has significant value in application。 The main work of paper is applying deep learning to image retrieval。 The following methodology has been used during the image retrieval research。 Firstly, according to the potential targets, we use deep learning methods to detect objects in the image, in order to extract candidate targets。 Then we match the candidate targets to complete the final retrieval。 In object detection part, this paper uses the newly proposed method, called Faster R-CNN, to extract the regions with candidate targets。 Taking person as an example, In the dataset of 2015 Smart City Competition, our precision for detection is 87。63% and recall is 60。72%。 In image matching part, this paper uses the coupled multi-index method proposed by Liang Zheng at CVPR 2014, combining SIFT feature with Color Name feature, constructing a coupled multi-index and vote on every coordinates in this index in order to calculate the matching scores。 In the dataset of 2015 Smart City Competition, the average matching precision of the top 10 images reaches 90。18%。
Keywords Object detection Image matching Convolutional neural networks SIFT feature
本科毕业设计说明书 第 I 页
目 次
1 绪论 1
1。1 研究背景与意义 1
1。2 研究历史与现状 1
1。3 目前存在的主要问题 2
1。4 本文的组织结构安排 2
2 目标检测 4
2。1 卷积神经网络 4
2。2R-CNN 5
2。3Fast R-CNN 5
2。4Faster R-CNN 7
3 基于 Faster R-CNN 的行人检测及实验数据 11
3。1