基于卷积神经网络的图像检索技术研究(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于卷积神经网络的图像检索技术研究(2)

开发平台及开发工具 11

3。2 基于 MATLAB 的 Faster R-CNN 11

3。3 行人坐标的提取及行人池的建立 12

3。4 评价指标 13

3。5 图片库介绍 14

3。6 基于 Faster R-CNN 的行人目标检测实验结果 14

3。7 实验结果分析 15

4 图像匹配 18

4。1 SIFT 特征值提取 18

4。2 Color Name 特征值提取 21

4。3 特征值聚类及量化 22

4。4 二维索引框架 23

4。5 匹配值得计算 24

4。6 词频-逆向文件频率 24

5 基于二维索引的图像匹配及实验数据 25

5。1 开发平台及开发工具 25

5。2 行人池介绍 25

5。3 实验程序模块及功能 25

5。4 基于二维索引的图像匹配实验结果 29

5。5 实验结果分析 30

结论 32

本科毕业设计说明书 第 II 页

参考文献 33

1 绪论

1.1 研究背景与意义

近年来,计算机技术飞速发展,移动互联网大量普及,各种智能终端层出不穷。无论是 在日常生活还是工作中,大量的图像都成为了信息传播的主要方式。随之而来的问题便是用 户需要从海量图像中检索出对自己有用的信息,也就是图像检索。图像检索技术本质上是比 对图像特征,对其进行匹配的技术,是一项从大量信息中提取有用信息的技术。该技术的核 心是:在提取阶段,检测出图像中的待测目标,并截取该目标的图片;在匹配阶段,先提取 测试图片和图库图片的内容特征参数,再将两者一一比对,最后按照匹配得分高低得到相同 或相似的图片。论文网

起初流行基于文本的图像检索(TBIR)方法。该方法并不是直接分析图像的视觉信息特 征,而是为图像建立文字索引标签,通过图像的描述性文字从侧面描述图像,属于“以文找文” 的范畴。用该方法对图像进行标记需要大量的人力和时间,所以当图像的数量呈爆炸性增长 时,基于文本的图像检索技术就已经被淘汰。

20 世纪 90 年代出现了基于内容的图像检索(CBIR)。该方法直接分析图像的图片信息, 再从备选图像库中查找出具有相似特性的图像,也就是“以图找图”。但是图像的内容特征通 常以像素点为单位,其规模要远大于纯文本信息,所以需要有高效率的检索方式与之匹配, 也是该领域当前的主要发展方向。目前 CBIR 应用前景良好,越来越多的受到人们的关注, 其应用领域主要如下: (责任编辑:qin)