借助卷积神经网络学习比较图像块
时间:2022-07-23 11:07 来源:毕业论文 作者:毕业论文 点击:次
毕业设计说明书中文摘要卷积神经网络(Convolutional Neural Network, CNN)最近几年在图像识别和语音处理方面有了巨大的发展,由于它使用权值共享的网络结构,使得在训练过程中,权值参数较少,在处理大型数据时有较好的性能,并且在处理图像时,可以直接输入原始图像,避免了前期复杂的预处理。82534 如何直接从图像数据学习,即不使用人工设计的特征,来生成一个用于图像块对比的相似度函数,本文将试图使用卷积神经网络解决这一问题,并将其用代码实现。所使用的卷积神经网络对于亮度、位置变化,旋转等情景有着良好的健壮性。并且分析了使用的多个网络模型,还有它们在不同场景下的性能和速度的差异。 毕业论文关键词 高斯差分;空间金字塔池;误报率;平均准度均值;最大稳定极值区域 毕业设计说明书外文摘要 Title Learning to Compare Image patches via Convolutional Neural Networks Abstract In recent years, Convolutional Neural Network has great development in the area of image recognition and speech processing。 Its main advantage is using weight sharing network, which has less parameter and performs better when the dataset is large。 The convolutional neural network can also take the origin image as input and avoid the complex pre-processing。 The problem in image processing is how to learn directly from the image dataset, not using the current feature, to form a similarity function used in image patches。 This paper solved this problem by using convolutional neural network and implemented it by C++。 The convolutional neural network used in this paper has good robustness over the transformation in brightness, position and rotation。 We also analyzed the multiple network models used in this paper and their performance as well as speed difference in different scenarios。 Keywords Difference of Gaussians;Spatial pyramid pooling; false positive rate;mean average precision;Maximally Stable Extremal Regions 目 次 1 引言 1 1。1 图像对比简介 1 1。2 卷积神经网络 2 2 相关工作 3 3 卷积神经网络结构 4 3。1 各层网络 4 3。2 系数连接 5 3。3 权值共享 5 3。4 信息传输函数tanh 6 4 架构 8 4。1 基本模型 8 4。2 其他工具 9 4。2。1 深度学习 9 4。2。2 双流中心环绕网络 9 4。2。3 SPP网络模型 9 4。3 环境配置 9 5 学习 11 5。1 优化算法 11 5。2 数据增强和预处理 11 5。3 主要工作流程 11 6 实验 13 6。1 本地图像块基准 13 6。2 宽基线立体评估 15 6。3 本地描述符性能评估 17 结论 18 致谢 19 参考文献 20 1 引言 1。1 图像对比简介 图像块比对是计算机视觉和图像分析的基本任务之一,它经常被用作在各种视觉任务中。这些任务范围可以从小到,如运动结构,宽基线匹配,建筑全景和超分辨率图像,到难度很大的,如目标识别,图像检索和对象的类别分类,特征提取等。 当然,决定两个图像块是否相互对应这个问题或许不是颇具挑战性,毕竟存在着太多太多的因素会影响图像[1]的最终外观。这些可能因素包括在一个场景的整体照明视点改变,闭塞,遮光,摄像机位置变化等。事实上,图像块比对的客观需要,使得过去几年中许多人工设计的特征描述符的迅速发展,如SIFT[2]和DAISY[27],就曾在计算机视觉界产生巨大影响。然而,这样的人工设计描述符考虑的因素比较局限,并不一定是所有决定图像的外观最佳因素。 另一方面,现在人们可以很容易获得(例如,使用软件生成)包含图像块所对应的大型数据集[3]。在此就引出以下问题:我们如何适当地使用这些数据集,来训练自动学习图像块比对的功能? (责任编辑:qin) |