本文的目的是这样的,从头开始产生一个图像块相似度函数,即不尝试使用任何人工设计的功能,而是直接从特征对原始图像块学习。这在以前也引起了神经结构和深度学习的巨大进展,现在我们选择深度学习的卷积神经网络[4,5]方面来表示这样的功能。在此过程中,我们也探讨了这样的功能可以用在解决什么问题上,及其在怎样的网络架构中使用等。因此,我们探索并提出多种类型的网络,根据其不同特点进行取舍。最终决定在所有的情况下来训练学习,并且在网络中,我们使用唯一的输入,即包含原始图像块的配对的一个大数据库。这将允许通过用更多的采样来丰富这个数据库,而且不会太困难,以进一步改进我们训练方法的性能(事实上,像软件生成这样的样品并不困难[6])。

当了解了任务目标之后,可以决定实验所得的功能应该如下:(I)我们从数据中直接学习(不使用任何人工设计的特征)使用相似度函数,并且要考虑到类型转换和效果(例如,宽基线,照明等。)(II)我们探索并提出了多种适合代表这样的功能,还有网络架构,而且能够提供更高的性能。如在[7]。(III)在几个问题点和基准数据集使用我们的方法,进行性能测试,可观测到显著优于目前所见的常用方法,即产生的特征描述符比手动设计的描述符有更好的性能(例, SIFT, DAISY)或其他所能见到的描述符[19]。重要的是,由于它们的卷积性质,即使在密集的方式下,进行生成描述符的计算也是非常高效的。论文网

1。2  卷积神经网络

卷积神经网络在最近几年以来发展迅速[18,19],尤其是在声音和图像处理方面引起了极大的重视。上世纪60年代,Hubel和Wiesel[12]在视觉皮层的研究中发现了猫的大脑皮层中独特的网络结构,尤其是底层感知细胞对局部有效这一信息,对于降低反馈神经网络复杂度很有用,于是就有了卷积神经网络的诞生。如今,在众多科学研究领域,尤其是在声音和图像处理方面,卷积神经网络已经成为不可代替的热点之一。在上世纪70以及80年代,认知机及神经认知机这些模型已经可以在人类较少提示的情况下,从数据中识别图形。神经认知机中局部特征结合的思想广泛应用于其他网络模型中,其中较为著名的就有尺度不变性良好的SIFT描述符,以及用于手写识别在银行里使用广泛的LeNet模型。

神经认知机将图像处理问题分解成许多小模块,然后在分层相连的特征平面中处理各个问题,改模型将视觉系统模块化,对于图像中物体有位移即小幅度扭曲的状况下,依然可以识别。受Hubel和Wiesel提出的在视觉初级皮层上的简单细胞和复杂细胞信息影响,神经认知机自然发展成为这种层状叠加的模型。该模型中最重要的是用于特征提取的S-元和抗变形的C-元。其中S-元中包括两个重要参数,确定输入连接的数目感受野,以及控制对特征子模式的反应程度的阈值参数。在传统的神经认知机中,C-元输出的视觉模糊状况城正太分布,由S-元的感受野接受。如果在感受野中,中央的视觉模糊状况比边缘地区小,则接受该种输入状态。理想情况是,在训练模式[16]和刺激过程中,感受野的中心部位和边缘所产生的效果差异越来越明显。基于此种目的,之后有了改进型神经认知机的出现[14,36]。

一般来说,卷积神经网络主要包括两种类型的层结构[15],一种是卷积层,它是CNN的核心组成部分,该层的参数包括一组可学习的过滤器,其中过滤器中又有一个小感受野。另一种是池层,他是一种非线性的下采样的形式,其中最常见的实现方式有max-pooling,即通过将输入划分成一组非重叠矩形,并在每个这样的子区域中,输出特征点最大值。卷积神经网络的一个主要优点是卷积层共享权值,这意味着在层中的每个像素的被用于相同的过滤器计算,这一特点使得内存占用空间减少,性能提高。

上一篇:Nginx分布式Web服务器架构设计与实现
下一篇:关系型数据库设计中3NF分解演示系统的设计与实现

基于神经网络的验证码识别算法

基于卷积神经网络的迁移方法研究

集装箱图像中残损位置及...

BP神经网络算法在matlab实现

针对神经网络中特殊函数高性能计算架构

神经网络方法在现代生物...

基于卷积神经网络的图像检索技术研究

网络语言“XX体”研究

老年2型糖尿病患者运动疗...

LiMn1-xFexPO4正极材料合成及充放电性能研究

麦秸秆还田和沼液灌溉对...

新課改下小學语文洧效阅...

我国风险投资的发展现状问题及对策分析

ASP.net+sqlserver企业设备管理系统设计与开发

张洁小说《无字》中的女性意识

安康汉江网讯

互联网教育”变革路径研究进展【7972字】