3。2 稀疏连接
卷积神经网络通过在相邻的层之间强制使用局部连接[25],以此来适应图像的空间局部相关性,即,m层中隐藏单元只接受m-1层的输入,单元在空间上只接受临近的感受野[26]单元。
假定m-1层为视野输入层,在上图中,m层的接受域的宽度为3,也就是说,m层的每个单元都与且仅与相邻的m-1层的3个单元相连接,在m+1层与m层中也有类似的结构。
这些层相对于下面的层的感受野都是3,但对于其初始的输入感受野5,相对来说则是稍大一些。每个单元只相应感受野内的单元,对其他单元相应迟钝。这种架构从而确保了训练过程中,过滤器是强烈反应了图片输入模式中的空间局部相关性。从图上也可以看出,这样的许多层叠加之后,导致了非线性过滤器越来越全局化(相应更大的图片区域),例如,m+1层的单元对应了宽度为5的非线性特征。
3。3 权值共享
此外,在卷积神经网络中,每个过滤器覆盖整个图像区域,这些复制的单元共享相同的参数(权值向量以及偏差等等),并形成一个特征图。
在上图中,有属于同一个特征图的3个隐藏单元,相同颜色的权值进行共享。这里只需要对原有的算法进行一些小的改变,就任然可以使用梯度下降的方法来学习这些权值。这里的权值共享的梯度是所有共享参数的梯度的综合。
这样做具有重要的意义,一方面,重复单元可以进行特征识别,而不需要考虑其感受野所在的位置,另一方面,权值共享大大减少了自由参数的数量,从而提高了学习效率[29]。这种模型上的设定使得卷积神经网络对图像问题有很好的泛化性质。
3。4 信息传输函数
特征图是通过在整个图像的子区域中,进行函数的重复计算而获得,换句话说,就是通过用线性滤波器对输入图像的卷积,加入偏项,然后施加一个非线性函数来获得。用来表示一个在特定层的k-th特征图,其中过滤器是由权值和偏量决定,特征图由以下函数(非线性函数)获得[30]:
(3。1)对于1D信号的定义:(3。2)来;自]优Y尔E论L文W网www.youerw.com +QQ752018766-
上述信号可被扩展为2D信号:
更形象的表示数据,每个隐藏层有多个特征图构成,。隐藏层的权值W可代表在4D张量中特征图差异、源特征图、源垂直位置,源水平位置的任意组合。偏量b可代表一个包括任意特征图差异值的元素的向量。