文档介绍:-
. z.
卷积神经网络
摘要:卷积神经网络是近年值和归一化处理后的值,再单独训练每个隐层得到权值,最后获胜的神经元输出活性,这个方法在处理二值数字图像时比拟可行,但没有在大数据库中得到验证。第三种方法综合前两种方法的优势,即采用McCulloch-Pitts神经元代替复杂的基于神经认知机的神经元。在该方法中,网络的隐层和神经认知机一样,是一层一
层训练的,但是回避了耗时的误差反向传播算法。这种神经网络被称为改良的神经认知机。随后神经认知机和改良的神经认知机作为卷积神经网络的例子,广泛用于各种识别任务中,比方大数据库的人脸识别和数字识别。下面详细介绍卷积神经网络的原理、网络构造及训练算法。
2 卷积神经网络
网络构造
卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。网络中包含一些简单元和复杂元,分别记为S-元和C-元。S-元聚合在一起组成S-面,S-面聚合在一起组成S-层,用Us表示。C-元、C-面和C-层(Us)之间存在类似的关系。网络的任一中间级由S-层与C-层串接而成,而输入级只含一层,它直接承受二维视觉模式,样本特征提取步骤已嵌入到卷积神经网络模型的互联构造中。一般地,Us为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;Uc是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。特征映射构造采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。卷积神经网络中的每一个特征提取层(S-层)都紧跟着一个用来求局部平均与二次提取的计算层(C-层),这种特有的两次特征提取构造使网络在识别时对输入样本有较高的畸变容忍能力【10】。
网络中神经元的输出连接值符合"最大值检出假说〞【15】,即在*一小区域内存在的一个神经元集合中,只有输出最大的神经元才强化输出连接值。所以假设神经元近旁存在有输出比其更强的神经元时,其输出连接值将不被强化。根据上述假说,就限定了只有一个神经元会发生强化。卷积神经网络的种元就是*S-面上最大输出的S-元,它不仅可以使其自身强化,而且还控制了邻近元的强化结果。因而,所有的S-元渐渐提取了几乎所有位置上一样的特征。在卷积神经网络早期研究中占主导的无监视学习中,训练一种模式时需花费相当长的时间去自动搜索一层上所有元中具有最大输出的种元,而现在的有监视学习方式中,训练模式同它们的种元皆由教师设定。
图1是文献[12]中卷积神经网络的典型构造图。将原始图像直接输入到输入层(Uc1),原始图像的大小决定了输入向量的尺寸,神经元提取图像的局部特征,因此每个神经元都与前一层的局部感受野相连。文中使用了4层网络构造,隐层由S-层和C-层组成。每层均包含多个平面,输入层直接映射到Us2层包含的多个平面上。每层中各平面的神经元提取图像