文档名称：

深度学习PPT.ppt

格式：ppt 大小：726KB 页数：14页

下载后只包含 1 个 PPT 格式的文档，没有任何的图纸或源代码，查看文件列表

如果您已付费下载过本站文档，您可以点这里二次下载

预览

下载此文档

深度学习PPT.ppt

上传人:1485173816 2021/11/24 文件大小：726 KB

下载得到文件列表

深度学习PPT.ppt

相关文档

文档介绍

文档介绍：深度学****PPT
深度学****DL）
深度学****DL）
60、70年代，神经网络（NNs）最早可以追溯的时期，构建出连续非线性层的神经元模型；
随后，建立带有梯度下降的BP模型，1981年首次NN得到应用；
80年代末，基于BP训练的深度神经网络（Deep NNs）依然很难实现，90年代开始成为研究主体；
1991，通过无导学****的深度学****Deep Learning，DL）在实际中可以运用；
 2009，有导师学****的DL在大部分国际模式识别竞赛中领先于其他机器学****方法，并且第一个实现超人视觉模式识别，从此赢得广泛关注。
文献参考：Deep learning in neural networks: An overview
深度学****DL）
BP 神经网络（BPNNs）网络存在的主要问题：
1. 一般要得到较好的训练效果，隐层数目不能太少，当图片大的时候，需要的权值会非常多；
2. 对平移、尺度变化敏感（比如数字偏左上角，右下角时即识别失败）；
3. 图片在相邻区域是相关的，而这种网络只是一股脑把所有像素扔进去，没有考虑图片相关性。
深度学****DL）
最早的DL：前馈神经网络 feedforward (acyclic) NNs (FNNs) 和周期神经网络 recurrent (cyclic) NNs (RNNs) ；
目前应用较普遍的是深度置信网络(deep belief network ,DBN)和卷积神经网络（CNN），DBN网络可以看作是由多个受限玻尔兹曼机叠加而成，CNN通过local receptive fields（感受野），shared weights（共享权值），subsampling（下采样）概念来解决BP网络的三个问题。
手写字体识别
由手写字体组成图像样本
经典数据库：mnist，共60000训练样本，10000个预测样本；
训练样本维度：28*28*60000
训练标签维度：10*60000
图例：
CNN经典程序下载
语音识别
参考：《基于深度学****的语音识别应用研究_张建华》
该文献通过深度神经网络提取语音特征的方法、深度神经网络提取声韵母属性的方法、深度学****搭建声学模型的方法对比；
一般的语音识别多提取每帧长25ms、帧移10ms的语音对应的MFCC特征,该文提取使用fBank特征。
CNN
CNN结构图：
CNN
在Toolbox的实现中，C1共有6个卷积核，则卷积结果6个特征map;卷积层的一个map与上层的所有map都关联，如上图的S2和C3，即C3共有6*12个卷积核，
C1有156个可训练参数（每个滤波器5*5=25个 unit 参数和一个 bias 参数，一共6个滤波器，共(5*5+1)*6=156个参数）。
最后一层将4*4的map平铺成一条特征数组，用于训练。
输入图像：28*28
卷积层：均为5*5
采样核大小：均为2*2。