1 / 12
文档名称:

基于迁移卷积神经网络的人脸表情识别.docx

格式:docx   大小:34KB   页数:12页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于迁移卷积神经网络的人脸表情识别.docx

上传人:科技星球 2022/7/29 文件大小:34 KB

下载得到文件列表

基于迁移卷积神经网络的人脸表情识别.docx

文档介绍

文档介绍:基于迁移卷积神经网络的人脸表情识别
 
 
刘伦豪杰 王晨辉 卢慧 王家豪
Summary:人脸表情识别在计算机视觉领域引起广泛关注,为了解决实际应用中出现的小数据集和硬件限制问题,引入迁移学****方法,将Image-Net上训ned in this paper adds
the convolutional layer and the pooling layer to the expression feature extraction and redundant information screening after the migration learning network. The experimental results show that the recognition rate is increased to %.
Key words: Expression recognition; Convolutional neural network; Migration learning; CK+; FER2013
人臉表情识别是人机交互与情感计算研究中的重要组成部分。随着人工智能的发展和机器人制造体系的成熟,人机交互领域显现出巨大的市场和应用前景。
最早的人脸表情识别研究方法主要基于几何特征,对人的眼睛、眉毛、嘴等位置变化特征进行表情识别。Lanitis[1]提取14个脸部特征点,建立可变形模型,通过特征点的位置和形状对人脸表情进行识别,达到74%的识别率。随着小波理论在图像识别逐渐成熟,日本九州大学[2]利用Gabor小波对面部表情信息进行压缩编码。美国CMU[3]采用隐马尔可夫模型(HMM)对人脸表情的细微变化分析,运用了特征点跟踪、流跟踪和边缘检测实现了面部表情信息的自动识别。以上传统的表情识别方法都需要人为设定特征,提取特征的信息量相当局限,准确率难以达到应用要求。
随着高性能服务器的发展,以卷积神经网络为代表的深度学****算法广泛应用到了计算机视觉、自动驾驶等领域中,取得了很好的效果。基于卷积神经网络的表情识别方法[4]通过数据驱动,构建卷积层从表情数据库中学****提取抽象的特征信息,最后使用全连接层分类。然而,深度卷积网络依赖于数据驱动,很多数据集中的静态面部表情图片太少,在无法得到上百万大规模数据集时,直接训练效果不够理想,容易产生过拟合,识别的泛化效果很差。基于此,提出了
基于迁移卷积神经网络的人脸表情识别方法,将在Iamge-net大数据集上训练好的inception_v3图像分类网络迁移到人脸表情识别网络中,并在网络中加入了一层卷积层和池化层,再对人脸表情数据库的图片进行学****取得了很好的效果。
1 卷积神经网络
卷积神经网络(CNN)是一种特殊的前馈神经网络,因主要功能单元卷积层实现特征提取而与普通全连接神经网络区分开来。神经元之间的连接模拟了动物的视皮层,在计算机视觉领域表现良好。CNN主要由卷积层、池化层和全连接层组成。

卷积层和传统的全连接层不同,该层包含一组滤波器,又称为卷积核。卷积核的大小一般为3x3或者5x5,这些卷积核在表示输入图像的三维矩阵上面滑动应用卷积,计算出卷积核和输入矩阵之间的点积,并生成二维激活映射,使得网络学****到因为侦测到输入位置空间上特定种类的特征而激活的卷积核。卷积核将通过上述滑动操作对整个图像进行扫描实现对图像信息的遍历,利用共享权值实现对图像特征的提取,不同的卷积核分别提取图像的不同特征。
卷积层试图将神经网络的每一小块进行深入的分析而得到抽象程度更高的特征,一般来说,经过卷积处理过的节点矩阵会变得更深,从图片中学****到的特征信息也更加丰富抽象。

池化层也称下采样层,是对上一层提取的特征进行降维处理,可以在保留最重要特征的同时削减卷积输出,避免全连接层出现过拟合现象。池化中最经典的操作包括最大池和平均池化,本文采用最大池化,保留窗口中的最大值。最常见的池化大小是2x2,步幅为2,能够从输入映射中去除75%的激活,见图1。
全连接层
经过多轮卷积层和池化层处理后,图像中的信息已经被高度抽象为信息含量更高的特征,对于这些特征,利用全连接层完成分类任务。全连接层也称多层感知机,它的每一个神经节点都与前一层和后一层的所有节点相互连接,在不断的学****中,优化损失,反馈调节权重。
2 迁移学****br/>深度卷积神经网络CNN在每年一度的ImageNet图像识别大赛上大放光彩,其他传统机器学****方法逐渐被边缘化。但是该比赛和众多神经网络项目都是基于互联网产生,样本数量庞大,足以支撑深度学****的训练。对于数据集较少的应用领域如人脸表情识别,数据集中包含的标注样本即使通过图像增强与补偿技术也十分有限,构建大规模人脸