文档介绍:基于改进卷积神经网络的手势识别
该论文来源于网络,本站转载的论文均是优质论文,供学习和研究使用,文中立场与本网站无关,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们删除已转载的信息,如果需要分享,请保留本段说明。
摘 要:为了解决传统卷积神经网络(CNN)由于手势背景复杂和手势姿态多样性而导致准确率不高的问题,提出一种改进卷积神经网络方法对手势进行分类识别。首先对手势图像做基于肤色阈值的手势分割处理,然后用Dropout优化后的卷积神经网络对手势图像特征进行提取和分类识别。在不同环境下对手势识别并与传统方法进行对比实验。实验表明,%,%,证明改进CNN识别准确率较传統CNN有一定提高。
关键词:改进卷积神经网络;手势识别;准确率;图像处理;过拟合;Dropout
中图分类号:TP39 文献标识码:A 文章编号:2095-1302(2020)07-00-02
0 引 言
随着人工智能技术的飞速发展,其在人机交互[1]领域的应用也越来越广泛,手势识别[2]正是其中之一。实现手势识别的核心是对手势特征的提取[3]。传统的识别算法中多是由人工设计提取特征,然后再用分类器分类识别,例如HMM-SVM[4],Kinect特征匹配法[5]等。这项工作繁琐、费时,而且还会因为提取特征误差导致识别率降低。近年来,深度学习在识别领域有很大进展,谢峥桂[6]在对手势识别的研究中首先对手势图像进行手势分割预处理,然后再用传统CNN进行特征提取和识别。张起浩等[7]在做手势识别研究中利用Leap Motion结合CNN进行识别,首先利用Leap Motion获取手势图像并进行灰度处理,然后用CNN算法对图像进行特征提取及分类。然而考虑到手势的复杂性、多样性特点,传统卷积神经网络已不能满足对其鲁棒性的识别[8]。随着卷积神经网络的深入学习,很容易出现过拟合问题,大大降低了识别准确率。为此,本文提出的方法是在识别之前对手势图像进行手势分割处理,并在传统卷进神经网络中加入Dropout层。通过增加网络连接的随机性和稀疏性来提高泛化能力,解决因为过拟合而造成的识别率低的问题。
1 手势图像数据集制作及预处理
本文手势数据集的制作利用python中的OpenCV调用摄像头采集录制不同手势,然后将不同手势定义相应的标签生成主文件。为满足手势训练集的降噪要求,在采集过程中对手势图像做基于肤色阈值的二值化预处理。处理过程主要分为如下三步:
(1)选用YCrCb作为手部肤色的颜色空间;
(2)在空间下建立手部肤色的高斯模型;
(3)对模型做二值化处理,二值化处理过程图像如图1所示。
2 卷积神经网络及改进
传统卷积神经网络
卷积神经网络结构雏形于1998年由Yann Lecun提出[9]。与人工神经网络不同,这是一种深度神经网络。它拥有很多网络层数,主要分为卷积层、池化层和全连接层。卷积层中前一层输入更高层次特征到下一层并形成特征图,池化层可以对特征图进行降维以减少不必要的数据。全连接层总结归纳池化层输入的特征信息,通过分