文档介绍:1 基于投影峰的眼睛快速定位方法戴景文刘丹苏剑波 1 .引言人脸识别巨大的应用前景吸引了很多研究人员开展了大量的研究,取得了较大的进展,已逐渐出现了一些商业化的人脸识别系统。一个实用的人脸识别系统通常包括以下三个步骤(见图 1): 图1 人脸识别系统的三个步骤 Fig1. Three steps of typical face recognition system 很多研究人员在做识别实验时都假定面部关键特征点是已经给定的,或者在条件允许的情况下要求用户进行一定程度的交互(如手动标定眼睛的位置)。目前的主流人脸识别算法,都要依赖于面部特征(比如眼睛位置)的严格配准来归一化人脸以便提取人脸描述特征,从而进行比对识别。因此人脸特征的误配准, 对识别率有很大的影响。文[1] 指出, 目前比较流行的人脸识别算法―― Fisherface 的识别率会随着误配准的增大而急剧下降,即使在只有一个像素平移偏差的情况下,识别性能也下降了 10 个百分点;同时,眼睛的定位也是其他特征点(如鼻子,嘴巴等)定位的基础,因此精确而快速的眼睛定位是实用人脸识别系统的关键环节之一。眼睛等面部关键特征点的定位方法主要包括[2] :模板匹配、灰度积分投影法、 Snake 方法、可变形模板法、 Hough 变换、弹性图匹配、区域增长搜索方法、主动形状模型( ASM )、主动外观模型( AAM )和 Adaboost [3] 等, 其中灰度积分投影是脸部特征领域的一类经典算法,它利用脸部特征灰度值较皮肤低的特点,先统计出 X或Y方向上灰度值的和或者灰度函数值的和,找出特定的变化点,然后根据先验知识将不同方向上的变化点位置相结合, 即得到脸部特征的位置, Kanade 等首先将这一方法应用于人脸识别[4] 。文[5] 提出了 Generalized Projection Function ,文[6] 根据人脸图像的面部比例特征, 提出了一种基于候选窗口的灰度积分投影的方法来定位眼睛。灰度积分投影法计算量较低,但在大的姿态变化,光照变化或人脸有配饰(如眼镜)时容易失效。本文在灰度积分投影的基础上, 提出了一种基于投影峰的眼睛定位算法,在人脸姿态和光照变化及佩戴眼镜的情况下,可以准确快速地实现眼睛定位。 2 .算法描述本文提出的算法是基于二值化后的人脸图像的,因此需要首先把窗口内的眼区图像截取出来,然后对眼区图像通过阈值分割实现二值化。本节将对算法的各个步骤分别进行描述: 、候选窗口的选取人脸检测的方法有很多,如 AdaBoost [3] 等。在得到人脸的大致的位置后, 可将人脸图截取出来(如图 2(a)所示),然后在截取出来的图像上定位眼睛的位置(如图 2(b)所示)。 2 (a) (b) 图2 (a) AdaBoost 人脸检测(b) 截取的人脸图像 Fig 2. (a) Face detection with Adaboost (b) Segmented face image 人脸的五官位置具有一定的统计规律,如双眼一定位于人脸的上半部分,眉毛一定位于眼睛上面,双眼一定对称分布于正面人脸的中轴线两侧等等。这些先验知识可以帮助缩小眼睛的搜索区域范围,这样不但可以去除一些干扰,而且还可以提高搜索速度。确定的眼睛区域需要对人脸的姿态发生偏转或旋转变化时有一定的鲁棒性,图 3 显示了眼睛