1导言

人脸的局部特征是人体特有的“身份证”,具有“与人密不可分”的特点。人脸识别技术是利用人脸的一些独特的生物特征来自动识别人的身份的生物识别技术。它具有直接隐蔽、友好、识别简单、安全性高、便于携带等特点,因此在公安、安防、金融、信息网络安全等诸多领域具有广阔的应用前景。

本文将人脸识别技术应用于考勤管理,设计并实现了动态人脸识别考勤系统(以下简称人脸考勤系统),克服了磁卡、ic卡等传统考勤方式的缺点和缺陷,有效消除了考勤管理中的人为因素,充分体现了考勤管理的公平和高效。与指纹考勤系统相比,人脸考勤系统具有非侵犯性、使用友好等优点,采集到的正面人脸图像可以应用到员工的其他管理信息系统中。

2人脸考勤系统概述人脸考勤系统是将先进的人脸识别技术应用于考勤领域的成功产品。产品首先输入员工的书面资料,动态采集人脸图像并进行训练,建立人脸图像数据库。考勤时,与电脑相连的摄像头动态捕捉员工的面部照片,同时将捕捉到的面部照片与预先采集的照片进行对比。如果是员工本人,考勤成功。同时,考勤状态(正常、迟到、早退或加班等。)根据考勤时间进行判断,记录考勤信息,如考勤日期、班次、工作时间等。如果不是员工考勤,系统会友好提示,并进行相应处理。主机程序对所有考勤数据进行处理汇总后,生成相应的管理报表或数据文本,提供给人事部门进行人事考核或财务部门进行薪资结算。

2.1人脸考勤系统人脸识别考勤系统由硬件和软件组成。硬件由考勤机、统计主机和打印机组成。考勤机由主机、摄像头和文章采集卡组成,用于人脸考勤识别和图像建库。统计主机用于考勤统计、查询、管理、保存系统数据等。打印机用于打印考勤报告。软件由Windows2000高级服务器操作系统、SQL Serv2er2000数据库管理系统和人脸考勤系统组成。

2.2人脸考勤系统的功能结构人脸识别考勤系统由人脸识别子系统和考勤管理子系统组成,其功能结构图如图1所示。

人脸识别子系统包括文章采集模块、人脸检测模块、人脸处理模块和人脸识别模块。文章采集模块实时从考勤场景中采集用户的人脸文章图像;人脸检测模块定时采样文章中的一帧图像,利用人脸的特征信息精确定位图像中的人脸坐标和人脸范围;人脸处理模块截取人脸区域图像,经过大小归一化、亮度均衡和图像增强后,分离背景,得到只包含人脸的图像。人脸识别模块采用多种识别技术得到分类结果,并进行决策级融合得到最终结果。考勤管理子系统包括信息登记、信息查询和报表打印模块。管理员在信息登记界面输入员工信息,现场采集员工多张照片样本;在信息管理界面,可以查询员工信息和考勤信息;并且可以随时打印出员工在一定时间段内的考勤报表。

3.人脸考勤系统的实现。1文章采集技术

利用VFW(Video for Windows)技术采集人脸文章图像。VFM库函数是微软公司提供的用于在Windows平台下开发文章应用的软件工具包。它提供了一系列应用编程接口(API),用户可以通过这些接口方便地实现文章拍摄、文章编辑和文章播放等功能。VFM的文章捕获功能主要包括捕获文章流、捕获文章流到缓存、捕获文章流到AVI文件、本地浏览和捕获单帧预览。VFW主要由六个模块组成,其中AVICAP模块主要实现处理文章捕捉的功能,为AVI文件输入输出和视音频设备驱动提供编程接口。MSVIDEO模块主要实现文章采集窗口与驱动设备的连接,支持ICM文章编码服务。AVICAP实现实时文章捕捉的一般过程:

(1)创建文章捕获窗口;

(2)注册系统回调函数;

(3)获取文章采集窗口的默认设置;

(4)设置捕获窗口的相关参数;

(5)与文章采集设备连接;

(6)设置捕获窗口的显示方式;

(7)将文章捕获到缓存或文件中,并对其进行相应的处理;

(8)终止文章采集,断开文章采集设备。

3.2人脸检测技术人脸检测是指判断输入图像中是否存在人脸,如果存在,确定所有人脸的位置、大小和姿态的过程。为了提高人脸检测的速度,本文采用Ad2aBoost算法进行人脸检测。AdaBoost算法由Freund和Schapire于1996年首次提出。目前,Ad2aBoost广泛应用于人脸检测、数据挖掘、机器学习等领域。

AdaBoost算法是一种迭代方法,从大量弱分类器中选择最有意义的组合组成强分类器,以提高检测精度。Viola等人提出了积分图像的概念和基于AdaBoost方法训练人脸检测分类器的方法,如图2所示。该方法利用图像的矩形特征作为分类的基础。为了有效排除大量非人脸窗口,整个分类器由多级子分类器组成。每一级分类器对应一个Harr特征。待检测的输入窗口将被逐步验证。如果其中一个分类器验证为非人脸,则立即排除,不会进入下一个分类器进行验证。Viola等人提出的AdaBoost方法不仅检测效果好,而且检测速度达到15fps。该方法易于实现,已在实际系统开发中得到广泛应用。限于篇幅,具体算法见文献。最终的强分类器CFINAL (x)是

公式中Ci (x)为弱分类器,ai=log (1/i),具体是指当提取的分类器对部分样本分类正确时,这些样本的权重降低(i变小);当分类错误时,增加样本的权重(i变大)。这样后期训练提取的简单分类器会加强对这些分类错误样本的训练。

3.3动态人脸采集和人脸库构建系统采集每个人10张不同的正面人脸图像,保存在训练数据库中。图3是动态收集某个人的10张照片的图例。在采集同一张人脸的10个样本的过程中,如果后面采集的人脸与前面采集的人脸相似度很高,则认为本次采集的人脸已经存在于训练库中,不保存结果,继续采集,直到采集到相似度高的图像,再保存在训练库中。相似度的计算如公式(2)所示,其中f i和f j分别表示第I个和第j个面,其中f i=(ui1,ui2,uip).最后,在训练库中,同一个人的不同样本属于同一类,不同考勤人员的样本属于不同类。

3.4降维与特征提取人脸图像是高维数据,在高维空间不紧凑,计算复杂度高。所以需要对高维的人脸数据进行降维。常见的降维方法有主成分分析(PCA)、独立成分分析(ICA)、线性判别分析(LDA/FDA)、非负矩阵因子(NMF)、多维尺度分析(MDS)、核主成分分析(KPCA)、核Fisher判别分析(KFDA)、流形学习(ML)等。考虑到本系统的人脸图像基本上是上班时的正面人脸,采用PCA方法对人脸图像进行降维,提取特征,最终识别人脸。Kirby和Sirovich [6]首先将PCA引入人脸识别;Turk和Pentland [7]进一步发展了用于正面人脸识别的特征脸方法,并取得了巨大的成功。PCA是一种基于DKL T(离散K-L变换)的人脸识别方法。DKL T变换是一种用于图像压缩的最优正交变换,其生成矩阵一般是训练样本的整体离散矩阵。对高维图像空间进行DKL T变换,得到一组新的正交基,保留重要的正交基,可以形成一个低维的线性空间。PCA是一种简单、快速、实用的基于代数特征的多元分析技术,保留了面部各部位之间的拓扑关系和器官部位的信息,目前应用广泛。

PCA的目的是通过线性变换找到一组最优的单位正交矢量基(即主分量),用它们的线性组合重构原始样本,使重构样本与原始样本之间的均方误差(MSE)最小。假设有n个样本x k (k=1,2,

n),所有样本的平均值为E( x),则x的协方差矩阵

使u1,u2,un和1,2,n分别是S的特征向量和特征值,1 2 n .然后协方差矩阵s被分解成:

其中u=[u1,u2,un ],=diag(1,2,n)选取最优的m(m“n”)个非零特征值作为主分量,最小化均方误差(MSE)。设wopt=[u1,u2,um],原空间的样本可以用低维主分子空间上的投影系数来描述:

3.5相似性匹配和阈值确定人脸图像特征提取后,进行相似性度量。常见的相似性度量方法包括基于距离的方法、基于概率的方法和基于熵函数的方法。在基于距离的方法中,有欧几里德距离、曼哈顿距离、汉明距离、切比雪夫和S阶闵可夫斯基。在基于几何特征的识别方法中,通常用特征向量之间的距离函数来度量。根据本系统获得的特征向量信息,采用欧氏距离法计算待识别人脸与训练样本之间的距离。根据相似度计算的结果,如果相似度大于给定的阈值,则系统判定现场采集的人脸与事先采集的人脸图像为同一人,并在数据库中记录出勤日期、工作时间等信息。考勤时确定人脸相似度阈值的依据来自人脸采集时的样本相似度值,以克服人为因素设置阈值的随意性,保证阈值的合理性。

4实验结果及分析动态人脸考勤系统采集了天思智能系统研究所50名博士生和硕士生的10幅图像进行识别实验。结果表明,该系统一次性识别率为96%,主要是因为:(1)人脸训练库相对较小,人员固定;(2)要求出勤时脸部正面或近似正面对准摄像头;(3)一般情况下,用户在考勤时的姿势和表情都是正常的,没有大的变化、复杂的背景和夸张的妆容,所以识别率很高。

5结论设计并实现了一个基于Adaboost和主成分分析的动态人脸识别考勤系统。AdaBoost算法选择多个弱分类器组成一个强分类器,提高人脸检测速度;PCA算法实现从高维特征空间到低维特征空间的降维压缩,在低维空间提取高维人脸图像的特征描述,实现人脸识别,最终实现考勤管理。系统运行结果表明,该动态人脸识别考勤系统具有动态人脸识别、识别率高、实用性好、可靠性强的特点。下一步工作是进一步优化人脸特征选择和提取算法,提高识别速度和系统性能。