未来智讯 > 人脸语音识别论文 > 人脸识别方法在实际运用中的分析

人脸识别方法在实际运用中的分析

发布时间:2017-12-07 09:10:00 文章来源:未来智讯    
    【关键词】人脸识别 安全 系统构架
    1 背景分析
    随着计算机技术的发展,以及国家及公共安全方面需求的不断提高,传统的安全技术呈现出不少可以改进提高的地方。人脸识别方法成为解决目前社会安全问题的较好办法。人脸识别方式是基于生物特征认证的一种方式。生物特征认证又名生物特征识别,是指通过计算机利用人体固有的生理特征或行为特征鉴别个人身份的认证方法。生物特征认证与传统的密码、证件等认证方式相比,具有依附于人体、不易伪造、不易模仿等优势,己经成为发达国家普遍重视并大力发展的关键技术和产业。常用的生物特征包括脸像、虹膜、指纹、声音、笔迹等。
    人脸特征具有以下优势:
    1.可以在多种环境模式下采集特征数据,尤其适用于监控人脸图像的多种采集模式,这一点特别适用于解决重要的安全问题、罪犯监控与网上抓逃等应用,这是指纹、虹膜、视网膜等其他人体生物特征识别技术不能比拟的。
    2.非接触式采集方式,容易让人们接受
    不像指纹和虹膜的采集过程,人脸数据采集不要求用户接触,避免了用户的抵触情绪,比较符合一般用户的习惯,容易被大多数的用户接受。
    3.图像与声音采集设备成本低
    目前,中低档的USB、CCD/CMOS摄像头价格已经非常低廉,基本成为标准的外设,极大地扩展了人脸识别技术的实用空间;另外,数码相机、数码摄像机和照片扫描仪等摄像采集设备在普通家庭的日益普及进一步增加了其可用性。
    因而人脸识别作为一种典型生物特征识别技术,以其自然性、高可接受性等优点受到了人们的青睐。
    2 人脸识别系统实际应用不足和解决方法
    目前,国内外在人脸识别和认证方面已做了大量的研究工作,取得了一定的研究成果。但是当传统人脸识别方法和技术应用于实际情况下时,性能却并不理想。其主要原因是因为,在实际应用中,光照条件、人脸旋转角度、表情、发型和背景等因素的变化造成了训练和识别数据间的失配,从而极大程度地影响了识别算法的性能。除此之外人脸图像局部扭曲(partial distortion)和闭塞(occlusion)也造成了传统人脸识别系统性能的下降,这些人脸图像的局部扭曲或闭塞往往是由墨镜、围巾等装饰物所引起,而这些装饰物的存在又是不可避免的,特别是在反恐应用中,大多恐怖分子都会带一些伪装物掩饰自己。大量文献指出当人脸局部图像扭曲/闭塞区域达到30×30 像素时,基于PCA算法的识别系统的识别率只能达到40%左右。作为一种最广泛和最自然的生物特征识别技术,人脸识别认证将被广泛应用于复杂环境条件下的身份认证、网络安全防范、网上银行、网上贸易、电子商务的安全交易、多媒体信息获取等领域,其要求识别系统具有在各种环境条件复杂变换和人脸图像局部扭曲情况下仍然具有稳定的识别性能, 因此,如何解决复杂光线,人脸角度变换情况下和人脸图像存在局部扭曲情况下的鲁棒人脸识别问题已经成为当今人脸识别软件的一发展趋势。
    目前在人脸识别中需要运用某些方法来解决以上这些问题。针对光线变化问题,目前主要有三类方法。
    第一类方法通过采用对光线变化不敏感的人脸特征进行识别,即基于部分人脸特征,如只利用双眼、鼻子和嘴来进行识别。已经证明,这些部分特征对光线变化并不敏感,因此采用人脸局部特征可以提高复杂光线变化下的人脸识别率。但是如何准确定位人脸局部特征目前还是一个尚未解决和完善的问题,同时仅通过某些人为确定的局部特征来进行识别,也丧失了一些人脸图像的本身显著特征。
    第二类方法大多通过构建图像的灰度柱状图,或构建人脸3D照明模型,或通过其他途径获得光线的先验信息,然后对图像进行亮度补偿。但是在光线变化较强的情况下,很难通过灰度柱状图对人脸图像进行补偿,并且光线补偿同时也会对有些局部显著特征起到一定的削弱作用,就如同在语音识别中引入语音失真一样,不仅不能很好的补偿亮度,还会影响识别系统的识别率。而在训练图像不足的情况下、很难准确的构建人脸3D模型,同时目前构建人脸3D模型的技术还尚有很多未解决问题,因而通过构建3D模型进行光线补偿有一定的局限性。
    第三类方法主要采用红外图像,或其他方式图像与人脸灰度图像相结合的方式来进行识别。由于这些图像并不受光线变化的影响,因而可以有效的从另一个角度解决光线变换对人脸识别的影响。但是这类方法同样会受到人体温度变化的影响,因而虽然解决了光线变化对人脸识别带来的影响,但其效果本身并不是很理想。
    类似于解决光线变化的方法,目前大多解决人脸旋转的方法也主要采用“估计和补偿”的思路。其首先通过构建人脸三维模型或通过定位人眼,来估计人脸旋转角度,再根据估计到的旋转角度对人脸进行补偿。
    针对人脸图像局部扭曲或闭塞问题,目前的大多解决方法都是基于局部匹配方法。其首先提取人脸局部特征,然后对每个局部特征进行局部匹配,再通过一选举空间分配给各个局部匹配以不同的权重,从而形成最终的识别结果。目前有多种人脸局部特征,如binary pattern features,Eigen features,subpattern PCA,和 local Gabor binary pattern histogram sequence features等。但是由于该选举空间是预先定义的,因此该类方法并不能很好的适应于与训练条件不同的识别条件下。Martinez提出了一种基于高斯混合模型和的方式取代了选举空间来对局部匹配结果进行联合。但是该方法同时也抑制了干净人脸图像产生高识别率这以特点。最近Jongsun等人提出了一种locally salient ICA的方法,其通过提取局部人脸图像的显著特征来进行识别,取得了较好的效果。总的来说,目前还没有一种方法可以很好的解决人脸图像局部扭曲、闭塞问题,对人脸图像局部扭曲、闭塞情况下的人脸识别研究还处于起步阶段,如何有效的解决该问题仍然是一研究热点。
         3 人脸识别系统在实际运用中的模式分析
    根据以上的情况分析,结合软件工程的一些基本建模要求,我初步规划出基于软件工程框架下的人脸识别模块的基本构架。
    系统用例图如下图所示:
    根据以上用例图,系统总体模块应分为:
    整个系统由七大模块组成,分别是:人脸检测定位模块、图像去噪增强模块、人眼定位和图像校正模块、识别模块、模型训练模块、结果分析处理模块和系统管理模块。其中人脸检测定位模块、图像去噪增强模块、人眼定位和图像校正模块构成了整个图像预处理部分。识别模块、模型训练模块和结果分析处理模块共同构成了识别部分。管理模块完成整个认证系统的管理工作。管理工作包括认证系统数据管理和人脸训练图像生成两个功能。其中认证系统数据管理模块主要功能有:认证系统的训练和识别参数管理、识别人信息管理。因此本系统实现的话可以划分为三个包,结构如下:
    根据主要模块划分,本系统所设计的流程如下图所示。
    整个系统共由2个子流程组成:分别是人脸检测至识别的主流程和训练模型生成流程。
    1.主流程
    主流程过程如下:获得人脸视频流,将视频帧传递给人脸定位处理模块→人脸定位模块对人脸进行定位,并将定位后判断为可保留的人脸帧图像传递给人眼定位模块→人眼定位模块对人眼进行定位,并根据人眼位置对定位后的人脸图像进行校正,得到左右眼位置固定的人脸图像并发送给识别模块→识别模块根据已经构建的人脸模型库对待识别图像进行识别并将识别结果发送给识别结果分析模块→识别结果分析模块对识别结果进行判断并对正确的识别信息进行身份显示。
    2.训练流程
    该流程首先对输入的训练图像进行自动人脸定位,并手动定位人眼对,然后根据定位的人眼对对图像进行规整,并存储为该人的训练图像。系统根据生成的训练图像集进行每个人的人脸模型的训练和模型保存。
    4 图像预处理包
    图像预处理包主要完成人脸的粗略定位和精确定位,人眼定位和根据人脸定位结果对人脸图像进行校正处理。图像预处理模块类图设计如下:
    人脸定位类包括粗略人脸定位和精确人脸定位两个步骤。
    4.1 粗略人脸定位
    当获得输入的彩色视频图像信息后,首先获得视频序列中的图像帧,然后通过帧差处理获得运动区域。帧差运算计算出2帧图像中每一个点的灰度差值,然后通过设定的阈值来判定哪些像素点是运动点。由于运动区域内像素的灰度变化要大于整个图像灰度变化的平均值,则选取帧差图像的均值aver作为阈值。如果一个点的帧差值大于该阈值则该点被标记为运动点。为了防止帧差算法的不精确性,系统将比该运动区域大的图像作为输出。
    在运动区域内,系统通过人脸肤色检测,来进一步精化和缩小人脸区域,并将人脸区域输出给图像接收判决模块。
    图像接收判决模块对获得的粗略人脸图像区域进行判别,当该区域过小,小于一定像素值,或光线过亮时,则抛弃该帧图像。算法中我们规定运动区域应该大约应该大于100x100像素,如果获得运动图像小于该面积,则判定该运动图像是不合格的人脸区域图像,抛弃该帧图像。如果图像大于1/2视频图像同样认为是不合格图像被丢弃。
    4.2 精确人脸定位
    精确人脸定位采用改进的adaboost算法对人脸区域中不同角度的人脸图像进行定位,并对定位后的图像进行修正,根据定位的模型角度将旋转角度较大的人脸图像进行了修正,将所有定位后的人脸图像都转换到相同的角度。然后系统对定位后的人脸图像进行取舍处理,将定位后人脸大小大于50x50像素的人脸图像保留。
    4.3 图像光线处理
    在人脸定位后将人脸图像传入图像光线处理类对图像进行去噪和光线归一化处理,完成对定位后的人脸图像中的高频噪声的去除和对图像进行光线归一化,将所获得的图像的光线条件归一化为统一的光线条件。本系统采用了直方图均衡方法来实现了光线归一化处理。
    4.4 人眼定位类
    人脸定位类同样分为初略人脸定位、精确人脸定位和人脸校正三大功能部分。
    4.4.1初略人眼定位模块
    该模块首先将定位好的人脸图像转换为灰度图像,并根据经验值和复杂度算法初略估计人眼区域位置。
    4.4.2精确人眼匹配模块
    该模块采用GMM模型对人眼和非人眼进行建模和匹配。两类模型均采用EM算法进行训练。检测时匹配算法采用单层瀑布模型进行匹配,匹配采用不同大小的模板进行匹配,模板大小为基本大小,0.8倍基本大小和1.2倍基本大小,匹配时根据先验条件初步确定了带匹配的范围,进一步提高匹配速度,匹配范围为左右1/6到离中轴的1/11。3类大小模板匹配的结果与预设定的门限值进行比较,并选取大于门限值且同时人眼识别结果大于非人眼识别结果的匹配结果为候选人眼。
    然后将匹配的候选人眼按中轴分为两类,然后将左边每个点与右边每个点进行比较,并丢去左右相差大于10度的点。最后采用K-mean算法进行聚类最后得到两类聚类结果作为最后的人眼对中心位置。
    4.4.3人脸规整
    根据定位的人眼对,计算人眼与水平轴的夹角角度,然后根据此角度对人脸图像进行旋转,从而解决几何旋转对人脸识别的影响。最后,本类对旋转后的人脸图像进行精确人脸区域切割和规整。具体过程为,根据旋转后的水平人眼对位置,切割人脸上下比例为3:7,左右为左20像素,右20像素, 最后将切割后的人脸图像归一化为100x100大小。
    4.4.4训练识别包
    训练识别部分由人脸特征提取、训练和识别三个子部分组成。特征提取模块完成对输入人脸图像进行特征提取。训练过程主要完成训练人脸图像的模型和存储模型操作。识别模块完成人脸识别与验证过程。训练与识别包类图细化为:
    识别训练包由6个类组成,分别是特征提取类、Gabor类、识别算法类、人脸识别类、模型训练类和模型类。其中Gabor类主要负责Gabor滤波器的计算,其被特征提取类调用来完成Gabor人脸特征的提取过程。人脸特征提取类首先对输入的人脸图像进一步进行处理,然后提取处理后人脸图像的Gabor 人脸特征。人脸识别类负责进行人脸识别、认证与结果分析处理,其依赖于识别算法类进行人脸识别,识别算法类实现各种人脸识别算法和分析函数。模型训练类负责管理人员模型的训练,其使用模型类对模型进行保存。模型类负责模型的保存和读取以及模型格式的定义。
    综上所述,人脸识别方法作为一个逐步发展完善的技术,正在从简单的对比方式走向智能判别。在结合目前高清摄像技术将大大提高识别的准确率。在对人脸识别方法的逐步分析当中,我深刻的感到了其应用的巨大前景和广泛的市场。通过对识别系统进行软件模块的分析,逐步探索了该技术的一些实现理论。对于我这样从事智能化建设工作者来说是一个大胆有益的尝试。相信在今后的工作中,我会更加努力的去探索新技术和新科技,使人们的生活更加美好!
    参考文献
    [1] 林�.鲁棒性多生物特征身份识别中若干关键问题的研究[C].电子科技大学,2009:15-48.
    [2] 赵晓晴.不同光照条件下的人脸识别算法研究[C].北京工业大学,2006:20-35.
    [3] 孙志远.基于非线性模式识别方法的人脸识别技术研究与应用[C].江南大学,30-52.
    [4] 王永辉.基于Gabor小波变换与支持向量机的人脸识别研究[C].大连理工大学,21-28.
    [5] 李文革.基于主成分分析的人脸识别[C].山东大学,34-54.
    [6] 蒋昌俊.Petri网的行为理论及其应用[J].高等教育出版社,2003(1).
    作者单位
    上海延华智能科技(集团)股份有限公司 200060
转载请注明来源。原文地址:https://www.7428.cn/page/2017/1207/9187/
 与本篇相关的热门内容: