未来智讯 > 人脸语音识别论文 > 人脸识别方法研究

人脸识别方法研究

发布时间:2017-12-07 09:09:00 文章来源:未来智讯    
    【关键词】人脸识别 特征提取 核方法 模型 视频信息 三维数据
    一、引言
    社会的快速发展以及科学技术的飞速进步,使得人们对于安全性的问题越来越重视,尤其是身份验证功能的需求,因而生物识别技术作为一项具有挑战性的问题获得了较多的关注并有了极大的发展。其中人脸在区分人与人之间的差别起着重要的作用,与其他生物特征(如掌纹、虹膜和指纹等)相比,其优势在于交互性强、采集方便、无需接触设备等,从而适合于刑侦破案、各种证件验证、安检和考勤等领域的应用。通常一个完整的人脸识别系统可由以下几个模块构成:人脸图像采集、图像预处理、人脸定位检测、人脸特征获取、人脸分类识别。其处理数据的过程如图1所示[1]。在本文里,主要研究有关特征提取模块和分类识别模块的方法。
    人脸识别是个越来越具有挑战性的问题。迄今为止在所有的情况下和不同应用中,没有一种方法是非常鲁棒的。通常地,人脸识别系统所使用的训练数据都是个人的正面图像,在识别时,其精度要比其他角度准的多。当系统利用正面图像训练出的数据去识别一幅旋转的人脸图像时就会出现问题。而且,如果照明条件和面部表情发生变化,人脸的显示也将彻底的改变。因此,当前大多数的人脸识别方法主要是针对这三大挑战----光照、表情和姿势的变化。在人脸识别系统中这三个中的任何一个问题的存在都会导致性能的严重下降。这三者可以彻底改变一个物体的外观,因而加大了识别的难度。
    二、人脸识别方法
    人脸识别是模式识别领域里一个重要的应用方向,因此模式识别领域里所涉及方法的发展在人脸识别方向里有着极其重要的地位。在初级阶段里,线性方法是处理分类的有力工具。利用线性方法对一个样本抽取特征时,只需将该样本投影到训练阶段得到的一个确定的变换矩阵(一组变换向量)上即可。但线性方法有其自身的局限性,无法解决例如像异或这样简单的问题,而且它不能很好的描述例如人脸图像等数据的分布。为此,非线性方法的出现是势在必得的。在识别领域的应用里,神经网络研究的发展成就了非线性方法在该领域的地位,因为在现实世界里存在着大量的如人脸图像数据分布这样的非线性可分问题,所以利用非线性技术就可以将这些问题转化为线性可分问题,从而令这些问题的分类变得容易。
    在人脸识别研究里,影响人脸识别的因素可以划分为内因子(影响识别的本质性的因素)和外因子(影响识别的外部因素,包括表情、姿势、光照等)[2]。在对人脸图像进行归类的前期,研究者们主要是考虑解决内因子即理想状态下的方法。然而,在现实生活里,人脸的外因子对特征提取和识别这两个过程的影响来说是比较大的。为了解决这些问题,相继出现了不同类型的方法,如基于核技术、模型、视频信息和3D数据相关的方法,它们的引入使得人脸识别算法日益趋向成熟。
    (一)基于核方法的人脸识别
    20世纪90年代,核方法的兴起是模式识别的一场技术革命[3]。核方法继承了非线性方法优点,其优势在于能够将原始数据映射到高维空间里,并允许使用线性方法来分析和解决问题,同时也有效地避免了"维数灾难"。
    核方法有两个优势:一是它在线性与非线性间架起了一座桥梁,即通过核空间的线性模型来解决非线性问题;二是引入核函数后借助于核技巧,可以省去复杂的高维非线性映射。其中在使用核方法降低复杂度方面,因基于线性方法的使用不能很好地提取有效的非线性人脸特征,不能准确的描述人脸的非线性信息,文献[4]给出了一种基于核空间鉴别矢量集的人脸识别方法。 该方法算法简单,实现起来比较容易,其不仅减少了计算量,也能使数值的表现比较稳定。在识别人脸的过程中,当数据库添加新的样本时,系统能够更新NKDA鉴别矢量集。然而尽管核技术的使用可以挖掘图像中高阶的非线性特征,但是在人脸姿态方面,算法所能识别的旋转角度却是有限的。
    运用核方法在人脸识别上也可以解决外在因素给人脸带来的影响。文献[5]在核方法和正交基向量的引入后,使得新的UDP算法在人脸识别中,有了很好的改善,尤其是在光照、姿态和表情方面,对比原始的UDP算法有了较好的识别效果。在使用核方法的基础上,引进核正交基向量是为了能更好地提取人脸非线性结构特征,因为它可以更好地保留度量结构与非线性子流形空间这二者的相关信息,从而在能达到降维效果和保持拓扑结构的基础上提高识别率。然而该文献面临的问题是如何对核函数及其对应参数进行选择才能更好的提高系统对人脸的识别能力。同样,文献[6]里也因为核函数不能自适应的选取而制约了算法的有效性。
    尽管核方法的出现体现了其较普通非线性方法更优越一些,但在投入到实际应用中却也有其无法规避的弊端,基于核方法的特征提取效率会随着训练样本集的增大而下降,因为利用其进行特征提取时,需要计算这个样本与其他样本之间的核函数,无疑增加了算法的复杂度,但是想要提高核技术的性能又必须依靠大量数据训练,这就影响了核方法的实用性。
    (二)基于模型的人脸识别
    基于模型的方法一直是模式识别中比较受关注且比较有效的一种,尤其是对有规律可循的变化而言。而在人脸识别中较受欢迎的是基于概率模型的使用。表情和姿态的变化对识别结果的影响是很大的,为此文献[7]给出了基于SIFT特征的贝叶斯模型算法。作者在提取人脸特征时,采用了尺度不变的sift算子,并在人脸的每个子区域上进行相似性度量,且每个子区域都有自己的识别范围和概率权值,最后根据贝叶斯模型给出识别后的结果。针对原有的SIFT特征提取算法来说,该文献给出的算法在表情和姿态的影响方面表现的更为鲁棒。然而针对姿态和表情变化过大等极端情况时,该方法就显得不那么有效了。
         人脸特征提取在人脸识别中的地位是至关重要的,它的优劣直接决定结果分类,且很多时候提取出来的数据维数很高,这大大限制了分类时间,同时也限制了快速投入实际应用的脚步。文献[8]给出了一个基于AAM模型和RS―SVM的识别算法,主要解决了提取特征时出现高维数据带来的复杂运算(以识别率不受影响为前提)。同是针对姿态和光照变化,文献[9]利用隐马尔可夫模型在外界变化的条件下给每个人脸构建独立的模型,这样在初始条件下光照和人脸姿态的信息就被纳入进去,从而将在识别时需要补偿光照和校正姿态的过程转化到了数据训练过程里。在提取人脸特征时,作者提出可以使用小波变换,PCA,ICA等常用的方法来产生虚拟样本。该文献所提出的算法能够节省识别时间,但是却局限于其单样本的设置,因为在配准时,人工的干涉有较大程度的影响。此外隐马尔可夫模型所涉及到的参数较多,因此优化HMM也是提高识别效率必须要考虑的因素,这样才能更有效地投入到现实的使用。鉴于HMM的有效性,多数学者偏于在此基础上创造和延伸算法。在追求优越算法的同时,也有作者重视算法后处理的研究和分析。文献[10]中提到因为人脸的姿态和光照的改变使得人脸识别的难度加大,所以对其有效的评估以及利用对连续的视频序列和人脸库的分析可以解决“数据源灾难”带来的一些问题,从而使得识别算法更鲁棒。由于训练HMM需要花费时间,因此该文献作者为了提高算法效率,还给人脸图像划分了有效范围。
    在人脸特征提取中引入了模型的相关算法,使得人脸识别的效果有着明显的改善,因此基于模型的人脸识别算法在人脸识别领域里有着不可忽视的地位,但是基于模型的识别算法都不可避免地会遇到模型参数的设置和如何优化模型等相关问题,这些将直接影响识别的效率。
    (三)基于视频的人脸识别
    近些年,通过视频提供的人脸图像来进行人脸识别发展的比较活跃,因为视频所提供的数据能够包含时间和空间上这两个方面的信息,并且还会产生序列,这为结合概率等模型来解决识别问题提供了有力的帮助。在诸多基于视频解决人脸分类的参考文献中,有如下几种对人脸描述的方式[11],如图2-图6所示。
    [12]的算法特点是将HIS颜色空间的独特优势与快速离散Curvelet变换相结合,从而克服了直接使用快速离散Curvelet不能全部提取图像特征的弊端。作者在实验中与应用HMM来识别人脸的算法相对比(实验数据是较短的视频),结果表明效果要优于使用HMM算法,因为HMM需要大量训练才能得到好的结果。该文献算法的优势在于识别速度快,正确率高,但识别系统所能识别的图像是比较理想化的正面人脸图像。
    光照的影响对人脸识别来说始终是尚待良好解决的问题。文献[13]主要针对光照变化提出了新的方法。在算法过程中,采用直方图序列来重建人脸,而“积极地”利用降噪的方式来自适应不同角度的光照影响。在识别过程中所采用的分类方式是对编码后的直方图进行邻域归类,得到了较好的识别效果,然而作者却并没有将视频序列提供的上下文信息这一特殊的优势利用起来,此外,算法对图像分析的效率也较低。
    除了光照之外,表情,姿态也是研究者着力解决的问题。由于视频信息量比较丰富,即能提供时间上的同时也能提供空间上的信息,文献[14]的作者设计了一个识别模块和一个跟踪模块,并将二者结合在一起运用在人脸识别里,解决了出现侧脸的人脸图像,这在一定程度上克服了人脸姿态发生角度偏转的情况,但该系统不能同时识别多张人脸图像,这将成为该文献作者进一步研究的问题。
    (四)基于三维数据的人脸识别
    姿势和照明在所有识别困难中是最主要的因素,这降低了二维人脸识别率。为了克服这两个困难,一些研究者开始从三维的角度着手进行探索。使用3D数据最主要的优点是它的深度信息不是依靠姿势和照明,因此人脸的表示不会随着参数改变而改变,使得整个识别系统更加鲁棒。尽管如此,大多数3D人脸识别方法主要反馈回来的是他们需要系统中所有的元素需要很好的校正和同步,以此来获取精准的3D数据(纹理和深度图)。在基于3D数据人脸算法中多数是围绕空间几何特征展开的。
    因人脸结构是有规律可循的,文献[15]的作者在算法中利用到了五官之间的测地距离,统计人脸几何特征。在该文献的算法中,统计了局部特征(不依靠坐标)的同时又兼顾了整体轮廓,然后通过一种融合方式将局部信息和全局信息结合起来,从而为输入的人脸分类提供了可靠的依据。从文献的实验结果来看,效果比较鲁棒。
    表情变化对识别带来的影响,是研究者们乐此不疲的人脸识别题材。文献[16]是利用几何特征,先找到鼻尖的那个点,据此找到人脸的有效区域并把其校正到正面。文献的重要贡献之一是提出了一种面部刚性区域获取方法,能根据不同人脸的特点自适应地获取刚性区域,但在算法里与文献[15]采用不同的融合方式是前者分别将全局匹配和局部匹配的结果加权在一起,得到的结果与单一匹配的相比较,效果有较好改善。
    由于硬件和软件带来的双重挑战,使得三维识别率不够精准[17],因为这需要更好的传感器。为了能从软件上弥补这种损失,文献[17]结合了对应的2D和3D图像数据来联合进行匹配从而实现人脸识别。除此之外,文献[18]给出一种新的范例,即使用混合2D-3D人脸识别系统。在这个系统当中,3D数据被用在训练过程,而且输入进系统的数据不管是二维的还是三维的,都能够依靠这个系统中的方案来进行识别。此外这种识别方法还展现出在2D图像从有效数据中较好地恢复人脸信息的同时,3D训练过程保留了人脸所有空间信息。通过仿真结果显示,混合2D-3D人脸识别系统的识别率高于91%,且能对旋转范围在180度里的人脸图像进行分类。
    作为人脸外部特征的一个重要因素,眼镜的遮挡也为人脸识别增加了困难,使得人脸特征很不稳定。眼镜的遮挡会带来两种弊端,当镜片产生模糊和反光反应时会对人脸识别带来很大问题。文献[19]作者通过眼镜的细节对结果的影响分析发现眼镜框的色彩和外形是阻碍算法有效性的严重因素。作者通过这些纹理变化将眼镜纳为人脸的一部分,并为其进行了三维模式重建,使得该模型的参数变的容易操作,其中改善虚拟样本是提高此识别方法效率的关键。
         为了能更好的解决外部因素给人脸识别带来的影响,可以尝试着将基于视频、3D数据和模型的方法结合起来使用,以此来获取更好的识别效果,但这也意味着会面临高维数据和庞大计算量带来的困扰,与此同时对采集更精准的二维和三维人脸数据的硬件要求也会更高。
    三、常用人脸识别数据库介绍
    通过大量文献和网络资源总结了当前研究者们在人脸识别实验所常用的15个数据库,分别来自美国、英国、德国和韩国,具体如表1所示。
    四、总结
    随着社会的快速发展和科技日新月异的变化,我们越来越追求高效而安全的生活,因此人脸识别技术在身份验证里也逐渐扮演着越来越重要的角色。人脸识别实质上就是利用算法令计算机从图像或图像序列中检测出人脸,并判断其身份。在识别系统中,重点环节主要有两个,一个是特征提取过程,另一个是人脸识别过程,所以多数文献都是围绕这两个过程展开的。人脸识别的实际应用中,会涉及到许多外部因素(如光照、表情、姿态和眼镜的遮挡等)干扰,为了解决这些问题,研究者们提出了多种方法,包括核方法、模型、视频信息、三维相关数据和技术的引用。经过文献给出的实验表明,识别效果有了很大的改善,
    表1常用人脸数据库(见附表)
    然而若要有效地投入实际生活中,还有一些问题需要解决,如:(1)引入核方法后,算法中能否自适应选取核函数;(2)使用模型来训练数据时,如何选取参数以及如何优化模型来提高识别效率;(3)为了去除外部因子的影响,加强信息量,会逐步趋向于基于视频和三维的人脸表征方式,但如何才能解决由其带来的数据维数的增加和复杂度的提高;(4)如何能更有效地结合2D数据和3D数据来提高人脸识别效果。
    参考文献:
    [1]周丽芳,李伟生,黄颖.模式识别原理及工程应用[M].机械工业出版社,2013.
    [2]廖海斌,陈庆虎,鄢煜尘.基于因子分析的实用人脸识别研究[J].电子与信息学报,2011,33(7):1611-1617
    [3]徐勇,张大鹏,杨健.模式识别中的核方法及其应用.[M] 国防工业出版社,2010
    [4]陈达遥,陈秀宏,董昌剑.基于零空间核判别分析的人脸识别[J].计算机研究与发展,2013,50(0):1924-1932
    [5]王庆军,张汝波,潘海为.核正交UDP及其在人脸识别中的应用[J].计算机辅助设计与图形学学报,2010,22(10):1783-1787
    [6]高秀梅,杨静宇,金忠,陈才扣.基于核的Foley.Sammon鉴别分析与人脸识别[J]. 计算机辅助设计与图形学学报,2004,16(7):962-967
    [7]张龙媛,陈莹.贝叶斯模型下基于SIFT特征的人脸识别[J].计算机工程,2012,38(12):125-128
    [8]王李冬,王玉槐.基于AAM模型和RS―SVM的人脸识别研究[J]. 计算机工程与应用,45(22):140-143
    [9]胡峰松,张茂军,邹北骥,马俊容.基于HMM的单样本可变光照、姿态人脸识别[J].计算机学报,2009,32(7):1424-1431
    [10]代毅,肖国强,宋刚.隐马尔可夫后处理模型在视频人脸识别中的应用[J].计算机应用,2010,30(4):960-963
    [11]严严,章毓晋.基于视频的人脸识别研究进展[J].计算机学报,2009,32(5):878-885
    [12]郭建华,赵怀勋,陈晓楠.基于FDCT的视频人脸识别方法[J].计算机工程,2011,37(4):178-180
    [13]王华锋,王蕴红,马凯迪,张兆翔.视频中适应光照可变情况下的人脸识别方法[J].模式识别与人工智能,2011,24(6):856-861
    [14]童林.基于视频的人脸识别与跟踪算法研究[J].计算机与现代化,2013,210(2):1-4
    [15]邹红艳,达飞鹏,李晓莉.基于面部曲线特征融合的三维人脸识别[J].东南大学学报(自然科学版),2012,42(4):618-622
    [16]朱冰莲,王大为,李明均,朱海波,朱方方.针对表情变化的三维人脸识别系统[J]. 仪 器 仪 表 学 报,2014,35(2):299-304
    [17]Kevin W. Bowyer, Kyong Chang, Patrick Flynn.A survey of approaches and challenges in 3D and multi-modal 3D + 2D face recognition[J]. Computer Vision and Image Understanding,2006:1-15
    [18]Antonio Rama Calvo,Francesc Tarres Ruiz,Jurgen Rurainsky,Peter Eiser.2D-3D Mixed Face Recognition Schemes[M].2008:125-148
    [19]熊鹏飞,刘昌平,黄磊.基于三维建模的眼镜遮挡下的人脸识别[J].模式识别与人工智能,2011,24(5):692-699
转载请注明来源。原文地址:https://www.7428.cn/page/2017/1207/9241/
 与本篇相关的热门内容: