未来智讯 > 人脸语音识别论文 > 人脸识别研讨综述

人脸识别研讨综述

发布时间:2018-12-02 01:06:04 文章来源:未来智讯    
    人脸识别研讨综述作者:未知   摘要:该文对人脸识别的主要方法进行了系统的介绍,阐述了人脸识别研讨的发展历史中技能和方法的演变以及国内外的研讨现状,并对人脸识别研讨可能的发展趋势作了展望。
  关键词:人脸识别;特征提取;模式识别;综述
  中图分类号:TP18文献标识码:A文章编号:1009-3044(2011)24-5992-03
  The Review of Face Recognition
  LI Miao-zai, GU Hai-hong
  (Hebi Occupation Technology College, Electronic Information Engineering, Hebi 458030, China)
  Abstract:This paper analyzes the main methods of automatic face recognition and elaborates the evolution history and the current situation of the relevant research. Several promising directions for future research are also proposed in this paper.
  Key words: face recognition; feature extraction; pattern recognition; review
  人脸识别技能的研讨涉及图像处理、模式识别、机器视觉、人工智能、认知科学、生理学、心理学等多个学科,人类视觉识别系统的特性对机器人脸识别有一定的借鉴意义,心理学和神经生理学的研讨无疑对机器人脸识别具有启发性[1-2]。但除少数文献外,目前大多数的机器人脸识别研讨独立于生理学和心理学之外。本文将对人脸识别方法及其研讨状况进行综述。
  1 人脸识别研讨的发展状况
  1.1 发展历史
  早在1888年和1920年Galton就在《Nature》上发表过两篇关于利用人脸进行身份识别的论文。真正意义上的自动人脸识别的研讨起初于二十世纪六十年代中后期,1965年Chen和Bledsoe的汇报是最早的关于自动人脸识别的文献。
  1965到1990年之间是人脸识别研讨的初级阶段,这一阶段的研讨主要集中在基于几何结构特征的人脸识别方法(Geometric feature based)。该阶段的研讨基本没有得到实际的应用。
  1991年到1997年间是人脸识别研讨相当活跃的重要时期。出现了著名的特征脸方法(Eigenface),该方法由麻省理工学院的Turk和Pentland提出,之后有许多基于该方法的研讨。Brunelli和Poggio在1992年对基于结构特征的方法和基于模板匹配的方法进行了实验对比,并给出了后者优于前者的明确结论。该时期内,美国国防部资助的FERET(FacE Recognition technology Test)项目资助多项人脸识别研讨,创建了著名的FERET人脸图像数据库。该项目极大地促进了人脸识别算法的改进以及算法的实用化。
  1998年至今,研讨者起初针对非理想条件下的人脸识别进行研讨。光照、姿势等问题成为研讨热点。出现了基于3D模型的人脸建模与识别方法。在商业化的应用方面,美国国防部在2000年和2002年组织了针对人脸识别商业系统的评测FRVT(Face Recognition Vendor Test),对照领先的系统提供商有Cognitec, Identix和Eyematic。
  1.2 主要公共数据库
  人脸数据库对于人脸识别算法的研讨是不可缺少的,而公共人脸图像数据库的建立方便不同研讨者之间的交流学习,并有助于不同算法的对照,下面列举常用的人脸图像数据库。
  FERET人脸数据库:是FERET项目创建的人脸数据库,该库包含14,051幅多姿态、不同光照条件的灰度人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。
  ORL人脸数据库:包含40人共400张面部图像,局部图像包括了姿态、表情和面部饰物的变化。该人脸库在人脸识别研讨的早期经常被人们选取,由于变化模式较少,多数系统的识别率均能够达到90%以上。
  AR人脸库:包括116人不同光照、表情、遮挡和老化的人脸图像共3288幅。
  MIT人脸数据库:由麻省理工大学媒体实验室创建,包含16位志愿者的2,592张不同姿态、光照和大小的面部图像。
  Yale人脸数据库:由耶鲁大学计算视觉与抑制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
  PIE人脸数据库:由美国卡耐基梅隆大学创建,包含68个人的41,368张多姿态、光照和表情的面部图像。
  CAS-PEAL人脸数据库:该人脸库包含了1,040名中国人共99,450幅头肩部图像,涵盖姿态、表情、饰物和光照四种主要变化条件,局部人脸图像具有背景、距离和时间跨度的变化。
  BANCA人脸库:BANCA项目资助创建,包含208人的多模态生物特征,覆盖了不同图像质量、不同时间段等变化条件。
  1.3 研讨现状
  人脸识别是当前图像工程领域的四大研讨热点之一,世界上很多国家的高校都有专门的人脸识别研讨小组,对照著名的有:麻省理工学院,卡耐基梅隆大学,耶鲁大学,密歇根州立大学,加州大学洛杉矶分校(UCLA),曼彻斯特大学,南加州大学,萨里大学等。国际会议IEEE International Conference on Automatic Face and GestureRecognition和International Conference on Audio and Video-based Biometric Person Authentication是针对人脸识别及其他生物特征识别技能方面的会议。模式识别,机器视觉,图像处理等领域中最权威的国际会议,如IEEE CVPR,IEEE ICCV,IEEE ICIP,IEEE ICASSP,ECCV,ICPR每一届都对人脸识别领域的研讨给予关注。
  国内的许多研讨机构在自然科学基金、863打算等资助下从事人脸识别领域的研讨事务并取得了一定的成果。国内主要的研讨机构和研讨人员包括:清华大学计算机系人机交互与媒体集成研讨所的徐光佑教授、艾海舟教授;清华大学自动化系的边肇祺教授、张长水教授;中科院计算所的高文教授、陈熙霖教授;中科院自动化所模式识别国家重点实验室的谭铁牛教授;北方交通大学的袁保宗教授;南京航空航天大学的陈松灿教授;南京理工大学的杨静宇教授;上海交通大学的施鹏飞教授;中科院自动化所(原微软亚洲研讨院)的李子青教授领导的研讨组等。此外,国内还有许多大学和研讨机构在积极的从事人脸识别领域的研讨,这些研讨者在人脸识别领域积累了宝贵经验,近年来在国际知名期刊上发表了大量该领域的相关论文。
  2 人脸识别的主要方法
  一个自动人脸识别系统包括人脸检测以及人脸特征提取与识别两个关键环节。人脸检测指对输入的图像判断是否存在人脸,确定人脸的位置,分割出人脸。从原始图像分割出的人脸图像维数相当高,若直接用于数据处理,则运算难度大甚至对于已有计算机硬件是不可行的;而且原始的图像数据往往不能表现人脸的性子,不利于识别。因此,为了避免维数灾难(Dimensionality Curse)[3]并提高识别正确率,可以从高维原始数据中提取出用于分类识别的有用信息的特征提取技能是解决人脸识别问题的关键所在。人脸特征提取技能总的来说能够分为基于代数特征的方法和基于几何特征的方法两大类。
  2.1 基于代数特征的方法
  基于代数特征的方法是将人脸图像用特征向量表示,整幅图像看做一个矩阵,通过矩阵变换和线性投影来提取人脸特征并进行分类和识别。对照经典并被广泛使用的基于代数特征的方法有:主成分分析,Fisher线性辨别分析,独立成分分析以及基于核的方法。
  主成分分析:PCA(Principal Component Analysis),又称KL变换。该方法用KL展开式提取样本的主要特征。PCA的基本思维是利用一组包含离散度最大的特征来表示原始样本,它选取训练样本协方差矩阵的特征向量作为展开基,那些与较大的非零特征值相对应的特征向量被称为主分量,样本在这些主分量上的投影系数被称为为主分量特征,而原始样本可表示为这些主分量与投影系数乘积的代数和。Turk和Pentland将PCA用于人脸图像特征提取,提出了著名的特征脸(Eigenface)方法。
  Fisher线性辨别分析:Fisher在1936发表的经典论文选择使Fisher规则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。在Fisher思维的基础上,Wilks和Duda分辨提出了辨别矢量集的观念,即寻找一组辨别矢量构成子空间,以原始样本在该子空间内的投影矢量作为辨别特征用于识别。该方法被称为经典的Fisher线性辨别分析方法。
  独立成分分析:ICA(Independent Component Analysis),最早提出ICA观念的是Jutten和Herault[4],ICA是从线性混合的信号中恢复出独立源信号的算法。该方法假如数据由若干独立源信号混合而成,基于信号高阶统计特性的分析方法,分解出相互独立的分量,在抽取人脸图像特征与人脸识别上取得了较好的效果。ICA假如各成分是统计独立的之外,还必须假如独立成分是非高斯分布的。该方法是在PCA方法基础上发展起来的,其中统计独立条件要比主分量分析中统计不相关条件更为严格。
  基于核的方法:上面介绍的三类方法都属于线性特征提取方法,这些线性方法性子上都是基于线性变换,常常无法表达数据的非线性分布结构。核方法的基本思维是通过适当的非线性映射(通过定义适当的内积函数实现)将非线性可分的原始样本变换到某一线性可分的高维特征空间,由于新空间中的线性方向对应于原特征空间的非线性方向,所以基于核的辨别分析得出的辨别方向也对应原特征空间的非线性方向。这种方法的独特和关键之处在于它巧妙地借助于“核函数”进行样本之间的运算,随后对生成的核样本向量进行相应的线性运算求取辨别矢量集,而不需要求出原始特征空间样本非线性映射后的形式,使得它优于普通的非线性辨别分析方法[5]。
  2.2 基于几何特征的方法
  基于几何特征的方法提取人脸的眼睛、鼻子、嘴巴、下巴等部位和这些部位的结构关系的几何描述作为识别人脸的特征。即识别所选取的特征是反映人脸器官形状和几何关系的特征向量,其分量包括人脸上指定两点间的欧氏距离、角度、曲率等,识别过程即特征向量的匹配过程。最早的基于几何特征的人脸识别方法是针对人脸的侧面轮廓的[6]。其后的研讨将更多更广泛的人脸特征用于特征的提取,如眉毛厚度及眉毛与眼睛中心的垂直距离、眉毛形状的描述参数、鼻子的垂直位置和宽度等[7];更复杂的人脸模板,包含了头发线条和面颊。人脸的几何特征受光照条件、姿态变化等拍摄条件的影响较小,相对对照稳定,但不易抽取而且测量精度不高,影响了识别的正确率。
  3 人脸识别技能的应用范围及优缺点
  人脸识别用来辨别人的身份,能够广泛地应用于公共平安、企业办公、教育、人机交互等领域。和其他生物特征识别技能一样具有特征唯一性的特点,这是作为身份识别技能的前提。相比其他生物特征识别技能,人脸识别技能又具有其独特的优势。
  友好:特征的采集方式是非接触式的,不具有侵犯性,容易被人接受;
  隐蔽:能够在被采集特征的人不知道的情况下进行,用于平安监控、罪犯追捕等与其他生物特征识别技能相比更具可行性;
  成本低:一般的用于图像采集的摄像设备价格对照低廉,而数码相机在普通人中日益普及也使人脸识别的相关应用具有更大的发挥空间。
  但是,作为识别特征,人脸自身的特点也使人脸识别技能面临诸多困难,总的来说体如今以下两个方面:
  人脸特征稳定性差:最初,人脸会随着人的年龄变化而变化;其次人脸在人的不同表情之下会有很大差别;另外,人脸在化妆的情况下或佩戴眼镜等饰物的情况下也会对识别带来困难。
  人脸图像的采集受外界影响大:不同光照、角度、距离之下采集到的人脸图像会极大地影响识别本能。
  4 归纳
  目前,最好的人脸识别系统在环境理想、用户配合的情况下已经可以达到95%以上的识别率。人脸识别系统的应用离我们的生活也不再遥远。上海世博会期间,人脸识别系统应用于世博园的各个出入口和公交站点,对进出园区的50万持证事务人员和1亿人次游客进行人脸验证。然而人脸识别技能仍然不能算做一个相当成熟的识别技能,不过在限定范围内有了一定的应用。因为现实中很多应用局面需要在更大规模的人脸库、用户不配合(视角、表情、眼镜等遮盖物品的问题)、不可抑制的非理想拍摄条件(光照、背景的问题)下使用,现有的系统在这些情况下往往识别率会降落得很快。大规模、用户不配合和非理想拍摄条件下的人脸识别方法也是目前人脸识别领域的主要开放问题。研讨可以解决这些问题的核心算法、提出有效改进识别本能的解决方案是人脸识别领域的重点研讨内容。
  参考文献:
  [1] Zhao W, Chellappa R, Rosenfeld A,et al. Face Recognition: A Literature Survey. CS-Tech Report[D].University of Maryland,2000.
  [2] Chellappa R, Wilson C L, Sirohey S, Human and Machine Recognition of faces: A survey[J].Proceedings of the IEEE, 1995,83(5).
  [3] Jain A K, Duin R P, Mao J. Statistical Pattern Recognition:A Review, IEEE TPAMI,2000,22(1):4-37.
  [4] Jutten C, Herault J. Independent component analysis versus PCA[J].Proceeding of European Signal Processing Conf,1988:643-646.
  [5] Scholkopf B, Mika S, Burges C J C, et al. Input space VS. feature space in kemel-based methods[J].IEEE trans. on Neural Networks, 1999,10(5):1000-1017.
  [6] 高秀梅,杨静宇,金忠,等.基于核的Foley-Sammon辨别分析与人脸识别[J].计算机辅助设计与图形学学报, 2004,16(7):962-967.
  [7] 高秀梅,杨静宇,杨健, 一种最优的核Fisher辨别分析与人脸识别[J].系统仿真学报,2004,16(12):2864-2868.

转载请注明来源。原文地址:https://www.7428.cn/page/2018/1202/50102/
 与本篇相关的热门内容: