未来智讯 > 人脸语音识别论文 > 人脸识别技能原理解析

人脸识别技能原理解析

发布时间:2018-12-01 01:06:04 文章来源:未来智讯    
    人脸识别技能原理解析作者: 本刊编辑部   人脸识别,是视觉模式识别的一个细分问题,也大概是最难解决的一个问题。 其实我们人每时每刻都在进行视觉模式识别,我们通过眼睛获得视觉信息,这些信息经过大脑的处理被识别为故意义的观念。于是我们知道了放在我们面前的是水杯、书本,还是什么别的东西。
  我们也无时无刻不在进行人脸识别,我们每天生活中遇到无数的人,从中认出那些熟人,和他们打招呼,打交道,忽略其他的陌生人。甚至躲开那些我们欠了钱还临时还不上的人。但是这项看似大略的任务,对机器来说却并不那么容易实现。
  对计算机来讲,一幅图像信息,无论是静态的图片,还是动态视频中的一帧,都是一个由众多像素点组成的矩阵。比如一个1080p的数字图像,是一个由1980×1080个像素点组成矩阵,每个像素点,如果是8bit的rgb格式,则是3个取值在0-255的数。机器需要在这些数据中,找出某一局部数据代表了何种观念:哪一局部数据是水杯,哪一局部是书本,哪一局部是人脸,这是视觉模式识别中的粗分类问题。
  而人脸识别,需要在所有机器认为是人脸的那局部数据中,区分这个人脸属于谁,这是个细分类问题。
  人脸能够分为几多类呢?这取决于所处理问题的人脸库大小,人脸库中有几多指标人脸,就需要机器进行相应数量的细分类。如果想要机器认出每个他看到的人,则这世界上有几多人,人脸就能够分为几多类,而这些类别之间的区别是相当细微的。由此可见人脸识别问题的难度。
  更不要提,这件事还要受到光照、角度、人脸部的装潢物等各种因素的影响。这也不难解释为什么人脸识别技能目前还没有大量应用在日常生活中,大局部人只可在科幻电影中接触人脸识别了。
  一些不太被人熟悉的事物,经常会伴随着大量的观念混淆。比如对西方宗教不太明白的国人,可能搞不清楚为什么有些人信上帝但不信耶稣;都是在教堂事务的大叔,为什么有些要禁欲,有些却能结婚。而人脸识别作为一个新事物,也伴随着大量的观念混淆,而分清这些观念,对于理解人脸识别还是对照重要的。
  完成人脸识别的事务,要经过几个步骤。最初计算机需要在图像或视频中找到人脸的位置,这局部事务一般叫做人脸检测。如前所述,这是一种粗分类,具体到人脸检测中,实际上是二分类,计算机只需要判断指标图像是或者不是人脸。但由于并不能事先确定人脸的大小和位置,计算机需要以每个可能的人脸大小对全图进行扫描,逐个判断子窗口所截取的图像是否为人脸。而每次扫描过程,子窗口移动的步长可能是几个像素。
  所以你能够大致想象一下,做一张图的人脸检测,计算机需要做几多次二分类判断。
转载请注明来源。原文地址:https://www.7428.cn/page/2018/1201/49638/
 与本篇相关的热门内容: