人脸识别技术综述

(整期优先)网络出版时间:2019-12-04
/ 2

人脸识别技术综述

黄祉衡 霍胜铭

电子科技大学

摘 要:常见的人脸检测的4个方法:参考模板法、人脸规则法、样品学习法、肤色模型法,神经网络具有强大的自学习能力,使得样品学习法被广泛采用。按照时间顺序,将人脸识别算法进行了分类:几何特征方法、PCA算法、LBP算法、深度学习算法,比较了几个算法之间的优劣势,并给出了算法适用的场景,其中CNN算法具有强大的自学能力和运算能力,确保算法实时有效。

关键词:人脸检测、人脸识别

引言

现如今技术发展日新月异,人脸识别技术则是其中较为重要的一种。该类技术伊始于上世纪六十年代,在当时由于诸多技术、设备的限制,并未投入大规模的使用,更多是在理论层次上进行探究。二十一世纪以降,随着人脸识别算法的进一步改进和硬件设备的进一步提高,人脸识别技术重新进入了大众的视野之中。尤其是在深度学习算法被应用于人脸识别技术之后,人脸识别的准确性大大提高。不久前苹果公司所推出的iPhone x及其之后的系列手机采用了人脸识别技术解锁手机的方式,标志着该技术在实现更广泛的应用上成为一种可能。

人脸识别系统

总的来说,人脸识别系统分为最初的人脸检测、随后的人脸图像预处理、然后特征提取以及最后的匹配识别这4个具体操作步骤。其中第2步人脸图像预处理和第4步的匹配识别流程较为固定,所以人脸检测技术和人脸特征提取显得尤为重要。人脸检测技术主要负责在图像中将所有人脸检测定位出来,进行模式化的预处理,并将该数据传输至下一步的特征提取。人脸识别则负责将检测出的人脸进行特征提取之后,再与已有的人脸库进行匹配,看是否能够成功识别该个体。现人脸检测技术臻于完善,众多学者的工作重点主要放在了人脸识别的算法革新上。

人脸检测采用的方法分类

参考模板法

首先设计一个或多个的标准人脸,建立模型,与待识别图像进行匹配,若其中有一部分处在已设定的范围内,即可被视为人脸。

人脸规则法

根据众多人脸提取出共有的脸部结构,再将这一结构用于具体的人脸检测,若图像中存在既定区域处于既定的范围内,即可被视为人脸。

样品学习法

采用新型的人工神经网络技术,对大量广泛的人脸图像和非人脸图像进行学习,并进行分类,之后将该神经网络应用于具体的人脸检测中。

肤色模型法[1]

肤色是人类个体与生俱来的重要信息,且具有较高的稳定性,即肤色不会随着人脸面部装扮、表情的变化而发生变化;同时肤色大多情况下能够和周围环境色彩相区别。由此对于肤色的检测是人脸检测中不可或缺的一部分。

人脸识别采用的算法分类

原始的几何特征方法

该方法诞生于上世纪五十年代,采用了提取人脸抽象特征的技术(对人的五官等特征进行抽象提取),该方法的运算量较小,适用于静态的、光照充足下的人脸识别;缺点是整体的识别结果差强人意:因光照条件、个体姿势等影响,该算法识别的结果往往是不同人的同一姿态的匹配度较之同一人的不同姿态的匹配度更高。

早期的PCA算法

为了解决基于几何特征的人脸识别准确率较低的问题,特征脸[2]方法应时而生,是20世纪90年代左右Turk和Pentland用于人脸分类的算法,简单有效易操作, 也被称为基于主成分分析(principal component analysis,简称PCA)的人脸识别方法。该方法采用先降低原始高维向量之维度,后大致还原该向量的技术,有效的规避了一些不甚重要的边角数据,大大降低了运算量。

随后的LBP算法

随着时代的发展,人们对于识别准确率有了更高的要求。局部特征分析方法较之诸多PCA算法有着更为广阔的前景。LBP(Local Binary Pattern,局部二值模式)[3]则是其中一种用来描述图像局部纹理特征的算子,具有旋转不变性和灰度不变性等显著优点,由T. Ojala, M.Pietikäinen, 和 D. Harwood 于1994年提出,最初被应用于一般图像的纹理描述中。随后由于其计算量较小、纹理特征分类能力较强等优点而被应用于人脸识别的技术中。

近来的深度学习算法

3.4.1 DBN算法

DBN[4]是Hinton于2006年提出的一种概率生成模型,其基本模型是受限玻尔兹曼机(RBM, restricted boltzman machines)。

DBN是典型的深度学习网络。它的原型类似于人类大脑的组织结构。它具有从简单到复杂,从低到高提取输入数据的特点,并能够汇总数据。

在DBN算法的辅助下,计算机能大大降低对手动选择的依赖性,并且可以自动学习输入数据的抽象结构。该功能无疑可以节省大量的人力,而且经常发现手动选择所疏忽的有用信息。

3.4.2 CNN算法

卷积神经网络(Convolutional Neural Networks, CNN)[5]是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一。卷积神经网络的初始构造较为困难,包括输入层、隐含层。其中隐含层又包括卷积层、池化层、链接层。前期需要人脸图像预处理工作,之后的人脸检测涉及回归方程,人脸归一涉及矩阵运算,运算量较大。

采用了CNN的人脸识别技术可以广泛在实时系统中得到使用,因其强大的运算能力和自学习能力可以很快得出识别结果。

人脸识别特点

非强制性

使用者无需采用专门的人脸采集设备,个体往往意识不到自己的人脸信息已被相关设备采集。

非接触性

在人脸识别的过程中,个体并不需要和摄像头有着肢体上的直接接触。

并发性

并发行是人为强制添加的特性,因为在实际使用的过程中,使用者往往需要对同一时间同一视野范围内的多个个体进行识别,因此需要具有并发行。

视觉特性

顾名思义,人脸识别凭借每个个体的容貌来识别该对象。与此同时,人脸识别技术往往伴有操作简单易上手、结果直观易懂、较为隐蔽的特点。

人脸识别难点

人脸识别技术本质上是三维立体模型与二维投影图像的匹配问题,其难度在于如下三点: (1)人脸变形(如表情会随时间、地点发生改变)的不确定性;(2)相同的个体的面部的多样性:如打扮,戴眼镜等;(3)图像获取过程中的影响因素:光线的方向、光照的强度、摄像头是否被遮蔽等因素。既然人脸识别作为一种确定个人身份信息的技术手段,其准确性和不变性必须得到保证。而在实际应用的过程中,解决以上三点问题绝非易事,需要在这些外在变化中,捕获并提取其中不变的因素,同时该技术还应具有实时性等特点。

人脸识别系统的应用

当下人脸识别技术被投入了较为广泛的应用,在各个领域都能见到该技术的身影。

在学习工作中,与人们息息相关的应用有公司的签到打卡和大学课堂的点到系统。诸多公司采用了人脸识别技术来检测诸多员工是否按时上岗。在这一过程中,摄像头通过非接触个体的方式,实时地采集每个员工的面部信息。较之以往的机械的签到方式,人脸识别技术不仅节省了员工的时间,同时还准确的检测了员工的在职状态。在大学课堂中人脸识别的技术也投入初步使用,以保障学生们上课的出勤率。

在日常生活中,由于人脸识别已被苹果公司旗下的诸多产品所采用,对人们日常生活方式的影响无疑广阔而深远。以支付方式为例,以前的手机支付方式大多采用指纹解锁的方法,需要用户在特定的按键上按下自身的手指。现如今只需在支付时将自己的脸部对准手机,即可迅速的完成支付。同时由于该技术采用深度学习的算法,所以用户无论随着岁月发生容貌的变化,亦或是一定程度上的梳妆打扮,皆能被手机较为准确地识别,给他们日常生活带来了极大的方便。

在安全领域中,人脸识别被应用于远程登陆,刷脸门禁等需要严格身份确认的系统中。甚至一些监控系统也采用了人脸识别的技术,能够及时准确地发现可疑人员。

可以想见,随着技术的进一步革新和发展,人脸识别技术在更多的领域大有作为。

总结

本文简略介绍了人脸识别系统的4个具体步骤,陈述了其中两个重要步骤人脸检测和人脸识别的方法运用,同时罗列了该技术的特点以及实现该技术的难点。由此值得期待的是随着深度学习算法和人工智能等相关新型技术的发展,必能使得人脸识别技术的应用“更上一层楼”。

参考文献:

[1]艾海舟,徐光祐,张钹.人脸检测研究综述[J].计算机学报,2002(5),25(5)

[2]Matthew Turk,Alex Pentland.Cognitive Neurosci[J],1994,3(1):71~86.

[3]赵玉丹.基于LBP的图像纹理特征的提取及应用[D].西安:西安邮电大学,2015(3):5

[4]梁淑芬,刘银华,李立琛.基于LBP和深度学习的非限制条件下人脸识别算法[J].通信学报,2014(6),35(6)

[5]徐杰,孙超,郭春赫.实时系统下LBP与CNN结合的人脸识别方法[J].黑龙江科技大学学报[J],2018(11),28(6)

作者简介:黄祉衡(1998-),男,四川成都人,电子科技大学本科生,主要研究方向为软件工程嵌入式方向。霍胜铭(1998-),男,重庆市人,电子科技大学本科生,主要研究方向为软件工程嵌入式方向。