编者按:本文来自微信公众号“机器之能”(ID:almosthuman2017),作者:徐丹,36氪经授权发布。
从国内疫情爆发算起,小半年时间过去了,但你的手机还是不能认出戴口罩的你。
手机的口罩人脸识别技术迟迟未能落地和手机的隐私及安全性能有关。
以苹果手机为例,Apple 的 Face ID 是最先进的 3D 面部识别系统,它通过在用户的脸上投影 30,000 多个不可见点来感知用户的面部特征。还使用其先进的反欺骗神经网络和机器学习来防止使用照片或遮罩或任何其他技术来解锁 iPhone。
不过这个手机端的难题首先在安防场景中得到了广泛解决——口罩人脸识别已经逐渐常态化,一种主流的方法就是「注意力机制人脸识别算法」,在人脸遮挡环境下,可通过识别眼部关键点作为一种「注意力模型」,快速扫描全局图像,获得需要重点关注的目标区域眼部,并形成注意力焦点。
疫情之后,全球手机用户都普遍存在的痛点——戴口罩时 Face ID 太难解锁。连华为手机产品线副总裁也谈道,Mate 20 Pro 曾尝试戴口罩进行人脸识别,但遗憾的是最终没能实现这一功能。
五一期间,苹果方面悄悄推出了 IOS 13.5 的最新测试版,试图在该版本中解决「口罩脸」识别难的问题,但很遗憾,这并不是终极解决方案。
此前,如果用户戴口罩使用 Face ID,苹果锁定指示灯会抖动,并且手机会震动,表明有问题。脸部 ID 超时后,系统会提示用户向上滑动以进入可输入密码的屏幕。
由于苹果并不支持指纹解锁,所以戴口罩开机流程非常繁琐,用户体验差。
iOS 13.5 测试版跳过了一步。更新过后,系统会自动识别出戴口罩人脸,无需等待识别失败步骤,直接跳入输入密码步骤。
目前,苹果尚未透露 iOS 13.5 何时定稿并向公众发布。
随着疫情防控的常态化,如何识别戴口罩人脸已经成了一个共性的问题,苹果率先在智能手机上做到了「识别人脸是否戴口罩」,在「用戴口罩的人脸开机」上还有很长的路要走。
不过在更广泛的安防领域,真正的口罩人脸识别已经逐渐常态化。
智能手机迟迟无法实现口罩识别,最重要的问题是隐私和安全性。
目前智能手机上的 3D 人脸识别功能主要有两大流派,其一就是苹果主导的结构光(Structured Light)技术,其二则是目前 Android 旗舰常用的 TOF(Time Of Flight,飞行时间)。
前者通过在用户脸上投影不可见点来感知用户的面部特征,后者通过记录雷达光源到达脸部时间来感知。
戴口罩会遮住大量面部特征,出于安全性和隐私的考虑,在面部无法完全裸露的情况下手机基本都无法识别人脸,毕竟手机面部识别涉及到支付等问题。
苹果的「戴口罩人脸识别」也只是可以「识别出人脸戴着口罩」,然后自动跳转至密码解锁阶段,而非直接用戴着口罩的人脸解锁。
1 月份,国内开始大范围推广口罩佩戴要求时,华为手机产品线副总裁李小龙曾在微博上回应过戴口罩无法识别人脸的问题。
李小龙谈道,此前在发布华为 Mate 20 Pro 时也曾尝试戴口罩进行人脸识别,但遗憾的是最终没能实现这一功能,因为戴口罩后,人们几乎大半张脸都被遮盖住,而露在外面的眼睛和头部部分特征点太少,没能展现出人们的面部特色,无法保证安全性,所以最终化为才舍弃了「戴口罩/围巾」场景的面部识别解锁技术。
苹果手机更是如此,Apple 的 Face ID 是最先进的 3D 面部识别系统,它通过在用户的脸上投影 30,000 多个不可见点来感知用户的面部特征。还使用其先进的反欺骗神经网络和机器学习来防止使用照片或遮罩或任何其他技术来解锁 iPhone。
仅当用户的眼睛,鼻子和嘴巴裸露且可扫描时,Face ID 才起作用。当用户戴着口罩时,出于安全性考虑,该系统不起作用,因为该系统也用于银行交易和 Apple Pay。
当用户戴上口罩时,这 30,000 个不可见点将被部分覆盖,这不允许 Face ID 系统测量 3D 深度和面部特征,并且相机无法捕获和读取所有生物特征信息。因此,人脸 ID 无法与遮罩配合使用。
除手机之外,人脸识别一个巨大的应用市场是安防。包括视频监控、门禁等等。
在疫情的影响下,如何在安防市场中识别戴口罩的人脸已经成为了一个共性问题。
安防人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,目的是确定人脸图像的身份,提取输入人脸图像的特征,特征是使用一维向量对人脸的五官,诸如眼睛、嘴巴的大小,肤色,脸型的抽象描述。
输入人脸图像的特征与底库人脸图像的特征进行逐一对比,找出与输入图像特征相似度最高的底库图像,如果相似度大于预先设置的相似度阈值,则该底库图像与输入图像为同一个人,否则无法确定输入图像的身份。
目前的技术难点如下:
首先,带着口罩往往展现的面部特征较小,在火车站这样的场景下,每天数据量很大,核验人员身份精度要求比较高,往往很难实现。
其次,口罩等遮挡物的类型较多,且遮挡程度不一,再次给获取非遮挡区域的信息带来难度;
另外,短期内无法收集大量戴口罩人脸图像,算法训练难度大;
最后,人脸识别系统包含检测、跟踪、识别等多个模块,对它们都会造成影响。
但是在安防级市场,戴口罩人脸识别技术难点是可以克服的。疫情的防控的常态化正在倒逼厂商更新技术,适应市场和用户的需要。
在这一方面,我国已经有了许多突破。早在 2 月下旬,国务院应对新型冠状病毒感染肺炎疫情联防联控机制印发的《企事业单位复工复产疫情防控措施指南》就提出,各单位应暂时停用指纹考勤机,改用其他方式对进出人员进行登记。
目前,腾讯优图、百度、阿里巴巴、商汤、汉王等国内互联网和科技公司都已开发出针对口罩的人脸识别技术,并已经投入应用。
百度视觉团队研发的技术可以使戴口罩的人脸检测准确率超 99% 以上,在百度园区,员工上班戴着口罩就可以刷脸「入场」。
武汉大学国家多媒体软件工程技术研究中心王中元教授研发出的口罩遮挡人脸的识别精度达到 90%;同时构建了全球首个公开的真实口罩人脸识别样本集。
口罩人脸识别技术难题,国内泛安防厂商在疫情期间积极攻克。机器之心在「AI 战疫专题报道」中报道过的小视科技就属其中之一,他们所采用的技术的主要方法是「注意力机制人脸识别算法」是比较主流的思路。
据小视科技技术人员向机器之心介绍,在人脸遮挡环境下,可通过识别眼部关键点作为一种「注意力模型」,快速扫描全局图像,获得需要重点关注的目标区域眼部,并形成注意力焦点。而后对眼部这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。
简单来说就是提取人脸中的关键点,通过关键点识别不同人脸。当面部几乎一半被遮挡后,面部特征关键点就主要集中在了眼睛和眉毛两个部位。
从算法模型上突围,采用眼部、眉毛等局部特征与整体人脸特征的融合,并结合注意力机制增强眼部特征,通过训练眼部关键点的模型,便能提升模型在口罩遮挡下的人脸识别率。
采用同样的原理,在算法层面,针对基于人脸全局特征及局部特征相结合的方法,可优化现有人脸识别算法模型,当人面部出现其他遮挡时,比如戴帽子,也同样能够精准鉴别。
不过,注意力技术识别算法需要用大量的戴口罩人脸数据来训练算法。这对对数据规模也有要求,训练数据规模越大,识别准确率往往越高。通常需要数十万到百万级别的样本量,投入巨大。
为了尽可能获得戴口罩人脸数据,传统的办法是就是在现有的人脸图像上「贴」上口罩。通过收集市面上各种颜色、大小和样式的口罩图片,与之前积累的未佩戴口罩人脸图片进行融合,快速合成了各种场景、海量真实的戴口罩训练照片。
合成口罩图片
除常用的注意力机制外,还有一些人脸识别技术通过采集着装、体态、发型等人体信息,以提高识别准确率。还有一些通过图像重构网络将配戴物件如眼镜、口罩、帽子等的人脸图像重构为未戴配件的人脸图像,进而通过比对实现人脸识别。
也有团队采用技术难度非常大的方法,比如川大智胜通过采集用户的三维人像,增加人脸有限区域的面部信息采集数量,构建精细的用户面部立体几何结构信息,从而实现戴口罩的面部识别。
总之,在戴口罩人脸识别应用方面,我国走在了世界前列。其中最重要的因素是拥有成熟的互联网环境和海量的数据。
不仅如此,如今业界普遍认为,美国人工智能在基础科学和核心技术上占优,而我国则侧重应用场景,有助于技术的商业化落地。
在国内互联网高速发展和普及的当下,每天都会产生海量的数据,涉及各行各业,为挖掘数据的价值提供了便利,也成为机器学习的「训练场」,推动人脸识别技术的不断深入和应用。
因此,抛开隐私和安全等因素,现在中国已经是全球最适合人工智能各类应用场景商业化落地的国家。