视觉理解和认知技术获得突破——
机器有望“读懂”人类的面部表情
人民网北京12月11日电(记者 谷业凯)记者今天从英特尔中国研究院了解到,该院的“前沿视觉理解研究”获得突破,机器有望“读懂”人类的面部表情。
据了解,该项技术的研发起始于2011年,第一阶段主要集中于人脸检测和人脸识别研究;当研究人员能够区分人的性别和年龄段以后,开始进入第二阶段,即进行密集的面部关键点、检测和跟踪,以及研究如何自动识别动态的人脸表情;而第三阶段,该技术则进一步扩展到3D的人脸分析和深度学习。
其中,基于密集的面部关键点检测和跟踪技术,研究人员于2015年开发了一套人脸美化技术,该技术除了能处理皮肤以外,还加入了一些几何上的处理——让人的脸形变成用户想要的形式,比如把眼睛变得更大,把鼻子变得更挺一些等。
人类的情感是交互的一种非常重要的生物特征信息。研究人员介绍说,在人类情感识别这一领域,做出表情主要靠面部肌肉的运动,肌肉的运动跟某一个单独的表情是相关的。不同的表情之间也是相关的。当时,研究人员主要通过检测与单个表情相关的肌肉运动单元,进而去解析不同运动单元之间的关系,在2015年,团队夺取了一项美国计算机学会比赛的冠军——该项竞赛给出了很多电影里的片断,并在其中标注一个主要人物表达出来他的情感。
今年,英特尔的团队基于深度学习算法,再次问鼎这一赛事。“一个深度的网络,类似于一个很长的隧道,从入口看进去基本上看不到,一片漆黑。那么怎么让它变得透明呢?我们的方案类似于在隧道的中间和拐角的地方打了几个孔,放几个探照灯,就可以清清楚楚看到这个网络里面的参数是怎么传递的。”英特尔中国研究院的研究人员介绍说,通过聚合监督的思想,单模型识别能力相对提高5.5个百分点。目前,这项技术在完全自然的电影场景里的情感识别分类精度已经超过了及格线。
据了解,研究人员还从数十万人脸图片数据中,训练出多个人脸识别模型,用于对视频图像进行智能分析与3D建模,不仅可以检测与识别人脸,还能精准重建3D人脸,并实时跟踪面部表情变化,将预先设计好的特效素材附着在3D人脸上并叠加到视频中,从而实现逼真炫酷的脸部特效。