人工智能:人脸识别与搜索
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.2 TCDCN 人脸关键点定位算法

TCDCN(Tasks-Constrained Deep Convolutional Network)[5]算法,旨在通过多任务学习(除人脸关键点定位之外,还有头部姿势估计和面部属性推断,具体包括是否戴眼镜、是否微笑、性别判断和脸部方向估计等学习任务),进一步优化人脸关键点定位的效果。具体而言,作者设计了如图4-3所示的TCDCN 神经网络结构和处理流程,从图中可以看到,不同的学习任务共享相同的神经网络特征。为了多任务学习的需要,作者设计了新的损失函数,包括Softmax 函数和线性函数等部分。TCDCN 人脸关键点定位算法的本质是通过神经网络提取特征,并通过回归学习得到人脸关键点的位置。TCDCN 人脸关键点定位算法通过多任务学习的方法,借助多任务约束的损失函数和误差后向传播,最终提取到的特征能够提高人脸定位模型的泛化能力。不过,由于是多任务学习,TCDCN 要求对训练数据进行更加全面的标注,除人脸关键点的位置外,还需要标注其他任务学习所需的数据,如脸部方向、性别及是否戴眼镜等。为此,作者手动标注了一个MTFL(Multi-Task Facial Landmark)数据集。

img

图4-3 TCDCN 神经网络结构和处理流程[5]