计算机视觉中的人脸识别过程包括,计算机视觉必读（二）：人脸识别、图像检索、目标跟踪、视频分类......

编程入门行业动态更新时间:2024-10-24 14:16:01

计算机视觉中<a href=https://www.elefans.com/category/jswz/34/1769694.html style= 的人脸识别过程包括,计算机视觉必读（二）：人脸识别、图像检索、目标跟踪、视频分类......"/>

计算机视觉中的人脸识别过程包括,计算机视觉必读（二）：人脸识别、图像检索、目标跟踪、视频分类......

人脸验证/识别(face verification/recognition)

人脸验证/识别可以认为是一种更加精细的细粒度图像识别任务。人脸验证是给定两张图像、判断其是否属于同一个人，而人脸识别是回答图像中的人是谁。一个人脸验证/识别系统通常包括三大步：检测图像中的人脸，特征点定位、及对人脸进行验证/识别。人脸验证/识别的难题在于需要进行小样本学习。通常情况下，数据集中每人只有对应的一张图像，这称为一次学习(one-shot learning)。

两种基本思路当作分类问题(需要面对非常多的类别数)，或者当作度量学习问题。如果两张图像属于同一个人，我们希望它们的深度特征比较接近，否则，我们希望它们不接近。之后，根据深度特征之间的距离进行验证(对特征距离设定阈值以判断是否属于同一个人)，或识别(k近邻分类)。

DeepFace 第一个将深度神经网络成功用于人脸验证/识别的模型。DeepFace使用了非共享参数的局部连接。这是由于人脸不同区域存在不同的特征(例如眼睛和嘴巴具有不同的特征)，经典卷积层的“共享参数”性质在人脸识别中不再适用。因此，人脸识别网络中会采用不共享参数的局部连接。其使用孪生网络(siamese network)进行人脸验证。当两张图像的深度特征小于给定阈值时，认为其来自同一个人。

FaceNet 三元输入，希望和负样本之间的距离以一定间隔(如0.2)大于和正样本之间的距离。此外，输入三元的选择不是随机的，否则由于和负样本之间的差异很大，网络学不到什么东西。选择最困难的三元组(即最远的正样本和最近的负样本)会使网络陷入局部最优。FaceNet采用半困难策略，选择比正样本远的负样本。

大间隔交叉熵损失近几年的一大研究热点。由于类内波动大而类间相似度高，有研究工作旨在提升经典的交叉熵损失对深度特征的判断能力。例如，L-Softmax加强优化目标，使对应类别的参数向量和深度特征夹角增大。 A-Softmax进一步约束L-Softmax

更多推荐

计算机视觉中的人脸识别过程包括,计算机视觉必读（二）：人脸识别、图像检索、目标跟踪、视频分类......

本文发布于:2024-02-10 13:40:47，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/1675733.html