基于Triplet loss函数训练人脸识别深度网络(Open Face)

Git:  http://cmusatyalab.github.io/openface/

FaceNet’s innovation comes from four distinct factors: (a) thetriplet loss, (b) their triplet selection procedure, (c) training with 100 million to 200 million labeled images, and (d) (not discussed here) large-scale experimentation to find an network architecture.

首先resize为如下尺寸: 96*96

输入Image(需要100M-200M张图片)

Face detection(检测人脸)、Preprocessing(尺度归一、灰度校正、每一张脸都进行一次仿射变换)

输入神经网络(进行特征提取)最终实现面部表示

再进行分类sklearn’s SVM(python中的一个库)

图1 模型训练结构

Triplet loss结构:一组三个图像:一个标准图像,一个正样本(与标准同一人),一个负样本(不同的人)

通过损失公式来调节整个网络,公式如下,思想将在文末介绍:

图2 Triplet loss公式

Resize(96*96)预处理采用简单2D仿射变换可规格化脸部、训练神经网络-低维面部表示(神经网络提取特征)

OpenFaceis trained with 500k images from combining the two largest labeled face recognition datasets forresearch.

e network provides an embedding on the unit

hypersphere and Euclidean distance represents similarity.

网络提供了一种嵌入式的超平面和欧氏距离来表示相似性。

逻辑流:

图3 模型逻辑流

最后神经网络提取特征形成初始模型面部表示。如下图所示:

图4 Torch与Python结合

误差函数Triplet loss

最后,说一说基于度量学习的误差函数Triplet loss,其思想来源如下:

其中xai表示参考样本,xpi表示同类样本,xni表示异类样本,threshold表示特定阈值。该不等式可表示成下列形式:

该不等式本质上定义了同类样本和异类样本之间的距离关系,即:所有同类样本之间的距离+阈值threshold,要小于异类样本之间的距离。当距离关系不满足上述不等式时,我们可通过求解下列误差函数,通过反向传播算法来调节整个网络:

只有括号内公式的值大于0时,才计算误差。利用该公式可分别计算出xai,xpi和xni的梯度方向,并根据反向传播算法调节前面的网络。

FaceNet中,作者利用该方法与Zeiler&Fergus以及GoogLeNet中提出的网络结构相结合,实现人脸识别,达到了很高的精度。

为了验证TripletLoss的有效性,我们在WebFace数据库上利用TripletLoss训练了另一种深度卷积网来实现人脸验证,WebFace中有该网络的结构描述。与FaceNet不同,我们并没有采用作者使用的semi-hard样本选取策略,而是直接扩大batch中样本的数量。得益于双Titan X显卡,BatchSize达到了540,较大的BatchSize能够保证求得的梯度方向与semi-hard策略所求得的梯度方向相类似。

在得到TripletLoss训练好的网络后,我们利用Joint-Bayesian方法对网络最后一层提取的特征进行学习,得到相似度估计模型。最终模型与DeepID在LFW测试集上的对比ROC曲线如下图所示:

Openface nn4,small2 network改进于Facenet

原文地址:https://www.cnblogs.com/y-zzml/p/8972907.html

时间: 2024-11-09 00:38:57

基于Triplet loss函数训练人脸识别深度网络(Open Face)的相关文章

简述人脸特异性识别&&一个基于LBP和SVM的人脸识别小例子

原谅我用图片,MAC在Safari里给文章进行图文排版太麻烦啦~ 本文适合初入计算机视觉和模式识别方向的同学们观看~ 文章写得匆忙,加上博主所知甚少,有不妥和勘误请指出并多多包涵. 本文Demo的代码由HZK编写,特征点由月神和YK选择和训练. 转载请注明 copyleft by sciencefans, 2014 为了方便大家学习,附上高维LBP的核心代码 1 ################################################### 2 # 3 # 4 # NO

基于QT和OpenCV的人脸识别系统

1 系统方案设计 1.1 引言 人脸是一个常见而复杂的视觉模式,人脸所反映的视觉信息在人与人的交流和交往中有着重 要的作用和意义,对人脸进行处理和分析在视频监控.出入口控制.视频会议以及人机交互等领 域都有着广泛的应用前景,因此是模式识别和计算机视觉领域持续的研究热点. 本系统在 FriendlyARM Tiny6410 开发板基础上,利用 OpenCV 计算机视觉库和 QT 图形库,通 过普通的 USB 摄像头实现了自动人脸识别,准确率较高,方便易用. 1.2 系统总体架构 "人脸识别&quo

C#实现基于ffmpeg加虹软的人脸识别

关于人脸识别 目前的人脸识别已经相对成熟,有各种收费免费的商业方案和开源方案,其中OpenCV很早就支持了人脸识别,在我选择人脸 识别开发库时,也横向对比了三种库,包括在线识别的百度.开源的OpenCV和商业库虹软(中小型规模免费). 百度的人脸识别,才上线不久,文档不太完善,之前联系百度,官方也给了我基于Android的Example,但是不太符合我的需 求,一是照片需要上传至百度服务器(这个是最大的问题),其次,人脸的定位需要自行去实现(捕获到人脸后上传进行识别). OpenCV很早以前就用

基于svm和pca的人脸识别案例分析

数据集介绍 LFW (Labeled Faces in the Wild) 人脸数据库是由美国马萨诸塞州立大学阿默斯特分校计算机视觉实验室整理完成的数据库,主要用来研究非受限情况下的人脸识别问题.LFW 数据库主要是从互联网上搜集图像,而不是实验室,一共含有13000 多张人脸图像,每张图像都被标识出对应的人的名字,其中有1680 人对应不只一张图像,即大约1680个人包含两个以上的人脸.LFW数据集主要测试人脸识别的准确率. 代码实现 from time import time #记录时间 i

基于opencv3.0下的人脸识别和识别部分的高斯模糊处理

如题 这里将任务分解为三大部分: 1.录播放视频 2.人脸识别 3.部分高斯模糊 其中重点放在人脸识别和部分高斯模糊上 1.录播放视频(以opencv中的VideoCapture类进行实现) 首先罗列下操作环境:win10+vs2013+opencv3.0+单摄像头 opencv中提供了VideoCapture和CvCapture对视频进行操作 其中官方给出CvCapture的API为 实例化CvCapture对象的时候,需要调用cvCaptureFromCAM(int device)进行实例化

基于汉王云API的人脸识别

http://down.51cto.com/data/2076078 源码地址,使用汉王云API,得预先申请汉王API key

人脸识别准备 -- 基于raspberry pi 3b + movidius

最近准备系统地学习一下深度学习和TensorFlow,就以人脸识别作为目的. 十年前我做过一些图像处理相关的项目和研究,涉及到图像检索.记得当时使用的是SIFT特征提取,该特征算子能很好地抵抗图像旋转.仿射变换等变化.可以说SIFT是图像特征工程方面做得很出色的算子. 现如今深度学习特别是CNN,ResNet等模型被研究者发明之后,图像特征工程似乎已经很"没有必要"了.深度神经网络通过多层表示能够更抽象地表示图像的特征(称作embedding). 在人脸识别也得益于深度学习,其中fac

浅谈人脸识别中的loss 损失函数

浅谈人脸识别中的loss 损失函数 2019-04-17 17:57:33 liguiyuan112 阅读数 641更多 分类专栏: AI 人脸识别 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/u012505617/article/details/89355690 在人脸识别中,算法的提高主要体现在损失函数的设计上,损失函数会对整个网络的优化有着导向性的作用.我们看到许多常用的损失函数

人脸识别的深度学习

深度学习只不过是机器学习的标准范例,更准确地说 - 是其算法之一.在最大程度上,它基于人脑的概念和神经元的相互作用.如果你开始谷歌搜索深度学习是什么,你会发现今天这个超级热门词远远不是新的.为什么这样?该术语本身出现在20世纪80年代,但到2012年,没有足够的力量来实施这项技术,几乎没有人关注它. 在着名科学家的一系列文章,科学期刊上的出版物之后,这项技术迅速成为病毒.今天,它有各种各样的应用程序,其中重要的地方是人脸识别.首先,深度学习提供了构建识别生物识别软件的能力,该软件能够唯一地识别或