人脸识别系列（六）：FaceNet

article/2025/8/27 21:40:08

原文链接：FaceNet:A Unified Embedding for Face Recognition and Clustering

首先可以看一下最终的效果，数字表示两张图片经过Facenet提取的特征之间的欧式距离，可以直接表示两张图片的差异：

从图中可以看出，若取阈值为1.1，可以很轻易的区分出两张照片是不是同一个人。

网络结构：

上图是文章中所采用的网络结构，其中，前半部分就是一个普通的卷积神经网络，但是与一般的深度学习架构不一样，Facenet没有使用Softmax作为损失函数，而是先接了一个l2**嵌入**（Embedding）层。

所谓嵌入，可以理解为一种映射关系，即将特征从原来的特征空间中映射到一个新的特征空间，新的特征就可以称为原来特征的一种嵌入。

这里的映射关系是将卷积神经网络末端全连接层输出的特征映射到一个超球面上，也就是使其特征的二范数归一化，然后再以Triplet Loss为监督信号，获得网络的损失与梯度。

Triplet Loss也正是这篇文章的特点所在，接下来我们重点介绍一下。

Triplet Loss

什么是Triplet Loss呢？顾名思义，也就是根据三张图片组成的三元组（Triplet）计算而来的损失（Loss）。

其中，三元组由Anchor(A),Negative(N),Positive(P)组成，任意一张图片都可以作为一个基点（A）,然后与它属于同一人的图片就是它的P，与它不属于同一人的图片就是它的N。

Triplet Loss的学习目标可以形象的表示如下图：

网络没经过学习之前，A和P的欧式距离可能很大，A和N的欧式距离可能很小，如上图左边，在网络的学习过程中，A和P的欧式距离会逐渐减小，而A和N的距离会逐渐拉大。

也就是说，网络会直接学习特征间的可分性：同一类的特征之间的距离要尽可能的小，而不同类之间的特征距离要尽可能的大。

意思就是说通过学习，使得类间的距离要大于类内的距离。

损失函数为：

其中，左边的二范数表示类内距离，右边的二范数表示类间距离，α是一个常量。优化过程就是使用梯度下降法使得损失函数不断下降，即类内距离不断下降，类间距离不断提升。

提出了这样一种损失函数之后，实践过程中，还有一个难题需要解决，也就是从训练集里选择适合训练的三元组。

选择最佳的三元组

理论上说，为了保证网络训练的效果最好，我们要选择hard positive
这里写图片描述

以及hard negative

这里写图片描述

来作为我们的三元组

但是实际上是这样做会有问题：如果选择最Hard的三元组会造成局部极值，网络可能无法收敛至最优值。

因此google大佬们的做法是在mini-batch中挑选所有的 positive 图像对,因为这样可以使得训练的过程更加稳固。对于Negetive的挑选，大佬们使用了semi-hard的Negetive,也就是满足a到n的距离大于a到p的距离的Negative，而不去选择那些过难的Negetive。

这里写图片描述

CNN结构

文中尝试了两个CNN结构，其参数如下：

网络1：Zeiler&Fergus architecture
这里写图片描述

网络2： GoogLeNet
这里写图片描述

实验

1. 不同的网络配置下的VAL(validation rate)。

2. 不同的训练图像数据集的大小。

3. 嵌入层特征的维度对VAL的影响：

4. 不同的图像质量下的VAL：

左边图表示jpeg图像的质量q对VAL的影响，显然质量越高，VAL越高，右边图表示图像的大小对VAL的影响。

LFW得分

在LFW上达到了98.87% +-0.15的验证准确率

如果预先使用更好的人脸检测算法来对齐人脸，最高可以达到99.63% +-0.09 的验证准确率。

http://chatgpt.dhexx.cn/article/yWmKuYcW.shtml

相关文章

人脸识别（Facenet）

人脸识别（Facenet）

人脸识别是目前应用非常广泛的一种生物识别技术，与其他生物识别技术（指纹识别，掌形识别，眼虹膜识别和声音识别）相比，人脸识别具有以下优势： 其他每种生物识别方法都需要一些人的配合动作&#x…

阅读更多...

全网首发，Swin Transformer+FaceNet实现人脸识别

全网首发，Swin Transformer+FaceNet实现人脸识别

目录一、简介二、Swin Transformer作为Backbone 1.Swin Transformer整体结构 2.PatchEmbed Patch Partition Linear Embedding 3.Swin Transformer Block （1）Window Partition （2）Shifted Window based Self-Attenti…

阅读更多...

深度学习之facenet人脸识别网络介绍

深度学习之facenet人脸识别网络介绍

1.前言照例先来一段废话，不要跟我说什么物质决定意识，也不要告诉我意识超越物质。在我眼中，这个世界本就是一个战场。软弱的意志自然无法战胜物质，但是足够强大的意识也是能够做到的。在战争没有进行完之前，谁也不知道…

阅读更多...

聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台

聪明的人脸识别4——Pytorch 利用Retinaface+Facenet搭建人脸识别平台

睿智的目标检测51——Pytorch 利用RetinafaceFacenet搭建人脸识别平台学习前言什么是Retinface和Facenet1、Retinface2、Facenet 整体实现代码实现流程一、数据库的初始化二、检测图片的处理1、人脸的截取与对齐2、利用Facenet对矫正后的人脸进行编码3、将实时图片中的人脸特征…

阅读更多...

Facenet 原理介绍

Facenet 原理介绍

引子[编辑 | 编辑源代码] 这篇wiki主要介绍facenet人脸相似比较的基本原理，另外两篇wiki主要介绍基于tensorflow实现facenet的准确率测试及源码解读。经过在网上的一番搜索，找到了facenet实现人脸聚类的论文和论文解读，以及github上根据facen…

阅读更多...

【 facenet-retinaface】快速复现实现 facenet-retinaface-pytorch 人脸识别 windows上使用cpu实现

【 facenet-retinaface】快速复现实现 facenet-retinaface-pytorch 人脸识别 windows上使用cpu实现

目录 0 前言1 搭建环境与项目2 人脸预测与结果展示 0 前言这一次要复现的是人脸识别中的 facenet-retinaface-pytorch 是在上一次博客的内容上更进一步快速复现实现 facenet-pytorch 人脸识别 windows上使用cpu实现人脸对比参考了： Pytorch 利用Facenet和Re…

阅读更多...

FaceNet

FaceNet

摘要： 尽管人脸识别领域最近取得了重大进展[10,14,15,17]，但大规模有效地实施人脸验证和识别对当前方法提出了严峻挑战。在本文中，我们提出了一个称为 FaceNet 的系统，它直接学习从人脸图像到紧凑欧几里得空间的映射，其…

阅读更多...

【facenet】快速复现实现 facenet-pytorch 人脸识别 windows上使用cpu实现人脸对比

【facenet】快速复现实现 facenet-pytorch 人脸识别 windows上使用cpu实现人脸对比

目录 0 前言1 搭建环境与项目2 人脸预测与结果展示 0 前言这一次要复现的是人脸识别中的 facenet-pytorch 参考了： Pytorch 搭建自己的Facenet人脸识别网络（Bubbliiiing 深度学习教程） https://gitee.com/xiaozhao123666/facenet-pytorch …

阅读更多...

利用MTCNN和facenet实现人脸检测和人脸识别

利用MTCNN和facenet实现人脸检测和人脸识别

利用MTCNN和facenet实现人脸检测和人脸识别人脸检测和人脸识别技术算是目前人工智能方面应用最成熟的技术了。本博客将利用mtcnn和faceNet搭建一个实现人脸检测和人脸识别的系统。基本思路也很简单，先利用mtcnn的进行人脸检测，当然也可以使用其他的人脸…

阅读更多...

facenet 总结一

facenet 总结一

Facenet是谷歌研发的人脸识别系统，该系统是基于百万级人脸数据训练的深度卷积神经网络，可以将人脸图像embedding（映射）成128维度的特征向量。以该向量为特征，采用knn或者svm等机器学习方法实现人脸识别。 CASIA-WebFac…

阅读更多...

【人脸识别】FaceNet详解

【人脸识别】FaceNet详解

论文题目：《FaceNet: A Unified Embedding for Face Recognition and Clustering》论文地址：FaceNet 1、概述 FaceNet（A Unified Embedding for Face Recognition and Clustering）直接把输入图像变成欧式空间中的特征向量&#…

阅读更多...

人脸识别系统FaceNet原理

人脸识别系统FaceNet原理

1. 概述近年来，随着深度学习在CV领域的广泛应用，人脸识别领域也得到了巨大的发展。在深度学习中，通过多层网络的连接，能够学习到图像的特征表示，那么两张人脸的图像，是不是可以通过深度学习判别其是否是相…

阅读更多...

聪明的人脸识别3——Pytorch 搭建自己的Facenet人脸识别平台

聪明的人脸识别3——Pytorch 搭建自己的Facenet人脸识别平台

聪明的人脸识别3——Pytorch 搭建自己的Facenet人脸识别平台学习前言什么是Facenet源码下载Facenet的实现思路一、预测部分1、主干网络介绍2、根据初步特征获得长度为128的特征向量3、l2标准化4、构建分类器（用于辅助Triplet Loss的收敛） 二、训练部分1…

阅读更多...

syscall()

syscall()

1、syscall的定义 #include<unistd.h> #include<sys/syscall.h> / For SYS_xxx definitions /long syscall(long number, ...);syscall执行间接系统调用，使用该函数会执行一个系统调用，根据指定的参数 number 和所有系统调用的汇编语言接口…

阅读更多...

linux systemctl命令详解

linux systemctl命令详解

笔者在前文中概要的介绍了 systemd 的基本概念和主要特点。由于 systemd 相关的绝大多数任务都是通过 systemctl 命令管理的，所以本文将集中的介绍 systemctl 命令的用法。注意，本文以 ubuntu 16.04 进行介绍，文中所有的 demo 都在 ubuntu 16…

阅读更多...

Linux常用命令——sysctl命令

Linux常用命令——sysctl命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) sysctl 时动态地修改内核的运行参数补充说明 sysctl命令被用于在内核运行时动态地修改内核的运行参数，可用的内核参数在目录/proc/sys中。它包含一些TCP/ip堆栈和虚拟内存系统的高级选项&#xff…

阅读更多...

Linux之systemctl命令基本使用

Linux之systemctl命令基本使用

文章目录 1. systemctl 管理指令2. systemctl 设置服务的自启动状态3. 应用案例：4. 细节讨论： 1. systemctl 管理指令基本语法： systemctl [start | stop | restart | status] 服务名systemctl 指令管理的服务在 /usr/lib/systemd/system 查…

阅读更多...

systemctl命令解析

systemctl命令解析

原文链接如果有效，请点击原文链接查看。原文：http://www.ruanyifeng.com/blog/2016/03/systemd-tutorial-commands.html 一、由来历史上，Linux 的启动一直采用init进程。下面的命令用来启动服务。 $ sudo /etc/init.d/apache2 start # …

阅读更多...

Linux常用命令——systemctl命令

Linux常用命令——systemctl命令

在线Linux命令查询工具(http://www.lzltool.com/LinuxCommand) systemctl 系统服务管理器指令补充说明 systemctl命令是系统服务管理器指令，它实际上将 service 和 chkconfig 这两个命令组合到一起。任务旧指令新指令使某服务自动启动chkconfig --level 3 ht…

阅读更多...

【Linux】之systemd与systemctl

【Linux】之systemd与systemctl

文章目录一、systemd1. systemd 守护进程管理 Linux 的启动2. systemd 提供的功能:3. systemd 使用单元来管理不同类型的对象。4. 服务单元信息二、systemctl1. systemctl输出中的服务状态2. 列出servera上安装的所以服务单元3. 列出servera上所有活动和不活动的套接字单元4.…

阅读更多...

推荐文章