以应用为视角,全面分析人脸识别 | 智趣云识客

作者介绍:智趣云识客 立足视觉AI,专注场景识别的AI服务商



根据前瞻产业研究院对对人脸识别市场的预估,到2022年,中国人脸识别市场规模将超过66亿元

关于人脸识别各种碎片式的报道,也层出不穷,但是鲜有文章能系统性的,从应用的角度出发来深入讲解人脸识别。

智趣云识客作为专注于场景识别的AI服务商,我们将从技术应用与商业模式两个维度,力求让读者,尤其是考虑AI+应用的从业者,看到全貌。

本篇,我们先来讲人脸识别的技术应用。

1 基础层算法

我们可能断断续续听说过人脸检测、人脸识别等算法,但这些算法之间是否有联系,是否有体系?答案的是“有的”。

我们可以将人脸识别算法分为基础层算法与应用层算法。

基础层算法,相当于人脸的预处理。一张人脸,首先要经过人脸检测、特征关键点处理,质量模型过滤之后,才能到应用层算法做处理,并应用到实际场景中。
基础层算法的优劣,很大程度上会影响最终的人脸识别准确率和效果。

技术 定义 作用 原理
人脸检测 将一张照片或一段视频流中的人脸检测出来,并输出人脸矩阵坐标 用于截取人脸,用于后续的人脸比对、人脸搜索等算法。 二分类模型,通过深度学习训练样本是否是人脸
特征关键点 检测到人脸后,将人脸的特征点标记出来,每个特征点都有属性,能表示是脸部位置 1 人脸摆正对齐:实际场景中,抓取的人脸一般不是正方向的,需要摆正后再进行人脸比对、搜索等<BR>2 人脸处理:互娱应用中的贴纸等人脸特效,需要检测到人脸特征关键后,在对关键部位进行针对性处理 将人脸照片的关键点都做上标记,通过深度学习、分类模型,让算法能检测到特征点并识别特征点的属性。
质量模型 对人脸照片的角度、光照、模糊度等进行评估,让符合要求的照片进行到下一步人脸识别 1 适应不同业务中对照片的需求,比如有些场景,需要口罩能识别(医院),而有些场景则不能<BR>2 提升人脸比对、人脸搜索等后续人脸识别的准确率 回归模型,对每张照片标记模糊、光照、遮挡的分值,进行监督训练后,输入照片即可输出对应的质量分值。

2 应用层算法

目前,人脸识别在身份认证领域与互娱领域应用最为广泛;在智能交互,数据分析处理等方向上,人脸识别也在进行着积极探索。

身份认证/安防的核心功能在于确认“你是谁”,互娱领域的核心在于“人脸特效处理”;两个领域,两条赛道,分别拥有各自不同的产业链。

身份认证犹如一位思维严谨的工程师,狠抓识别准确率,防***等指标,并结合应用落地场景,串联业务流程,也是当下AI结合产业互联网的典型。

互娱领域就像一位钻研人性的产品经理,打造各种人脸特效,美颜、贴纸等都不在话下,并结合平台用户偏好,使用针对性的人脸特效策略,引领甚至塑造人们的审美潮流。

目前,智趣云识客专注于第一条赛道上的核心技术,用心服务上下游企业。虽然这会使得我们的业务面没有那么全,但是却能让我们在特定赛道上占有一席之地,关键核心技术已达到行业领先水平。

2.1 你是谁?无介质证明身份

日常生活中,原来我们都是需要通过介质(×××、工牌、驾驶证等)来证明身份,而以人脸识别为代表的生物识别,则无需介质。

身份认证/安防的核心技术在于活体检测、人脸比对、人脸搜索;主要用于:线上远程认证场景(金融开户、刷脸注册、刷脸登录等)、线下无人值守场景(智慧交通、人脸门禁、刷脸取款、刷脸支付等)。

  • 活体检测
    是身份认证的第一步,因为首先我要确认这个人是真人,而不是视频、照片、面具等欺诈盗用行为。

活体检测的技术上,目前也主要有两大类:对硬件依赖度比较低的,如动作活体,静默活体;对硬件有一定要求,需要和硬件适配的,比如双目活体、3D结构光活体等。虽然后者的成本比前者高,但是防***效果更好,而在线下场景中,天然的需要硬件,因而后者也成为线下场景的最好选择。

原理上,都是采集人脸照片,并将照片做上标记(真/假样本),并送到模型中训练从而得出算法。不同的活体检测,因为样本源不一样,比如红外摄像头采集的照片,带有灰度特征;3D结构光采集的照片带有深度信息,导致识别效果也不同。所以,活体检测的关键,除了算法、模型构造,还有一个就是图片样本本身所带有的信息量。

  • 人脸比对
    是将两张人脸照片进行比对,得出相似度;第一张是现场采集的,第二张该如何得来?一般有两个来源:

1 另外一个能代表你身份的载体,比如×××、行驶证、驾驶证等证件照,这类场景用来做金融开户、人脸注册、网约车司机认证等场景,通过现场采集照比对你的证件照信息,确认你就是本人。

2 账号下已经绑定的人脸:一般需要先输入账号,获取对应人脸。这类场景的典型应用是取代原来的密码功能,比如刷脸登录、刷脸支付等。

  • 人脸搜索
    是将采集到的人脸,和底库中的人脸全部进行比对,得出相似度最高的几张人脸底库照,并得出相似度,超过一定阈值,则可以认为是同一人。

人脸搜索,无需事先得到人脸照,只需要刷脸即可,在线下门禁等安防领域,线下刷脸支付等应用广泛。当然,不同的业务领域中,根据误识的后果,对人脸搜索的容错性也不一样;比如在工地人脸识别中的容错率,就要比在刷脸支付中的容错率要低。

需要说明的是,人脸搜索的准确率,是要结合人脸底库中人脸照片的数量来的,底库中人脸照片越多,识别准确率越低。这个和人一样,在2~3个人中,找出你曾经认识的人,比较容易;但是上百万个人,则长相相似的人也越多,辨识更困难。目前业界做的好的一般是百万级别的人脸库,识别准确率在95%以上

2.2 从工具到社交,娱乐至上

互娱应用,也深深契合着行业发展。

起初随着智能手机兴起,人们的自拍分享需求渐渐旺盛,美颜滤镜,作为与手机硬件深度结合的产品,见证着人们变美的时代,此时,算法主要由第三方算法公司提供。

随着4G时代带来,短视频社交成为人们生活热点,美颜滤镜、贴纸也应用于各大互娱平台中,并成为不可分割的一部分;对于短视频内容生产者来说,甚至已成为核心竞争力。因此,诸如快手、抖音等平台,都以自研算法,并结合客户群画像,独自研发。

滤镜是图像美化中必不可少的步骤, 所谓滤镜,最初是指安装在相机镜头前过滤自然光的附加镜头,用来实现调色和添加效果。2008年,美图一炮而红,人们发现,原来滤镜还可以这么玩,自此,美颜滤镜开始了从工具到美学定义者的转变。

早起的传统算法,主要是先使用人脸特征关键点算法,勾画有效区域,然后在不同的区域进行亮度提升、去噪声等算法,实现美颜滤镜。

随着深度学习的兴起,研究人员们开始更关注结果,设计师将原图P成美化完成后的结果图,并用于训练。人们美颜后,究竟想变成什么样?研究重心也开始偏移。

贴纸,人脸融合,则是更高阶的玩法。核心还是人脸特征关键点,对于贴纸和人脸融合来说,关键点的数量越多越好,对齐的越准确。人脸融合,则是将两张人脸的关键点进行融合。

2.3 不断进取,跨越感知智能

人工智能承载了业界对于世界改造的期望,一定程度上说,属性识别、视线估计、gan等,从感知智能程度上往前更进了一步,但是因为技术不够成熟、商业应用领域狭窄等原因,至今未得到大规模商业应用。可以说,视觉AI想跨越到认知智能,AI与AI之间相互融合,依然还有很漫长的路要走

  • 属性识别
    识别年龄、性别,高兴、悲伤、愤怒等情绪,获取用户更多维的数据,丰富用户画像、个性化推荐、广告展示等等场景,听着很美好,对不对?毕竟在数据为王的时代,数据就是价值。但是,商用化还是存在技术硬伤,识别准确率也就70%左右。

近日,美国等5名专家,耗时两年,查阅1000多项研究,在论文《再论人类情感表达:从人类面部表情辨别情绪的方法论面临的挑战》(论文原名为:《Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements》)中表示:人类情绪的表达方式及其丰富复杂,很难靠简单的面部表情识别,人们生气时,在平均不到30%的时间里他们会皱眉,故皱眉不等于愤怒,皱眉知识“愤怒”的众多表达方式之一。同时,表情和语言、情境的相关关系也非常大。

  • 视线估计
    和人脸特征关键点比较像,检测完人脸之后,再检测人眼以及眼球,并锁定眼球中心等关键点位置,根据坐标来锁定视线方向。主要应用于课堂上,评估学生注意力;AR VR等新型硬件交互,通过视线方向,自动切换视频中的位置等;广告投放,评估行人对广告的注意力;目前而言,市场体系还是比较小,未得到大规模应用

  • GAN
    全称为生成对抗网络,初衷是生成不存在于真实世界中的数据,使得AI具有创造力或者想象力,也是目前AI领域一个比较热门的研究方向。

gan的核心网络分为生成器与判别器;生成器负责凭空捏造数据,判别器负责判断数据是否是真数据;两个核心网络相互博弈,直至动态平衡,让生成的数据无限逼真与真实数据。

如图,随机噪声就是随机生成的一些数,也就是gan生成图像的源头。

生成器根据一串随机数生成一个假图像,并用这些假图去欺骗判别器

而判别器通过真图和假图的数据(相当于天然的label),进行一个二分类神经网络训练,并判别输入的是真图还是假图,给出一个分值。

举个例子,真图是一系列的人脸照。起初,生成器生成的的照片,肯定是乱七八糟的,但是判别器会去判断打分,告诉生成器,你生成的不是真图(人脸照),于是生成器根据深度学习,反向传播等,不断去修改自己的图片,然后,生成的图片会越来越趋近于真实人脸,直至动态平衡。

gan受到关注,很多原因,比如:
1 本身是无监督的。目前人工智能的绝大部分能够商业应用算法都是监督算法,所谓监督算法,就是需要海量的样本,并进行人工标注,人为去告诉深度学习网络是是否正确,并传播训练,所以行业也有“有多少人工,就有多少智能”的调侃。
2 让AI具备想象力,比如将模糊图变清晰(去雨、去雾、去抖动、去马赛克等),能脑补情节
很多paper都在研究gan的发展前景。

3 写在最后

任何技术,也都遵循着从技术发展—>技术成熟—>商业落地的发展规律

技术的池子不断创新,同时商业也从技术池中,探索合适的技术,改造世界;

人脸识别作为一项复合性技术,既拥有现在,同时也在不断开拓未来。虽然困难重重,但前景令人心动。

原文地址:https://blog.51cto.com/14420407/2428861

时间: 2024-11-07 11:22:35

以应用为视角,全面分析人脸识别 | 智趣云识客的相关文章

仅5M大小,识别准确率99.9%,共享CNN神经网络的双目活体技术 | 云识客

以下这张照?,是真?实拍还是对着照?翻拍的? 如果告诉你,这张照?,是对着照?翻拍的照?,你会不会惊讶? 但就是对于这种?乎以假乱真的照?,双?活体能很轻松地判断出来这张照?到底是真?照?还是照片翻拍.在?融.征信.安防等?脸识别应?最?泛的场景中,活体识别可以说是具备?规模应?最关键环节. 1 什么是双?活体 双?,就是有两个眼睛.?个眼睛是可?光摄像头,采集彩?照:还有?个眼睛是近红外摄像头,采集的??照.?双?活体,实际上也对应了两种算法,单?活体检测和近红外活体检测 ? 可?光活体检测的

基于人脸识别的商业大数据

主要内容: 人脸识别登录     根据人脸识别与浏览记录相结合的方式进行商品和广告推荐     根据表情识别来分别客户对广告推荐的喜好程度 功能性需求: 人脸检测:     通过摄像头获取人脸轮廓,提取特征生成特征数据库,将实时生成的特征数据与预置的特征库进行比较,计算相似度,给出相应识别结果,可以支持多个人脸识别,并能辨别出摄像头到人的距离. 年龄和性别监测: 通过摄像头捕获人脸图像,首先进行人脸轮廓检测,确定眼睛的精确位置(人眼定位),然后提取面部有分类能力的特征,生成人脸特征数据.通过实时

人脸识别与仿真

第一章 绪论 本章提出了本文的研究背景及应用前景.首先阐述了人脸图像识别意义:然后介绍了人脸图像识别研究中存在的问题:接着介绍了自动人脸识别系统的一般框架构成:最后简要地介绍了本文的主要工作和章节结构. 就从目前和将来来看,可以预测到人脸图像识别将具有广阔的应用前景,如表1-1中所列举就是其中已经实现或逐步完善的应用. 表1-1 人脸识别的应用 应用 优点 存在问题 信信用卡.汽车驾照.护照以及个人身份验证等 图像摄取可控 图像分割可控 图像质量好 需要建立庞大的数据库 嫌疑犯照片匹配 图像质量

实验报告: 人脸识别方法回顾与实验分析 【OpenCV测试方法源码】

趁着还未工作,先把过去做的东西整理下出来~   Github源码:https://github.com/Blz-Galaxy/OpenCV-Face-Recognition (涉及个人隐私,源码不包含测试样本,请谅解~) 对实验结果更感兴趣的朋友请直接看 第5章 [摘要]这是一篇关于人脸识别方法的实验报告.报告首先回顾了人脸识别研究的发展历程及基本分类:随后对人脸识别技术方法发展过程中一些经典的流行的方法进行了详细的阐述:最后作者通过设计实验对比了三种方法的识别效果并总结了人脸识别所面临的困难与

【计算机视觉】OpenCV人脸识别facerec源码分析2——LBPH概述

人脸识别 从OpenCV2.4开始,加入了新的类FaceRecognizer,我们可以使用它便捷地进行人脸识别实验.其源代码可以在OpenCV中的opencv\modules\contrib\doc\facerec\src下找到. 目前支持的算法有: Eigenfaces特征脸createEigenFaceRecognizer() Fisherfaces createFisherFaceRecognizer() Local Binary Patterns Histograms局部二值直方图 cr

python3+dlib人脸识别及情绪分析

一.介绍 我想做的是基于人脸识别的表情(情绪)分析.看到网上也是有很多的开源库提供使用,为开发提供了很大的方便.我选择目前用的比较多的dlib库进行人脸识别与特征标定.使用python也缩短了开发周期. 官网对于dlib的介绍是:Dlib包含广泛的机器学习算法.所有的设计都是高度模块化的,快速执行,并且通过一个干净而现代的C ++ API,使用起来非常简单.它用于各种应用,包括机器人技术,嵌入式设备,手机和大型高性能计算环境. 虽然应用都比较高大上,但是自己在PC上做个情绪分析的小软件还是挺有意

微信好友大揭秘,使用Python抓取朋友圈数据,通过人脸识别全面分析好友,一起看透你的“朋友圈”

微信:一个提供即时通讯服务的应用程序,更是一种生活方式,超过数十亿的使用者,越来越多的人选择使用它来沟通交流. 不知从何时起,我们的生活离不开微信,每天睁开眼的第一件事就是打开微信,关注着朋友圈里好友的动态,而朋友圈中或虚或实的状态更新,似乎都在证明自己的"有趣",寻找那份或有或无的存在感. 有人选择在朋友圈记录生活的点滴,有人选择在朋友圈展示自己的观点.有时我们想去展示自己,有时又想去窥探着别人的生活,而有时又不想别人过多的了解自己的生活,或是屏蔽对方,或是不给对方看朋友圈,又或是不

【计算机视觉】OpenCV人脸识别facerec源码分析1——FaceRecognizer概述

FaceRecognizer类 OpenCV中所有人脸识别的模型都是继承自FaceRecognizer这个基类,这个类提供了人脸识别算法的统一接口. class FaceRecognizer : public Algorithm { public: //! virtual destructor virtual ~FaceRecognizer() {} // Trains a FaceRecognizer. virtual void train(InputArray src, InputArray

人脸识别关键点/五官定位效果分析---点击图片提供下载测试,欢迎提供建议

########################################### 1:安装好了之后,打开手机网络(只是验证网络时间),并不发生数据交互. 2:如果打开黑屏,是由于安卓手机版本太高,需要手动打开摄像头权限. ########################################## 利用神经网络开发的五官定位/人脸识别关键点的开发包,跟踪效果和切合 度还是不错的,但是一定存在很多大牛,希望你们多多分享下你们自己的经 验,大家一起进步. ###############