StartDT AI Lab | 视觉智能引擎——从Face ID说起,浅析顾客数字化

“顾客就是上帝”,这句西谚揭示了顾客占据着商业活动中心地位这一客观规律。为了能更好地服务顾客,优化商家自身的服务与产品,对顾客的分析与需求调研一直是商业经营分析中的重中之重。

在商业互联网化、社会数字化的今天,这一规律越发明显。从Web1.0时×××始,Cookie就被发明出来,用以对“顾客”进行数字化描述和建档并归一化其互联网下的数字行为。

其后的Web2.0时代,随着移动互联网的发展,个人生活中的屏—人机交互端口变多了,原先用Cookie对 “顾客” 进行数字化的方式已无法完成对个人全渠道全平台跨屏的行为归一化,为了解决这一问题,设备ID、SuperID应运而生。

当前, Web3.0正如火如荼地发展中,渠道、平台、终端、屏幕随着IOT的发展,通过云端赋能,下沉雾化, 对“顾客”进行数字化描述的方式又迎来了更复杂更严峻的挑战。有鉴于此,奇点云与众多有志于此的友商,在多年前就开始了对于新形态“顾客ID”的预研。目前基本达成的共识有两点:

IOT时代来临,原来的线下物理社会逐步数字化上线,对于这一开放的数字化环境,已经难以通过唯一有限的媒介数字设备对顾客及行为数字化。这就需要从自然人身上直接数字化并抽取。
这一新形态数字ID需要能够较为高效和准确地拉通原先Web1.0和Web2.0时代的既有数字化信息。
在经历了一段时间摸索后,以人脸生物特征为基础的Face ID方案逐渐显露出优势,而 Face ID也成为了当前奇点云商业智能化方案中对于顾客数字化描述的主要技术方案。基于此,StartDT AI Lab在人脸数字化方向上做了充分且深入的技术沉淀。下面就为大家展示几点:

人脸数字化的核心自然是人脸识别,其包含了人脸生物特征的数字化和准确比对。作为视觉智能引擎中不可或缺的一部分,StartDT AI Lab的人脸识别技术可以解决复杂场景下的人脸识别问题。

比如动态视频监控场景下的人脸识别,相较于约束场景下的人脸验证所需的人脸识别技术,其一大挑战是对无约束人脸的识别,难度在于进行人脸识别的人脸图一般会存在模糊、遮挡、低分辨率、面部光照及表情变化巨大等,这些因素都会在一定程度上对人脸识别造成影响,甚至大幅降低人脸识别的准确率。而StartDT AI Lab对这种场景下的人脸识别准确率进行专项课题攻坚,主要研发采用了下面一些技术手段:

01数据增强

当训练数据面临样本量过少、质量分布不均衡或者训练集与实际场景分布差异较大时,模型的泛化能力会严重下降,此时数据增强就很有意义;StartDT AI Lab通过GAN网络同时结合传统图像处理技术,进行样本合成增强。

02图像处理

在无约束场景下,一般获取的图像质量较差,例如对人脸而言,一般分辨率较差、 模糊、遮挡、低光等,StartDT AI Lab通过结合传统方法和深度学习方法,对人脸图像进行去噪、去模糊、超分辨等处理,从而获得更高质量的人脸图片,提升实际场景模型准确性。

03大规模分布式并行训练

采用多机多卡的训练方式,StartDT AI Lab目前支持上百万个ID,上亿张照片规模的训练数据集。

正所谓有矛就有盾,有攻就有防。自从有了数字ID,就有了对应的***技术来破解盗用数字ID,这一问题到了Face ID时代依然存在,并且因为Face ID所在的是开放性数字场景,***手段更是丰富简便了起来。

比如仅仅使用一个手机上的照片或者使用换脸APP就盗用了别人的人脸从而被认证,这样就非常容易被犯罪分子利用,人脸识别的应用范围就大打折扣了。因此,我们需要在人脸识别进行前增加活体检测加以应对。目前,人脸识别的主要***方法包括照片与视频回放***以及立体面具***。

我们在产品中针对不同的应用场景开发了多种活体检测方法,针对无人零售场景,需要配合交互验证的方式对用户不友好,同时需要控制成本,因此我们开发了基于单目RGB的静默活体检测方法。主要通过深度学习方式提取特征以及基于多特征融合的方法达到了目前场景下99.98%拒绝率,99.8%的通过率。目前算法已用在我们的多种场景下,时刻为我们的人脸识别系统保驾护航。

(已集成在产品上的活体检测演示)

在完成Face ID的提取之后,作为数字化需求的自然延展,视频智能引擎对人脸的相关信息也同步进行了数字化,例如年龄性别表情等。


目前,人脸年龄预测方面主要的难点在于如何协调年龄的连续性、年龄间的次序性、年龄分段的模糊性等,还有来自于实际场景中妆容、光照、角度等等的影响。

在人脸性别预测方面,主要问题在于intra-class variability,所以加大光照,角度等intra-class方面的增强数据有助于提升模型性能。

在人脸表情识别方面,碰到的难点主要有3方面:

各模式(光照,姿态等)下表情数据集不足;
由于年龄、性别、种族、表情强度等因素不同造成high inter-subject variations;
由于光照、姿态、遮挡等因素造成的large intra-class variability。
目前StartDT AI Lab选择的年龄性别表情预测与识别算法在以上问题的解决方面有了很大的突破,再通过大数据样本的训练,取得了相较于目前市面上主流人脸年龄性别表情API更高的性能指标。

通过以上的技术展示,相信读者对奇点云视觉智能引擎中的人脸相关技术能力有了一定了解,也对Face ID为主的Web3.0时代的“顾客”数字化描述这一主要方式有了一定认识。从目前奇点云在Web3.0的实践来看,Face ID在头部20%高净值VIP客户的服务中能有充分的数字化保障,这也直接提高商家在商业模式中80%预期收益的落袋能力。然而对于剩下20%的预期收益,由于其分散在80%长尾客群的稀疏商业行为中,如何以低成本的方式提高这部分预期收益的落袋向来是商业场景中的难点。有鉴于此,奇点云从技术的角度解构了这部分商业场景,并通过技术的一次次突破,不断地提升着预期收益的上限。而这背后的技术细节和故事正是本栏目下一期分享的主题,敬请期待!

原文地址:https://blog.51cto.com/14386859/2426056

时间: 2024-10-09 13:39:17

StartDT AI Lab | 视觉智能引擎——从Face ID说起,浅析顾客数字化的相关文章

StartDT AI Lab | 视觉智能引擎——Re-ID赋能线下场景顾客数字化

人货场的思路是整个新零售数字化链路的核心,人是整个业务生命周期的起始点,图像算法的首要目标就是从图像中得到“人” .前一篇我们主要讲了Face ID的发展,Face ID帮助商家赋能了线下用户画像,把视觉计算的热情带到支付.安防等各行各业. 诚然,分析人的方式多种多样,各种分析行人的算法中,Face算法在其中有着得天独厚的优势,它在验证身份方面是最精准的(可以精确到支付验证),但Face算法在数量统计的准确度肯定不是最优的.因为很多场景下的Face ID受到了光照遮挡的影响,质量参差不齐,所以基

StartDT AI Lab | 数据增强技术如何实现场景落地与业务增值?

有人说,「深度学习“等于”深度卷积神经网络算法模型+大规模数据+云端分布式算力」.也有人说,「能够在业内叱咤风云的AI都曾“身经百战”,经历过无数次的训练与试错」.以上都需要海量数据做依托,对于那些数据量匮乏的领域,就衍生出了数据增强技术.即,根据一个原始数据,稍作改动,变成一个对于AI来说的全新的数据. 01 为什么做数据增强? 数据规模的重要性到底怎样呢?可以说,深度学习的火热和蓬勃发展,直接源于普林斯顿大学教授李飞飞及她所带领的团队创作的一个包含百万级图片的数据集ImageNet.工业级人

CVPR 2018 | 腾讯AI Lab入选21篇论文详解

近十年来在国际计算机视觉领域最具影响力.研究内容最全面的顶级学术会议CVPR,近日揭晓2018年收录论文名单,腾讯AI Lab共有21篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论. 去年CVPR的论文录取率为29%,腾讯AI Lab 共有6篇论文入选,点击 这里可以回顾.2017年,腾讯 AI Lab共有100多篇论文发表在AI顶级会议上,包括ICML(4篇).ACL(3篇).NIPS(8篇)等. 我们还坚持与学界.企业界和行业「共享AI+未来」,已与美国麻省理工大学.英国

如何做研究?(From: MIT AI LAB)

简评: 这是一篇关于如何做研究的经验总结,全面阐述了研究过程中可能遇到的诸多问题,并给出了切实可行的建议!对于刚进入研究生阶段的研究生来说,我觉得可以为他们未来的研究生活提供很多有益的指导! 摘要: 本文的主旨是解释如何做研究.我们提供的这些建议,对做研究本身(阅读.写作和程序设计),理解研究过程以及开始热爱研究(方法论.选题.选导师和情感因素),都是极 具价值的. 本文背景: 麻省理工学院 人工智能实验室 AI Working Paper 316 1988年10月来自MIT人工智能实验室:如何

腾讯 AI Lab 计算机视觉中心人脸 & OCR团队近期成果介绍(3)

欢迎大家前往腾讯云社区,获取更多腾讯海量技术实践干货哦~ 作者:周景超 在上一期中介绍了我们团队部分已公开的国际领先的研究成果,近期我们有些新的成果和大家进一步分享. 1 人脸进展 人脸是最重要的视觉信息之一.以貌识人.以貌取人是人的本性,也是最自然.最常用的身份确认和交互方式之一.互联网和移动互联网上每天上传和传播的天文数字级别的照片中有很大一部分都是和人脸相关的(比如国际知名互联网公司Facebook每天都有亿级以上的海量人脸照片和视频上传),因此人脸检测与识别技术在学术界和工业界都备受关注

AI时代:推荐引擎正在塑造人类

We shape our tools and afterwards our tools shape us. ------Marshall McLuhan 麦克卢汉说:"我们塑造了工具,反过来工具也在塑造我们." 我本人不反感AI,也相信人工智能会开创一个伟大的时代,但是我们要思考一些东西,至少知道那是什么.本人旨在让你了解当前人工智能应用最普遍的智能推荐引擎(Intelligent Recommendation Engine),其背后的设计理念,以及一些更深度的思考.关于理念,它不像技

腾讯副总裁姚星:腾讯AI Lab将致力打造通往AGI之路

背景:3月15日,腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗.游戏.多媒体内容.人机交互等四大领域的跨界研究与应用.全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与交流. 今天,腾讯副总裁姚星在腾讯AI Lab主办的第二届学术论坛上表示,AI Lab未来将致力于发展通用人工智能(AGI, Artificial General Intelligence),通过攻克通用人工智能这一难题,使AI技术和应用能够克服目前仍处于早期阶段的各种局限. 姚星表示,当前人工智能的发

AI+游戏:高效利用样本的强化学习 | 腾讯AI Lab学术论坛演讲

3月15日,腾讯AI Lab第二届学术论坛在深圳举行,聚焦人工智能在医疗.游戏.多媒体内容.人机交互等四大领域的跨界研究与应用.全球30位顶级AI专家出席,对多项前沿研究成果进行了深入探讨与交流.腾讯AI Lab还宣布了2018三大核心战略,以及同顶级研究与出版机构自然科研的战略合作(点击 这里 查看详情). 腾讯AI Lab希望将论坛打造为一个具有国际影响力的顶级学术平台,推动前沿.原创.开放的研究与应用探讨与交流,让企业.行业和学界「共享AI+未来」. 彭健 美国伊利诺伊大学厄巴纳-香槟分校

腾讯技术工程 |腾讯AI Lab刷新人脸识别与检测两大测评国际记录,技术日调用超六亿

2017年12月18日,深圳 - 腾讯AI Lab研发的Face R-FCN和FaceCNN算法分别在国际最大.最难的人脸检测平台WIDER FACE与最热门权威的人脸识别平台MegaFace多项评测指标中荣膺榜首,刷新行业纪录,展现其在计算机视觉领域中,特别是人脸技术上的强劲实力. 研究上,目前腾讯AI Lab已通过arXiv平台发表论文公开人脸检测算法部分技术细节,促进企业与学界"共享AI"研究成果:应用上,该人脸技术已接入腾讯互联网+公共服务平台等多个应用场景,每日技术调用量超六