聊聊淘宝天猫个性化推荐技术演进史

引言:个性化推荐技术直面用户,可以说是站在最前线的那个。如今,从用户打开手机淘宝客户端(简称“手淘”)或是手机天猫客户端(简称“猫客”)的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅。本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史。

本文选自[《尽在双11——阿里巴巴技术演进与超越》。

1、个性化推荐All-in无线

  无线个性化推荐起步于2013年10月。现在往回看,当时的阿里很好地把握住了移动端快速发展的浪潮,以集团All-in无线的形式吹响了移动端战斗的号角。个性化推荐团队也是从All-in无线这一事件中孵化的。我们从零开始搭建了个性化推荐算法体系及个性化算法平台TPP。TPP这一个性化算法平台对个性化推荐团队的成长起到了至关重要的作用。基于TPP,个性化算法团队成员们验证算法的速度得到了极大的提高,优化算法的速度从而也得到了极大的提高。仅仅花了不到两个月的时间,个性化推荐的第一版算法就在“有好货” 中初露锋芒:结合基于主动学习的选品算法平台TSP,个性化推荐团队一举打造了“有好货”针对高端人群的优质导购体验。

  2014年,随着个性化推荐算法团队对业务问题有了更好理解,以及技术研发的深入,我们逐步开发并上线了排序引擎RTP、标签探索算法PairTag及在线学习引擎Olive(如下图所示)等多项核心技术。个性化推荐算法也因此被快速地应用到“发现好店”、“爱逛街”、“猜你喜欢”及购物链路等手淘的各个主要场景中。其中,手淘底部的“猜你喜欢”商品瀑布流推荐是亿万用户每天登录手淘后必逛的场景,为人们搜寻和发掘自己喜好的商品提供了便捷的渠道。“猜你喜欢”也一举成为中国电商中最大的推荐产品。

                           Olive流程图

  正是在All-in无线后的这一年,个性化推荐开始在阿里逐步成长起来。

2、 个性化推荐初逢双11

  2015年,个性化推荐第一次在双11中大放异彩。还记得当年9月中旬,我们正在维也纳参加推荐系统最大的会议RecSys。逍遥子突然来电,告知在2015年双11上要全面开启个性化推荐,随行的同事们都很兴奋,但我们又不得不面临缺乏双11实战经验的实际问题。当然,机会和风险往往是并存的。面对挑战,我们很快开始规划进程和分工。回到杭州之后,团队全员进入备战状态,我们的努力在双11当天得到了回报。2015年11月12日凌晨,推荐算法团队、手淘及天猫的众多小伙伴们并不觉得疲乏,大家的脸上都闪烁着喜悦。个性化推荐算法在双11大放光芒,一个又一个令人瞠目的数字足以为证。个性化推荐的第一战场“双11主会场”更是自双11开展多年以来首次达到了个位数的跳失率,其引导人数和人均引导页面数都是前一年的2~3倍。不得不说,这些令人振奋的结果都要归功于之前两年中个性化推荐在无线端的落地。

  2015年双11主会场个性化算法(即“天坑一号”,如下图)包括三个层次:楼层顺序个性化、楼层内坑位个性化、坑位素材个性化。这三个层次自顶向下,在用户体验上形成一套完整的方案。其中:

  • 楼层顺序个性化使得女神看到的楼层顺序可能是女装、美妆、天猫国际等,欧巴看到的楼层顺序可能是男装、旅行、数码等。
  • 楼层内坑位内容个性化,使得在同一个楼层内,不同用户看到的商品或店铺不同,比如同样都是美食控,喜欢辣味的用户可能看见麻辣牛肉干,喜欢甜味的用户可能看见巧克力。
  • 坑位内容素材个性化,使得同一个楼层的同一个坑位,即便算法预测两个用户都需要巧克力,但一个喜欢费列罗而另一个喜欢德芙,也会在入口图上展示不同的品牌。                                  
    “天坑一号”个性化主会场示意图

这三层个性化中涉及多策略推荐算法、排序学习、合图等多项技术。整个项目的进展用六个字来总结就是“时间紧任务重”。在多个团队的辛勤工作及紧密协作下,我们第一次全方位地将自All-in以来所积累的个性化推荐技术用于如此复杂的场景之中。

  个性化推荐在“双11主会场”取得成功的因素有很多。其中,最值得称道的莫过于“首图个性化”。在指甲壳大小的空间上,我们对产品创意素材和文字进行精雕细琢和个性化投放。这一改变极大地提升了用户活跃度,并催生了2015年双11主会场的个性化项目。该项目的成功上线成倍地降低了会场跳失率。更重要的是,个性化推荐为用户带来了全新的无线端购物体验,并且为阿里在电商领域的茁壮成长带来了显著的助力作用。个性化推荐算法团队因此荣获2015年CEO特别贡献奖。下面引用阿里巴巴CEO逍遥子嘉奖信里的一段话:“这次双11的一大亮点是,我们基于大数据的无线产品和技术的创新,使得整个运营效率有了大幅度提升。淘系的活跃用户得到了充分的引导和互动,得到了大量个性化的展示和推荐,事实证明了大数据的巨大威力。我们用大数据赋能了双11,赋能了我们自己的运营能力。”

正是在2015年双11之后,个性化推荐的故事开始为人们津津乐道。

3、 个性化推荐再战双11

  2015年双11之后,个性化推荐团队乘风起航,继续发力。正是这一年的持续发展,使得个性化推荐在2016年双11中更进一步,遍及无线端的各个场景。包括主会场在内的几乎全部活动会场、产品都实现了个性化算法投放。个性化推荐团队的代表作“海神”以及“鲁班”(下图为鲁班批量生产的创意Banner)都是首次在双11中亮相。

            

                       鲁班批量生产的创意Banner

                       

  在2016年双11中,面对更为复杂的个性化需求,乐田及工程师们将全面升级后的个性化推荐完美地展现在双11主会场中。虽然2016年的双11主会场与2015年的“天坑一号”主会场极其相似,但这一次个性化推荐产品做得更为精细了。其中,GBDT+FTRL、Wide & Deep Learning和AdaptiveLearning这三项最前沿的机器学习技术被应用到了主会场的三层结构中,极大地提升了在线模型的效果及实时预测的效率。

  除了常规的个性化推荐之外,我们在2016年双11开始尝试融合商家流量分配的个性化推荐。逍遥子在2015年双11总结中提到:“我们还要更上一层楼,利用大数据赋能给所有的商家,帮助他们运营好消费者,这样才能让我们在大数据时代践行‘让天下没有难做的生意’的使命。”随着个性化场景的不断升级,商家很多时候都对流量的波动束手无策。对那些有运营能力的商家来说,我们希望其通过更多优质的商品和优秀的服务换来更多的流量或销量上的部分确定性。因为推荐各场景大小不一、定位差异大,有导购类场景、有成交类场景等,我们需要根据场景本身的特性来进行流量智能调控。因此,商家赋能个性化推荐系统
— Matrix应运而生。Matrix系统主要用于调节用户体验、卖家流量诉求和投资回报率、电商平台健康度等方面的效用,平衡场景的短期收益和长期收益。在2016年双11中,Matrix在部分场景的上线为今后的卖家赋能积累了宝贵的经验。

               

                      赋能商家的Matrix系统流程图

4、 个性化推荐的智能未来

  个性化推荐从无到有,直到演进成为CEO逍遥子口中的“电商基础设施”,这一切来得极为不易。面对更具挑战的未来,个性化推荐可以做得更好、更智能,而基于全局信息的个性化推荐将会是达成这一目标的重要途径。

众所周知,个性化推荐涉及多种不同层次、不同粒度的子任务。从推荐内容上来说,个性化推荐分为商品推荐、店铺推荐、品牌推荐、评论推荐等;从推荐目标上来说,个性化推荐分为点击率预测、转化率预测、成交量预测等。虽然我们当前设计的个性化推荐算法在TPP上实现了流程一体化,但我们对每个推荐场景面临的子问题却是单独建模的。如果能从全局的角度分析用户的喜好,个性化推荐必然能够更上一层楼。

  2016年,我们已经通过深度强化学习(Deep Reinforcement Learning)技术对全局信息共享下基于多任务学习  (Multi-task Learning)的个性化推荐进行了初步探索。从数据流通链路来看(比如下图所示的手淘场景数据流通图),我们可以很自然地将全链路多场景的推荐任务理解为推荐系统面向用户的连续决策过程。随着用户对不同推荐场景的持续浏览和交互,推荐系统对于用户实时需求和意图的理解会越来越清晰,因此也可以更准确地为用户推荐更为合适的内容。深度强化学习已经在人工智能领域掀起了新的浪潮,这一技术必将成为个性化推荐智能化的最强武器。

              

                       手淘场景数据流通图

5、 总结

  个性化推荐所取得的成就是一个“意料之外却情理之中”的结果。仅仅经历了短短几年的时间,淘宝和天猫就从以人工运营为主分配流量和资源位的方式成功转变为以大数据和人工智能为导向的新方式。与此同时,我们初步建立了人工经验与算法投放协同工作的机制。自2013年年底All-in无线以来的沉淀和积累终于逐步转化成了果实。经过不断地积累和打磨,个性化推荐技术变得越发成熟和犀利,相信个性化推荐的未来会更好。

  本文选自《尽在双11——阿里巴巴技术演进与超越》,点此链接可在博文视点官网查看此书。

                     

  想及时获得更多精彩文章,可在微信中搜索“博文视点”或者扫描下方二维码并关注。

                        

时间: 2024-10-07 06:55:18

聊聊淘宝天猫个性化推荐技术演进史的相关文章

淘宝天猫促销技巧分享,史上最全最完整的15种促销方式!

1.组合促销 2.定价促销 3.附加值促销 4.回报促销 5.纪念方促销 6.奖励促销 7.借力促销 8.临界点促销 文/变革电商 神圣.转载请备注出处与作者!! 9.另类促销 10.名义主题促销 11.时令促销 12.限定式促销 13.引用举例式促销 14.赠送类促销 15.指定促销

淘宝网采用什么技术架构来实现网站高负载的

2012-11-15 12:30 佚名 转载 字号:T | T 下面就结合淘宝目前的一些底层技术框架以及自己的一些感触来说说如何构建一个可 伸缩,高性能,高可用性的分布式互联网应用. AD: WOT2014:用户标签系统与用户数据化运营培训专场 时间过得很快,来淘宝已经两个月了,在这两个月的时间里,自己也感受颇深.下面就结合淘宝目前的一些底层技术框架以及自己的一些感触来说说如何构建一个可 伸缩,高性能,高可用性的分布式互联网应用. 相关专题:淘宝双11背后高并发技术讨论 一 应用无状态(淘宝se

CSDDN特约专稿:个性化推荐技术漫谈

本文引自http://i.cnblogs.com/EditPosts.aspx?opt=1 如果说过去的十年是搜索技术大行其道的十年,那么个性化推荐技术将成为未来十年中最重要的革新之一.目前几乎所有大型的电子商务系统,如Amazon.CDNOW.Netflix等,都不同程度地使用了各种形式的推荐系统.而近来以“发现”为核心的网站正开始在互联网上崭露头角,比如侧重于音乐推荐的八宝盒,侧重于图书推荐的豆瓣等等. 那么,一个好的推荐系统需要满足什么目标呢?个性化推荐系统必须能够基于用户之前的口味和喜好

淘宝天猫关键词SEO优化

淘宝天猫的网站完全像是一个成熟的搜索引擎,只是从google.bing.baidu改成了淘宝天猫而已,普通搜索引擎有品专,有皇冠,有PC,有无线:淘宝天猫里面有钻展,有直通车,也有PC,无线.搜索引擎是依靠竞价和热度来排名的,但是淘宝天猫却是完全依靠热度在排名,打开淘宝天猫的页面可以看到: 商品根据搜索关键词来进行展现,但是排序方式有这几种: 1.综合排序 2.人气排序 3.销量排序 4.信用排序 5.价格排序 系统默认的排序是综合排序,在其他情况不变的情况下,怎么通过优化关键词来将排名靠前呢?

淘宝双11促销背后高并发处理之淘宝网采用什么技术架构来实现网站高负载

转自:http://china-chill.blog.163.com/blog/static/2049210522012101782432304/ 时间过得很快,来淘宝已经两个月了,在这两个月的时间里,自己也感受颇深.下面就结合淘宝目前的一些底层技术框架以及自己的一些感触来说说如何构建一个可 伸缩,高性能,高可用性的分布式互联网应用. 一 应用无状态(淘宝session框架) 俗 话说,一个系 统的伸缩性的好坏取决于应用的状态如何管理.为什么这么说呢?咱们试想一下,假如我们在session中保存

淘宝优惠券是真的吗?教你怎么领取淘宝天猫内部优惠券

先领券,再下单.省钱不止一点点!  你购物,我掏钱.天猫淘宝任你选!  荐好友,领佣金.你省我省大家省!  一路省到底,微信号:vv33487 天猫购物券免费领取_什么是淘宝购物津贴 不用下载 APP,不用验证激活码很多人由于对淘宝优惠券不了解,对于刚接触淘宝优惠券的人来说,问这个问题是正常的.以上是针对天猫购物券免费领取_什么是淘宝购物津贴详细介绍 以前我也加了很多优惠券群,再里面也领过很多淘宝优惠券,还逛过"什么值得买" 逛丢”等这样购物资讯网站,也为自己家里增添了很多实用的小宝贝

淘宝天猫店如何做运营?看完这个思维导图你就知道了!

自2003年成立的淘宝网,时至今日已有16年了.在这一十六年的时间里,淘宝这一网络购物平台见证了许多起起伏伏,有人通过努力拼搏.正确的经营方法,获得了成功,但是同样也有人因为经营不善.错误的营销方式只能无奈黯然退场.但当时的他们都是在摸着石头过河,并不能像我们一样进行回望判断. 而今天的我们如果想要在淘宝这一平台上获得成功,已经不必像那些前辈一样摸着石头过河了.我们可以去参考许多前辈积累下的经验,尤其是那些在淘宝这一购物平台上获得成功的前辈高人们的经验. 今天为大家推介的这一本书--<淘宝天猫店

Python3中级玩家:淘宝天猫商品搜索爬虫自动化工具(第一篇)

Python3中级玩家:淘宝天猫商品搜索爬虫自动化工具(第一篇) 一.前言 大家好,今天我要来讲讲一个比较实用的爬虫工具,抓取淘宝的关键字商品信息,即是: 输入关键字,按照价格等排序,抓取列出的商品信息以及下载图片,并且支持导出为Excel. 如果如下: 看完下面的讲解,Python语言就掌握得差不多,中级水平了,而且这个封装后的工具还是很好用的. 感觉自己萌萌哒~~ 二.原理 大家知道什么叫爬虫,它也叫网络蜘蛛,机器人等,意思就是说自动的程序,可以去抓取使用网络协议传输的内容. 目前来讲爬虫主

Mac 无法打开淘宝,天猫,京东等

我的Mac Pro是新本,一直打不开淘宝,天猫,京东等购物网站,查了一下是DNS的问题,我把原有的DNS改成114.114.114.114,然后打开以上网页的速度就飞起来了. 修改DNS的步骤如下: 1.打开"系统偏好设置" 2.点击"网络" 3.点击"高级" 4.按照以下序号进行操作: 1.点击标号1位置DNS,如果3区域有内容,则全部选中然后点击标号2旁边的"-"(减号)删除 2.如果标号3区域无内容则直接点击"