从0开始做互联网推荐-以58转转为例

从0开始做互联网推荐【产品+算法+实现】

一、58转转简介

58旗下真实个人闲置物品交易平台

二、从0开始设计推荐产品框架

(1)首页推荐:提取用户画像,根据线下提取出的用户年龄、性别、品类偏好等在首页综合推荐宝贝

(2)宝贝详情页推荐:买了还买,看了还看类的关联宝贝推荐

(3)附近推荐:和首页推荐的差异在于,提高了地理位置的权重,地理位置不仅要包含当前地理位置,还需要包含常见活跃区域,例如家里、公司等

(4)搜索推荐:除了关键词全匹配,要考虑同义词、近义词、易错词、拼音等推荐,产品层面,提示“你是不是想找xxoo宝贝”

(5)召回推荐:在用户退出系统后,通过RFM模型做优惠券推送或者消息推送做客户挽留与召回

TIPS:什么是RFM模型?

RFM模型:根据用户最近一次购买时间Recency,最近一段时间的购买频度Frequency,最近一段时间的购买金额Monetary,加权得到的一个代表用户成交意愿的一个分值。

三、从0开始进行推荐策略实现

【用户画像】

根据用户填写的资料、用户历史行为(购买、收藏、喜欢、分享、评论、浏览等行为)、微信背后的用户画像,得到用户的特性画像:

年龄段 -> 推荐母婴、3C用品?

性别 -> 推荐母婴、美容保健用品?

手机型号 -> 推荐手机

活跃时间 -> 在这个时间段推送消息

品类偏好 -> 相关品类推荐

地域 -> 附近推荐

【如何构建画像】

(1)读取用户安装的应用程序列表构建画像

装有滴滴用户端 -> 没有车

装有滴滴司机端 -> 有车

装有CSDN -> 男性

装有美柚、美颜APP -> 女性

(2)用户行为日志

启动日志 -> 获取活跃时段

经纬度 -> 获取活跃地域

购买、收藏、喜欢、分享、评论、浏览-> 获取品类偏好

第三方数据 -> 完善用户画像

【宝贝画像】

58转转的宝贝都是非结构化的数据,比较难做统一的宝贝画像,只能细分品类的做宝贝画像,例如手机画像等。

【如何构建宝贝画像】

对于58转转来说,要做宝贝画像必须细分类别,可以分词词频统计配合人工review的方式画像,以鞋为例,画像可能为

单鞋

纯牛皮

尺码

适合春秋穿

女鞋

价格及变动

包邮

【标签化与个性化推荐】

画像完成之后,如何对用户进行宝贝推荐呢?

(1)给用户和宝贝画像完毕之后,要将每一个用户和每一个宝贝打上标签TAG

(2)统计用户uid所有购买、收藏、喜欢、分享、评论、浏览的所有宝贝ID集合set<bb-id>

(3)统计这些宝贝ID所有对应的TAG,使用加权打分的方式,可以根据频次统计出对各TAG的喜好程度

(4)对于所有宝贝,根据uid对各TAG的喜好程度,使用加权打分的方式,可以统计出对各宝贝的喜好程度

(5)排除已经购买、收藏、喜欢、分享、评论、浏览过的宝贝,其他宝贝按照打分高低推荐即可

(6)搜索推荐需要加上“搜索条件”,附件推荐需要加强“附近权重”

需要注意的是,个性化推荐的准确性,一定程度上依赖于历史行为数据的收集,对于新用户,在缺乏历史行为积累时,可以推荐“热度最高”的宝贝,未来再根据其历史行为,不断增强推荐的准确率。

【分类预测推荐】

一个用户对一个宝贝是否进行购买,可以抽象成一个0和1的分类问题,也可以抽象成一个购买概率的数学问题,可以构造分类模型来计算用户对每个宝贝的购买概率,将概率最高的作为推荐的宝贝。

为了实现分类预测推荐,需要:

(1)准备训练数据集,包含用户、宝贝、用户是否购买了宝贝等历史数据,需要注意的是,数据集应当覆盖尽可能多的用户(要包含所有TAG)和宝贝(要包含所有分类及TAG)

(2)构造训练分类模型

(3)根据模型训练的结果,计算每一个用户对每一个宝贝某买的概率

(4)按照概率排序,对宝贝进行推荐

【协同过滤推荐】

协同过滤,用过的人都知道,不一定效果最好,但几乎适用于所有的业务场景:当向用户A做协同过滤推荐时,可以先找到和他兴趣相似的用户群体G,然后把G喜欢的、并且A没有点击过的宝贝推荐给A,这就是基于用户的协同过滤。

为了实现系统过滤推荐,需要:

(1)准备训练数据集,根据每个用户对每个宝贝的喜好,构建喜好矩阵(这是一个非常稀疏的矩阵),根据用户对宝贝购买、收藏、喜欢、分享、评论、浏览的行为量化这个喜好

(2)构造系统过滤训练模型

(3)针对每一个用户,根据模型给出其喜好宝贝列表

在做协调过滤推荐时需要注意,较新的宝贝,由于大部分人都没有相关喜好数据,所以使用协同过滤推荐时,新宝贝比较难被推荐上去,这是协同过滤的缺点,需要综合其他推荐策略来解决。

以上内容均来自微信公众号“架构师之路”胡剑老师的文章,欢迎关注。

时间: 2024-11-02 09:10:33

从0开始做互联网推荐-以58转转为例的相关文章

从0开始做垂直O2O个性化推荐-以58到家美甲为例

从0开始做垂直O2O个性化推荐 上次以58转转为例,介绍了如何从0开始如何做互联网推荐产品(回复"推荐"阅读),58转转的宝贝为闲置物品,品类多种多样,要做统一的宝贝画像比较难,而分类别做宝贝画像成本又非常高,所以更多的是进行用户画像.分类预测推荐.协同过滤推荐等个性化推荐. 有些同学反馈,他们的产品是垂直类的O2O产品,分类单一,可以简单的实现宝贝画像,这类垂直O2O产品怎么从零开始做个性化推荐呢?这是本文要讨论的问题 一.58到家美甲简介 58到家有三大自营业务"家政&q

总结几点关于做互联网产品的思路

一.让用户用你的产品时赚到钱.像途家网,它的商业模式很简单,就是把空置的房子租给想旅游但不想住酒店的人,因中间没有房地产中介的参与. 二.像美拍那样,每个人用了它之后都觉得拍出来的照片很漂亮,让用户在使用产品过程当中非常开心,满足用户的虚荣心. 三.帮你的用户节省时间或者是消磨时间.这本身貌似一个矛盾,但大家看两个例子,一个是Uber,想用车可以不再打电话向租车公司订,很快地在UberApp上,直接叫到一辆附近的车,节省了时间.还有一个公司,就凭一款游戏就在美国纳斯达克上市了,做到10亿美元.这

如何准备启动敏捷-迭代0如何做?

??万事开头难! ??对于启动敏捷而言,启动前安排一个准备阶段将对顺利的开展第一个迭代很有帮助.整理了下文试图来说明如何准备启动敏捷. ??迭代0是指在启动敏捷开发前的准备工作阶段,迭代0一般的时间长度不超过所选择的迭代周期. 对于看板类做法,如果没有明确的迭代周期,那么建议不超过2周,为方便,将看板类的准备工作阶段仍然称为迭代0. (附带推荐-对于看板类做法,仍然推荐安排迭代用于回顾和定期展望等等活动) ??迭代0主要完成的任务是组建团队和准备团队工作环境,就具体事务整理了如下具体完成定义条目

雷军:曾日写300个高质量帖 做互联网需7字诀

腾讯科技讯(月古)4月7日消息,今天上午,小米创始人.天使投资人雷军在2012年中国互联网站长年会上表示,互联网不是技术,是一种观念,是一种方法论.概括就是“专注.极致.口碑.快”七字诀,自己正是用这七字口诀创办了小米,也帮助20多家公司创业. 在大会上,雷军称,此前,HTC王雪红宣称做精品,结果巴塞罗那展会上,HTC仍然是三款手机.这是他们不够专注,不够自信. “好的东西不怕抄袭.但小米的图标都达不到iPhone的水平.”雷军表示,口碑不是好,不是便宜,本质是超越用户的期望值.“之前几个月,因

怎么做互联网行业的顶尖高手

如果你是做技术类的工作,看天分和运气吧.技术类的东西,智商基本决定一切.像知乎这就有人说了,你努力到一定程度,你会发现,有些东西,不是光靠努力就可以解决的.在技术类的工作中个,那些不是靠努力来解决的东西,通常,是靠智商来解决的.到了那份上,你就会体验到智商的重要性.当然.还是有例外的.有时候,一些问题的解决,靠的就是运气.比如一些试错的,你运气好,一下子就避开了全部的问题.这时,往往有一招鲜.吃遍天的效果.但是,落到个人身上的概率,我觉得就不要指望了. 剩下的,看父母吧.其他类型的东西,要成为顶

zend studio 做前端推荐安装的插件

zend studio 做前端推荐安装的插件 1.Aptana插件代码提示 Zend Studio的aptana插件,解决了Zend Studio对前台代码支持不足的问题,而且在某些方面还比诸如dw优秀的功能特性,下面是安装完aptana插件后的一些配置,尤其是可以添加js库的 代码提示,很强大!对html,css,js代码提示功能,装上用了下,感觉不错. 官方下载网址:http://www.aptana.com/ 在线安装,location中输入:http://download.aptana.

欲哭无泪的p-value = 0.051 | 做几次重复能得到较低的p-value

欲哭无泪的p-value = 0.051 | 做几次重复能得到较低的p-value 已有 1469 次阅读 2017-12-15 14:12 |个人分类:RNA-seq|系统分类:科普集锦|关键词:RNA-seq| RNA-seq 本文转载自嘉因微信公众号,已获得授权.查看最新文章,敬请关注嘉因,微信ID:rainbow-genome 作者:小哈   来源:嘉因 60分万岁,多1分浪费 p-value = 0.051...... 场景一:做RNA-seq,做几次重复?应该做几次?发paper时认

oauth2.0在监控宝项目中的应用一例

云智慧(北京)科技有限公司邓超 说起oauth2.0,我相信很多人对其已经非常熟悉,并且已经应用在很多开放平台上,如新浪微博开放平台,腾讯微博开放平台等:下面我将我个人对于Oauth2的理解以及Oauth2在监控宝开放平台上的是如何运用的做一下简单的阐述,有说的不到位的地方还望指点. 一.什么是Oauth2.0 官方定义: OAuth(开放授权)是一个开放标准,允许用户让第三方应用访问该用户在某一网站上存储的私密的资源,而无需将用户名和密码提供给第三方应用. OAuth允许用户提供一个令牌,而不

5、Cocos2dx 3.0游戏开发找小三之测试样例简介及小结

重开发者的劳动成果,转载的时候请务必注明出处:http://blog.csdn.net/haomengzhu/article/details/27186557 测试样例简介 Cocos2d-x 为我们提供了十分丰富的测试样例,这些测试样例是在引擎开发过程中为测试引擎的正确性而编写的代码,同时也是演示引擎各个部分如何使用的良好示例. 打开Cocos2d-x根目录下build文件夹下的cocos2d-win32.vc2012.sln解决方案,设置其中的 cpp-tests 项目为启动项目,成功运行后