原论文在UMAP‘16。文章并没有太高深的模型,比较接地气;但其观点与结论很独到,并且在工业界具有很强的实际操作价值。
针对推荐系统的研究大多关注在挖掘用户并不知道但是却与其兴趣相关的物品。不过每个推荐系统所在的领域都有其各自的特点,本文所讨论的是电商领域的推荐系统,在电商领域中,给用户适当地推荐其过去曾经浏览过(或者消费过)的物品(reminders)同样具有一定的价值。
实验证明,在推荐结果中同时包含有reminders以及协同过滤(CF)等推荐方式的结果时,具有最好的效果。但是在推荐reminders时候也有很多需要改进的点:(1)如何避免太过明显的重复浏览的商品,避免已经无效商品(下架等);(2)如何推荐与用户当前购物需求相关的reminders。
首先,文章分析了用户对于电商网站的推荐内容中的reminders的接受度。以Zalando网站(一家欧洲的在线购物网站)为例,抽样了3000个重度用户,他们对18w+的商品有过310w量级左右的商品浏览记录,以及10w+的购买记录。对于这些用户,从日志中分析出有一下几个重要点:
1. 一个用户的购物session中平均有9次商品的浏览行为;平均每3次购物session会转化为一次购买行为。
2. 在推荐的商品中,有约1/10的商品是reminders,即用户之前已经浏览过这些商品;有约1/4的推荐列表中包含有至少一个reminders。
3. 在成功推荐的商品(在同一次session中,用户对该商品的点击浏览行为最终转化为购买行为)中,有约40%的商品为reminders。
4. 在用户最终转化成购买行为的reminders中,用户对这些商品在此前有过若干次的浏览行为。如下图所示:有成功推荐商品数与用户距离对该商品首次浏览时候的天数间隔的关系;以及成功推荐商品数与用户对该商品的浏览次数的关系。
5. 在一次购物session中,用户平均浏览的商品类目约为2.7个,说明用户在一次session中的意图还是比较有目的性的。
reminders的推荐策略
一个通用的流程是:
1. 获取用户在过去时间内有过浏览行为的商品集合,并从中筛选出哪些商品可以用作reminders。
2. 对这些reminders进行一定规则的过滤,并进行排序得到最终的reminders推荐结果。
排序的策略有:
1. Interaction Recency(IRec)
对某商品的浏览行为发生的时刻越接近,排序分越高。
2. Interaction Intensity(IInt)
对某商品的浏览行为发生的次数越多,排序分越高。
3. Item Similarity(ISim)
有过浏览行为的商品,与当前用户的购物意图(以当前实时浏览的商品来表示)越接近,排序分越高。
4. Session Similarity(SSim)
有过浏览行为的session,与当前用户的购物意图(以当前实时浏览的session来表示)越接近,排序分越高。然后再对排序较高的session中的商品进行IInt策略的重排序。
Feature-based Category Filtering
在电商领域,用户一般很少对相同类目下的商品进行重复购买,所以至少在一定时间间隔内,不应该给用户推荐与其之前已经购买过的商品属于相同类目的商品。
维护一个blacklist,对用户已经购买过的商品,将其类目加入到这个blacklist中,直至其又重新开始浏览该类目的商品再将其移出blacklist。
为了防止推荐商品太过于obvious,增加一个obvious gap的时间间隔,对于与当前时刻过近的时间段内用户浏览过的商品 ,我们不应当将其看作reminders。
版权声明:
本文由笨兔勿应所有,发布于http://www.cnblogs.com/bentuwuying。如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任。