RS chap1:好的推荐系统

一、什么是推荐系统

1.个性化推荐系统:从庞大的电影库中找几部符合你兴趣的电影供你选择。

2.推荐系统是帮助用户快速发现有用信息的工具。和搜索引擎不同的是,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为给用户的兴趣建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。搜索引擎和推荐系统是两个互补的工具,搜索引擎满足了用户有明确目的时的主动查找需求,而推荐系统能够在用户没有明确目的的时候,帮助他们发现感兴趣的内容。

3.长尾。传统的80/20原则(即80%的销售额来自20%的热门品牌),在互联网的加入下会受到挑战。长尾商品的销售额可能会超过热门商品所带来的销售额。主流商品代表了绝大多数用户的需求,而长尾产品往往代表了一小部分用户的个性化需求。因此如果需要提高销售额,就必须充分研究用户的兴趣。

4.推荐系统通过发掘用户行为,找到用户的个性化需求,从而将长尾神品准确 的推荐给需要他的用户,帮助用户发现他们很感兴趣但是很难发现的商品。

5.推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式推荐系统是自动联系用户和物品的一种工具。下图展示了联系用户和物品的常用方式,比如利用好友、用户的历史兴趣以及用户注册的信息等。

二、个性化推荐系统的应用

  1.个性化推荐系统需要依赖用户的行为和数据,一般都是作为一个应用存在于不同的网站中。

  2.个性化推荐系统的作用:(1)分析大量用户行为日志,给不同的用户提供不同的个性化页面展示,提高网站的点击率和转化率。

  3.推荐系统应用构成:

    (1)前台的展示页面

    (2)后台日志系统

    (3)推荐算法系统

  4.电子商务个性化推荐系统的标准用户界面

    

    (1)推荐结果的标题、缩略图以及求他内容属性:告诉用户给他们推荐的是什么

    (2)推荐结果的平均分:推荐结果的总体质量,代表了大部分用户对这本的看法

    (3)推荐理由。

    (4)相关列表推荐。亚马逊相关商品推荐列表有两种,一种是包含购买了这个商品的用户也经常购买的其他商品,另一种是浏览过这个商品的用户也经常购买的其他商品。相关推荐列表最重要的应用就是打包销售(cross selling)。即你在购买某个物品的时候,亚马逊会告诉你其他用户在购买这个商品的同时也会购买其他的几个商品,让你选择是否要同时购买这些商品,如果点击同时购买,如果你点击同时购买,则会把这几件商品同时打包,并且提供一定的折扣,然后卖给你。

  5.电影和视频网站。Netflix的电影推荐页面,从中可以看到NetFlix的推荐结果展示页面包含了以下的几个部分。

    (1)电影海报和标题

    (2)用户反馈模块:包括play(播放),评分和Not Interested(不感兴趣)3中

    (3)推荐理由:因为用户曾经喜欢过别的电影

  6.个性化推荐的成功应用需要两个条件。

     (1)存在信息过载。因为如果用户很容易的从所有物品中找到喜欢的物品,就不需要个性化推荐了。

     (2)用户大部分的时候没有明确的需求。因为如果用户有明确的需求,可以直接通过搜索引擎找到感兴趣的物品。

  7.音乐推荐有如下特点:

    (1)物品空间大。物品数很多,物品空间大

    (2)消费每首歌的代价很小

    (3)听一首歌耗时很少

    (4)物品重用率很高

    (5)用户充满激情

    (6)上下文相关

    (7)次序很重要

    (8)很多播放列表资源

    (9)不需要用户全神贯注

    (10)高度社会化

  8.社交网络中的个性化推荐技术主要用在3个方面:

    (1)利用用户的社交网络信息对个性化物品推荐

    (2)信息流的会话推荐

    (3)给用户推荐好友 

  9.个性化阅读

  10.基于位置的服务

  11.个性化邮件

  12.个性化广告

    (1)上下文广告

    (2)搜索广告

    (3)个性化展示广告

  13.推荐系统评测

    (1)完整的推荐系统存在3个参与方:用户、物品提供者和提供推荐系统的网站

    (2)预测的准确性是推荐系统领域的重要指标

  14.推荐系统的试验方法。主要有3中评测效果的实验方法:(1)离线计算;(2)用户调查;(3)在线实验

  15.离线实验由以下几个步骤构成:

    (1)通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集

    (2)将数据集按照一定的规则分成测试集和训练集

    (3)在训练集上训练用户兴趣模型,在测试集上进行预测

    (4)通过事先定义的离线指标评测算法在测试集上进行预测。

  16离线计算的优缺点:

    (1)优点:只需要从实际系统日志中提取数据集即可。不需要有对实际系统的控制权,不需要真实用户参与,可以快速直接地计算出来,可以方便快速的测试大量不同的算法。

     (2)缺点:无法计算商业上关注的指标;离线实验的指标和商业指标存在差距

  17.用户调查。需要一些真实用户,让他们在需要测试的推荐系统中完成一些任务。在他们完成任务时,需要观察和记录他们的行为,并让他们回答一些问题。最后需要分析他们的行为和答案来了解测试系统的性能。

  18.用户调查的优缺点。

    (1)优点:可以获得很多体现用户主观感受的指标,相对在线实验风险很低,出现错误后容易弥补。

    (2)缺点:招募测试用户的代价很大,很难组织大规模的测试用户,这会使得测试结果的意义不足。

  19.在线实验。

    (1)在完成那个离线实验和必要的用户调查之后,可以将推荐系统上线做AB测试,这将和旧的算法进行比较

    (2)AB测试是一种常用的在线评测算法的实验方法。

       思想:通过一定的规则将用户随机分成几组,对不同组的用户采用不同的算法,然后统计不同组用户的各种不同的评测指标比较不同算法,如可以统计不同组用户的点击率。通过点击率比较不同算法的性能

    (3)AB测试的优点:公平获得不同算法实际在线使得性能指标,包括商业上关注的指标。

    (4)AB测试的缺点:周期比较长,必须进行长期的实验餐能得到可靠的结果。切分流量是AB测试的关键,不同的层以及控制这些层的团队需要一个统一的地方获得自己的AB测试流量,而不同层之间的流量应该是正交的。

 

      

  

    

  

原文地址:https://www.cnblogs.com/bigdata-stone/p/10324255.html

时间: 2024-10-16 18:28:01

RS chap1:好的推荐系统的相关文章

明尼苏达推荐系统导论(第一课 欢迎来到RS)

一.RS介绍 1.显示评分:直接从用户来 隐式评分:从用户活动推测得到的 2.预测是偏好的估计,是预测缺失值,推荐是从其他用户推荐项目,是推荐感兴趣的项目. 3.协同表示利用其它用户的数据 二.欢迎来到本课程 1.TFIDF:overlap 重叠 2.taxonomy:分类研究 3.roadmap:路线图 4.ephemeral:短暂 5.交互推荐:Critique-based, dialog-based

【RS】使用浏览数据提升隐式推荐系统

[论文标题]Improving Implicit Recommender Systems with View Data(IJCAI 18) [论文作者]Jingtao Ding  , Guanghui Yu  , Xiangnan He  , Yuhan Quan ,Yong Li , Tat-Seng Chua , Depeng Jin  , Jiajie Yu  [论文链接]Paper(7-pages) [摘要] 大多数现有的推荐系统只利用主反馈数据,比如电子商务中的购买记录.在这个工作中,

【RS】Wide & Deep Learning for Recommender Systems - 广泛和深度学习的推荐系统

[论文标题]Wide & Deep Learning for Recommender Systems (DLRS'16) [论文作者] Heng-Tze Cheng, Levent Koc, Jeremiah Harmsen, Tal Shaked, Tushar Chandra,Hrishi Aradhye, Glen Anderson, Greg Corrado, Wei Chai, Mustafa Ispir, Rohan Anil,Zakaria Haque, Lichan Hong,

推荐系统——(一)经典论文文献及业界应用

转: http://www.360doc.com/content/14/0315/11/14268060_360747574.shtml http://semocean.com/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E7%BB%8F%E5%85%B8%E8%AE%BA%E6%96%87%E6%96%87%E7%8C%AE%E5%8F%8A%E8%B5%84%E6%96%99/ 列了一些之前设计开发百度关键词搜索推荐引擎时, 参考过的论文, 书籍, 以及调研过的

《转》推荐系统经典论文文献及业界应用

转载自http://semocean.com 列了一些之前设计开发百度关键词搜索推荐引擎时, 参考过的论文, 书籍, 以及调研过的推荐系统相关的工具:同时给出参加过及未参加过的业界推荐引擎应用交流资料(有我网盘的链接), 材料组织方式参考了厂里部分同学的整理. 因为推荐引擎不能算是一个独立学科,它与机器学习,数据挖掘有天然不可分的关系,所以同时列了一些这方面有用的工具及书籍,希望能对大家有所帮助. Survey方面的文章及资料 Adomavicius G, Tuzhilin A. Toward

基于Spark MLlib平台的协同过滤算法---电影推荐系统

基于Spark MLlib平台的协同过滤算法---电影推荐系统 又好一阵子没有写文章了,阿弥陀佛...最近项目中要做理财推荐,所以,回过头来回顾一下协同过滤算法在推荐系统中的应用. 说到推荐系统,大家可能立马会想到协同过滤算法.本文基于Spark MLlib平台实现一个向用户推荐电影的简单应用.其中,主要包括三部分内容: 协同过滤算法概述 基于模型的协同过滤应用---电影推荐 实时推荐架构分析     一.协同过滤算法概述 本人对算法的研究,目前还不是很深入,这里简单的介绍下其工作原理. 通常,

机器人--推荐系统(1)

430的目标是完成机器人的推荐系统,提高机器人回答问题的准确率,关于过程碰到的问题以及解决方案与大家分享一下,(请轻喷!) 那么这个推荐系统到底应该怎么做呢? 最开始的第一个思路是 根据用户 进入到ERP的模块 推荐该模块下的相关问题.其实就是根据用户的轨迹来推荐问题,这是一个思路但是不太完整.因为很有可能用户就从ERP的桌面就进入了机器人,但他实际要咨询的是销售系统的相关知识,那么此时的推荐就不太满足用户的咨询需求. 因此参考一些业界其他公司的做法,可以基于内容的协同过滤(Collaborat

推荐系统中常用算法 以及优点缺点对比

推荐系统中常用算法 以及优点缺点对比 在 推荐系统简介中,我们给出了推荐系统的一般框架.很明显,推荐方法是整个推荐系统中最核心.最关键的部分,很大程度上决定了推荐系统性能的优劣.目前,主要的推荐方法包括:基于内容推荐.协同过滤推荐.基于关联规则推荐.基于效用推荐.基于知识推荐和组合推荐. 一.基于内容推荐 基于内容的推荐(Content-based Recommendation)是信息过滤技术的延续与发展,它是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机 器

推荐系统-实战总结

推荐系统实战 这周看了推荐系统实战这本书,其中基本上介绍的比较全面,但是每一部分并没有十分深入,深入的精华全部都在下方的备注当中,备注中有很多的论文,可以进行进一步的学习. 首先回顾一下一些框架信息,在专门思考其中几个重要的部分: 3种联系用户和item的推荐方式: 1 根据用户的历史行为,表达过反馈的item进行item的预测,传统的itemCF 2 根据用户的历史行为,找到相似用户,进行预测, userCF 3 根据用户的喜好和个人信息,提取用户的特征,喜欢的物品的特征,进行预测.基本上就是