推荐系统的评分描述

  比如,对一本书的评分,下面列出两个描述方式,前者是我所提倡的,括号里的是豆瓣现在采用的。

1分:我很不喜欢(很差)

2分:我不喜欢(较差)

3分:还行(还行)

4分:我喜欢(推荐)

5分:我非常喜欢(力荐)

  一个显然的区别是:前者是从主观出发的,后者则主要是基于客观情况的。前者表达了自己对对象的喜好程度,后者表达的是基于自己的评判尺度下对象的质量好坏。

  进而造成的区别是:从前者的情感诉求出发,得到的数据结果是反映对象之间类别的区别的;而从后者的情感诉求出发,得到的数据结果是反映对象之间质量的区别的。前者可以用来对对象进行分类,进而对人群进行分众;后者的分类只是对对象质量的高低分类。

  在书籍领域上述现象不算明显,因为看一本书的成本很大,我在看之前已经作好了题材上的区分:我喜欢什么样的所以我才去看什么样的。而对于电影、新闻这种大众化的素材,这种现象会很明显。我已经观察到用收藏与否来替换打分作为计算依据,效果不会相差太多。这就是说,推荐系统变成一个0-1系统,分值已经没有产生太大的影响。

  对于大部分用户,即使他不喜欢<红楼梦>,你提示说1分是“很差”,社会知识也会告诉他们不能这样做(以下衍生多种可能,请随意想像,比如1分变3分,比如收藏了不评分,再比如干脆不收藏了),但如果你提示说1分是“我不喜欢”,他会欣然而往。错误的解释系统会导致错误的推荐系统,尽管这似乎还不太明显,因为我们还没实现更好(没坐过宝马之前,每个人都会为夏利而欢呼,但我们需要进步)。

  推荐系统里,解释是很重要的,这包括推荐后的解释,还有不太为人所关注的:推荐前的解释。

  参考文献:http://www.wentrue.net/blog/?p=565

时间: 2024-07-31 20:48:59

推荐系统的评分描述的相关文章

基于近邻推荐的一些评分

摘自推荐系统 一.描述 有一些指标是可以通过近邻算法给出的 二.指标 1.预测用户u对新物品i的评分rw. 跟用户u相似的用户称为近邻,挑选出足够多的对物品i都评分的近邻用户,然后对新物品进行评分.公式: w代表其它用户和u的相似度,r代表用户v对商品i的评分.用|w|对公式进行标准化,防止负的评分值使得整体超出评分的范围 2. 原文地址:https://www.cnblogs.com/ylxn/p/10669653.html

【MIG专项测试组】如何准确评测Android应用的流畅度?

转自 腾讯Bugly 叶方正,2008年加入腾讯,就职于无线研发部[专项测试组].曾经负责多个产品的性能优化工作,积累大量的移动终端平台优化以及评测经验. 怎样获取SM值? 前文我们分析了通过测量应用的帧率FPS并不能准确评价App的流畅度(如何量化Android应用的“卡”?流畅度原理&定义篇),FPS较低并不能代表当前App在UI上界面不流畅,而1s内VSync这个Loop运行了多少次更加能说明当前App的流畅程度. 那么我们可以直接在App代码中通过Choreographer的回调Fram

Netflix推荐系统:从评分预测到消费者法则

原文链接:Netflix recommendations: beyond the 5 stars (Part 1), (Part 2) 原文作者:Xavier Amatriain and Justin Basilico 翻译:大魁 前言 Nexflix是一家提供在线视频流媒体服务和DVD租赁业务的公司,也是著名的Netflix大奖赛的发起者.如果读者希望进一步了解Netflix,建议读一下和讯上的一篇文章: Netflix:从传统DVD租赁向流媒体华丽转身 以及爱范儿上的: Netflix成功的

推荐系统本质是如何预测评分的问题

推荐系统的目标是向用户推荐他没有体验过的那些物品,没体验过的物品有很多,推荐哪一个呢,这需要预测用户对某个物品的评分,评分高的物品被推荐给用户,所以推荐系统的本质其实是一个预测问题.协同过滤会先算用户的相似度,然后把相似用户给物品的评分乘以两者的相似度,作为目标用户对物品的预测评分,预测评分大的加入推荐列表,说明协同过滤的最后还是预测. 矩阵分解也是预测问题,基于矩阵分解的推荐算法,简单入门 [我开始一直不明白矩阵分解和推荐系统有什么关系,后来理解了,矩阵分解就是为了预测稀疏(即包含很多未知数值

【甘道夫】通过Mahout构建推荐系统--通过IDRescorer扩展评分规则

通过Mahout构建推荐系统时,假设我们须要添?某些过滤规则(比方:item的创建时间在一年以内),则须要用到IDRescorer接口,该接口源代码例如以下: package org.apache.mahout.cf.taste.recommender; /** * <p> * A {@link Rescorer} which operates on {@code long} primitive IDs, rather than arbitrary {@link Object}s. * Thi

推荐系统(recommender systems):预测电影评分--构造推荐系统的一种方法:协同过滤(collaborative filtering )

协同过滤(collaborative filtering )能自行学习所要使用的特征 如我们有某一个数据集,我们并不知道特征的值是多少,我们有一些用户对电影的评分,但是我们并不知道每部电影的特征(即每部电影到底有多少浪漫成份,有多少动作成份) 假设我们通过采访用户得到每个用户的喜好,如上图中的Alice喜欢爱情电影,不喜欢动作电影,则我们将θ(1)设为[0,5,0],如此设置θ(2),θ(3),θ(4)的值,这样我们有了每个用户的θ的值以及他们对电影的打分,就可以推断出每部电影的x(特征)的值.

关于交易信用评分的分布形态描述

想研究网络交易中买家会对卖家进行信用评分的分布形态.但手头下并没有实际数据,在数据堂找到了关于对电影和5分评分数据,这个能做一个很好的模拟,很像eBay信用评分的反馈计分方式.为此就用此数据进行模拟,模拟在R中进行. 很长时间没用R了,关于R知识现在要逐步的拣起来.期间关于R的操作遇到如下问题: 1.源数据没有列命,重新对进行了命名.直接使用 names(mydata) <- c('user_id','item_id','rating','timestamp')进报错后,换成 colnames(

基于Spark MLlib平台的协同过滤算法---电影推荐系统

基于Spark MLlib平台的协同过滤算法---电影推荐系统 又好一阵子没有写文章了,阿弥陀佛...最近项目中要做理财推荐,所以,回过头来回顾一下协同过滤算法在推荐系统中的应用. 说到推荐系统,大家可能立马会想到协同过滤算法.本文基于Spark MLlib平台实现一个向用户推荐电影的简单应用.其中,主要包括三部分内容: 协同过滤算法概述 基于模型的协同过滤应用---电影推荐 实时推荐架构分析     一.协同过滤算法概述 本人对算法的研究,目前还不是很深入,这里简单的介绍下其工作原理. 通常,

Coursera在线学习---第九节(2).推荐系统

一.基于内容的推荐系统(Content Based Recommendations) 所谓基于内容的推荐,就是知道待推荐产品的一些特征情况,将产品的这些特征作为特征变量构建模型来预测.比如,下面的电影推荐,就是电影分为"爱情电影"."动作电影"一些特征来进行预测. 上述例子,将电影的内容特征作为特征变量X1,X2,这些电影特征是预先已知的,用户对电影的打分作为y值.比如一用户对100个电影都做了打分,那对于该用户就有了100个样本值,从而可以利用线性回归求解出该用户