推荐系统常用测评指标

摘要：

　　1.用户满意度

　　　　在线测评方法

　　2.预测准确率

　　 2.1评分预测

　　 2.2TopN推荐

　　3.覆盖率（coverage）

　　4.多样性

　　5.新颖性　　

内容：

1.用户满意度

　　　在线测评方法：主要通过用户行为的统计（点击，停留时间，转化率）或者通过用户反馈（满意，不满意）

　　2.预测准确率

　　 2.1评分预测

　　　定义：预测用户对物品的评分的行为

　　　指标：
　　　　均方根误差（RMSE）：

　　　　平均绝对误差（MAE）：

　　　其中Rui是用户u对物品i的实际评分，hat(Rui)是推荐系统预测的用户u对物品i的预测评分；|T|是总记录数

　　 2.2TopN推荐

　　　定义：TopN推荐是通过给用户一个前N个喜好物品的推荐列表，TopN推荐的预测率一般通过准确率（precision）/召回率（recall）度量

　　　指标：

　　　　准确率：

　　　　召回率：

　　　　其中R(u)是根据用户在训练集中的行为给出的推荐列表，T(u)是根据用户在测试集中的行为给出的推荐列表

　　　　预测率：

　　　　 rate = Precision / Recall

　　3.覆盖率（coverage）

　　　定义：度量了一个推荐系统挖掘长尾商品的能力

　　　指标：

　　　　指标1：

　　　　其中U是用户集合，I是物品集合，R(u)是为用户u推荐的N个物品的集合

　　　　统计分布的指标：

　　　　信息熵：

　　　　，其中p(i)是物品i的流行度比上所有物品的流行度

　　　　基尼系数：

　　　　其中p(Ij)是降序的物品流行度字典的第j个物品的流行度

　　4.多样性（Diversity）

　　　　定义：推荐系统中物品两两之间的不相似性

　　　　指标：

　　　　　用户u的推荐列表R(u)的多样性：

　　　　，其中s(i,j)是物品i,j的相似度

　　　　　推荐系统的整体多样性：

　　　　　，即所有用户推荐列表多样性的平均值

　　5.新颖性

　　　　定义：给用户推荐以前没有接触过的物品的度量

　　　　指标：平均流行度（越高，新颖性越低）

我的python代码：https://github.com/Tongzhenguo/Python-Project/tree/master/recommendsys/measurement_index

时间： 2024-10-14 22:53:15

07-01 推荐系统常用度量指标

目录推荐系统常用评估指标一.RMSE 二.MAE 三.Precision(准确率)&Recall(召回率) 四.覆盖率五.信息熵六.基尼系数七.多样性八.获取各种评测指标的途径九.长尾分布更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬虫.人工智能教学等着你:https://www.cnblogs.com/nickchen121/ 推荐系统常用评估指标一.RMSE 加大了对预测不准的用户物品评分的惩罚. \[ \text{RMSE}=\s

必知-网站常用度量指标（2/2）

有好友对我说,你的文章太书面了,定义太多了,理解门槛太高了,会导致很多读者只是点开看看,哎,有这么一个东西,挺好挺好,但不会细读.我当时这么回复他:"有些书是给看懂的人阅读的,有些书是给最广泛的群体阅读的."西蒙认为,知识体系是有门槛的,比如相对论的学术体系,看懂的人真的不多.产品经理的职业目前鱼目混杂,耐不住寂寞,经不住诱惑,浮躁的心太多.这个职业的种种乱象是因为产品经理这个职业并没有一个标准的知识体系手册.西蒙没有大才,只希望在这个博客中写一些东西,为这个标准的知识体系做一些微薄的

大数据算法->推荐系统常用算法之基于内容的推荐系统算法

港真,自己一直非常希望做算法工程师,所以自己现在开始对现在常用的大数据算法进行不断地学习,今天了解到的算法,就是我们生活中无处不在的推荐系统算法. 其实,向别人推荐商品是一个很常见的现象,比如我用了一个好的商品,向朋友安利之类的.在以前广告系统不发达的时候,我们也是靠口口相传来进行商品的推广.那么为什么,现在推荐系统变的非常重要了呢?,在以前,我们的商品不像现在的物品一样琳琅满目,我们有时间,可以把商品都浏览一遍在进行选择,因为我们都想选择所有商品中最好的,而现在,由于资源的众多,我们不会用大把

【推荐算法工程师技术栈系列】推荐系统--数据效果与评估

目录推荐系统上线的基本条件 AB实验功能列表数据指标覆盖率 AUC及gAUC 指标展示指标监控人工评测附录推荐系统上线的基本条件一个新的推荐算法最终上线,需要完成上面所说的3个实验: (1)首先,需要通过离线实验证明它在很多离线指标上优于现有的算法: (2)然后,需要通过用户调查(或内部人工评测)确定它的用户满意度不低于现有的算法: (3)最后,通过在线等AB测试确定它在我们关心的指标上优于现有的算法. AB实验 (1)AB test 的好处是显而易见的,可以公平获得不同算法实

推荐系统常用测评指标