从风险管理的角度来看是否须要个性化推荐

一背景

1、现今，个性化技术被广泛用于推荐系统。特别是基于用户的偏好数据进行个性化预測的

协同过滤算法，已被证是实际可行的。然而在某种程度上我们并不知道个性化推荐是否总是

能优于非个性化推荐.《Performance of recommender algorithms on top-n recommendation

tasks》已证实基于热门的推荐也有相当好的效果。下图是Bayesian personalized ranking

和 popularity-based 推荐算法的结果比較（基于MovieLens的数据集）。

尽管总体上BPR算法占优，可是也有非常大的部分热门占优。三个图分别基于不同的推荐

结果精确度评定算法。

详细见Learning to Rank for IR的评价指标

2、从学习模式的角度来看，个性推荐能预測出用户的偏好。但会非常敏感。非个性化推

荐相反。如何比較个性化推荐和非个性推荐？我们引入金融领域的风险管理的概念。我

们通过使用MPT（Modern Portfolio Theory）来对推荐列表(包含两种推荐算法)进行优化

。能够把推荐列表看作是一个投资组合（推荐列表的每个item相当于投资组合里面的股

票，某个item在列表中的位置能够觉得是投资组合中某个股票的权重）

二推荐风险分析

1、基本定义

1）、投资组合: 投资组合是一个包括n个具有相应权重的item的集合 , 权重与item的

重要性相关。

2）、用户对投资组合的偏好程度，某个用户对投资组合中item i的喜好程度由ru,i

表示

User 对投资组合的偏好程度的期望与方差

3）、对于某个用户来说，当且仅当满足例如以下关系时投资组合1优于投资组合二

4）、有效边界

用来描写叙述一项投资组合的风险与回报之间的关系，在以风险为横轴。预期回报率

为纵轴的坐标上显示为一条曲线。全部落在这条曲线上的风险回报组合都是在一

定风险或最低风险下能够获得的最大回报
，如图

最佳投资组合的查找
，假设在给定投资组合的预期回报（mean）的情况下。

那么就是在有效边界上找风险最
小的点。

2
、两个投资组合的风险对照

拿经典的Bayesian personalized ranking (BPR)算法和popularity-based

recommendation (POP)对照分析

1）、用4 个典型的风险-回报图阐明个性化推荐与非个性化推荐之间

的关系

2）、须要三个层面来分析孰优孰劣

（1）、物品层面:

须要计算出用户u与投资组合P中item i偏好程度的期望与方差；基于隐语

言模型的贝叶斯线性回归。

（2）、投资组合层面：

基于上一步的期望与方差。计算物品在投资组合中的权重（即排名）

（3）、两个投资组合比較层面;

採用mean-variance-aware switch algorithms进行终于的推荐选择

三投资组合切换决策算法

1、单个item层面的评估，须要关注用户对item的偏好程序的期望和标准差。对于用

户对item评分的概率分布，在此使用probabilistic matrix factorization来建模，

先验分布
例如以下

后验分布;

用户对item评分的高斯分布为：

期望和方差为：

物品的相关性能够用 knn 或皮尔逊相关系统算出

2、投资组合优化

主要关注投资组合中物品的权重优化分析。

以下又一次定义用户的投资期望。 b是用户的风险规避系数。

被减数是

期望。凑数是方差乘以系数。

那么如今的期望-风险系统数就变成了二次曲线。有效边界与二次曲线的切点就

是该点的权重

3、选择算法

期望优先：

风险优先：

等其他算法

这仅仅是初读论文。兴许会跟进对应的推导过程解析

引用论文 To personalize
or not: A risk: management perspective

时间： 2024-10-25 00:33:03

从风险管理的角度来看是否须要个性化推荐的相关文章

从jvm的角度来看单例模式

最近在看jvm,发现随着自己对jvm底层的了解,现在对java代码可以说是有了全新的认识.今天就从jvm的角度来看一看以前自以为很了解的单例模式. 了解单例模式的人都知道,单例模式有两种:"饿汉模式"和"懒汉模式". 引用一段网上对这两种模式的介绍: "饿汉模式的特点是加载类时比较慢,但运行时获取对象的速度比较快,线程安全.饿汉式是线程安全的,在类创建的同时就已经创建好一个静态的对象供系统使用,以后不在改变.懒汉模式的特点是加载类时比较快,但是在运行时获取

从程序员的角度来看为什么我们需要工作流

每一个程序员,在接触到工作流的时候,都会有这么一个疑问--我用一般的方法可以实现,为什么还要用工作流? 我曾经也问过这个问题,不过现在稍微有点明白了.别着急要答案,看过下面的例子,或许你也就明白一些了. 这是一个简单的业务--订货流程: 客户提交采购订单业务员执行订单处理如果缺货,转工厂生产仓库出货物流发货如果不使用工作流技术,从头开始开发这个订购流程的业务逻辑,我们需要: 每个活动点都需要开发交互页面和后台处理程序每个活动的流转都需要硬性判断下一步活动节点及其操作人每次操作都需要

从统计学角度来看深度学习（2）：自动编码器和自由能

从统计学角度来看深度学习(2):自动编码器和自由能原文链接:http://blog.shakirm.com/2015/03/a-statistical-view-of-deep-learning-ii-auto-encoders-and-free-energy/ 作者:Shakir Mohamed 翻译:钟琰审校:何通编辑:王小宁本文得到了原英文作者Shakir Mohamed的授权同意,由钟琰翻译.何通审校.感谢他们的支持和帮助. 基于前馈深度神经网络的判别模型已经在许多

从统计学角度来看深度学习（1）：递归广义线性模型

从统计学角度来看深度学习(1):递归广义线性模型原文链接:http://blog.shakirm.com/2015/01/a-statistical-view-of-deep-learning-i-recursive-glms/ 作者:Shakir Mohamed 翻译:王小宁审校:冯凌秉朱雪宁编辑:王小宁本文得到了原英文作者Shakir Mohamed的授权同意,由王小宁翻译.冯凌秉和朱雪宁审校.感谢他们的支持和帮助. 深度学习及其应用已经成为实用机器学

时间序列的自回归模型—从线性代数的角度来看

Fibonnacii序列求解通项的线性代数方法 ? Fibonacci的递归通项 \[F_n = F_{n-1} + F_{n-2} \] ? 递归的通项的矩阵形式 \[\left( \begin{matrix} F_{n+2} \F_{n+1} \end{matrix} \right) = \left( \begin{matrix} 1 & 1 \1 & 0 \end{matrix} \right) \left( \begin{matrix} F_{n+1} \F_{n} \end{ma

主打个性化推荐阅读的摘客，玩的是什么？

你的朋友圈是不是关注几十上百个微信公众号,每天打开来看的次数却少之又少?你是不是每天去不同的牛逼哄哄的网站逛,看所谓的大流干货呢?你是不是想找感兴趣领域的专业技能,面对如此众多的平台,花费大量的时间和精力确也看花眼呢? 在如今资本市场寒冬的舆论下,摘客依然迈进了个性化推荐聚合阅读的领域.众所周知,“今日头条”作为主打个性推荐的聚合阅读产品,已经成功累计了大批的用户,且在这个同质化泛滥的应用海洋,摘客为什么要飞蛾扑火呢? 大部分主打个性化推荐阅读产品,大多遵从传统媒体的主流分类,涵括社会.时政.

聊聊淘宝天猫个性化推荐技术演进史

引言:个性化推荐技术直面用户,可以说是站在最前线的那个.如今,从用户打开手机淘宝客户端(简称"手淘")或是手机天猫客户端(简称"猫客")的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅.本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史. 本文选自[<尽在双11--阿里巴巴技术演进与超越>. 1.个性化推荐All-in无线无线个性化推荐起步于2013年10月.现在往回看,当时的阿里很好地把握住了移动端快速发展的浪潮,以集团A

产品学习之个性化推荐和热度算法详解

今日头条的走红带动了"个性化推荐"的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配. 伴随着"机器学习","大数据"之类的热词和概念,产品的档次瞬间提高了很多.而各种推荐算法绝不仅仅是研发自己的任务,作为产品经理,必须深入到算法内部,参与算法的设计,以及结合内容对算法不断"调教",才能让产品的推荐算法不断完善,最终与自己的内容双剑合璧. 本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了

互联网广告的个性化推荐平台设计--相关知识

人群分类模型根据用户人群数据记录,建立人群属性分类模型,根绝用户特点,将用户标记为特定类别.据此进行精准定向服务,并进行效果评估.主要分类方法: 1.采用模糊数学综合判定理论,构建关系矩阵,判定类别属性的映射关系.采样真实数据,模拟真实数据分布,统计属性取值的概率分布,作为概率的估计值,另外,将广告类别的点击次数作为权重矩阵R.构建映射关系公式: R是关系矩阵,W是出现次数矩阵,C是计算结果的类别判定矩阵. 2. 采用分类器算法构建分类模型.根据数据特点,利用数据挖掘和机器学习相关的分类器算