从风险管理的角度来看是否须要个性化推荐

一  背景

1、现今 ,个性化技术被广泛用于推荐系统 。 特别是基于用户的偏好数据进行个性化预測的

协同过滤算法,已被证是实际可行的。然而 在某种程度上我们并不知道个性化推荐是否总是

能优于非个性化推荐.《Performance of recommender algorithms on top-n recommendation

tasks》已证实基于热门的推荐也有相当好的效果。下图是Bayesian personalized ranking

和 popularity-based 推荐算法的结果比較(基于MovieLens的数据集)。

尽管总体上BPR算法占优 , 可是也有非常大的部分热门占优。三个图分别基于不同的推荐

结果精确度评定算法。

详细见Learning to Rank for IR的评价指标

2、从学习模式的角度来看 , 个性推荐能预測出用户的偏好。但会非常敏感 。非个性化推

荐相反。如何比較个性化推荐和非个性推荐?我们引入金融领域的风险管理的概念。我

们通过使用MPT(Modern Portfolio Theory)来对推荐列表(包含两种推荐算法)进行优化

。能够把推荐列表看作是一个投资组合(推荐列表的每个item相当于投资组合里面的股

票 , 某个item在列表中的位置能够觉得是投资组合中某个股票的权重)

二 推荐风险分析

1、基本定义

1)、投资组合:  投资组合是一个包括n个具有相应权重的item的集合 , 权重与item的

重要性相关。

2)、用户对投资组合 的偏好程度 , 某个用户对投资组合中item i的喜好程度由ru,i

表示

User 对投资组合的偏好程度的期望与方差

3)、对于某个用户来说,当且仅当满足例如以下关系时投资组合1优于投资组合二

4)、 有效边界

用来描写叙述一项投资组合的风险与回报之间的关系,在以风险为横轴。预期回报率

为纵轴的坐标上显示为一条曲线。全部落在这条曲线上的风险回报组合都是在一

定风险或最低风险下能够获得的最大回报
, 如图

最佳投资组合的查找
,  假设在给定投资组合的预期回报(mean)的情况下 。

那么就是在有效边界上找风险最
小的 点。

2
、两个投资组合的风险对照

拿经典的Bayesian personalized ranking (BPR)算法和popularity-based

recommendation (POP)对照分析

1)、用4 个典型的风险-回报 图 阐明个性化推荐与非个性化推荐之间

的关系

2)、须要三个层面来分析孰优孰劣

(1) 、物品层面:

须要计算出用户u与投资组合P中item i偏好程度的期望与方差;基于隐语

言模型的贝叶斯线性回归。

(2)、投资组合层面:

基于上一步的期望与方差。计算物品在投资组合中的权重(即排名)

(3)、两个投资组合比較层面;

採用mean-variance-aware switch algorithms进行终于的推荐选择

三 投资组合切换决策算法

1、单个item层面的评估,须要关注用户对item的偏好程序的期望和标准差。对于用

户对item评分的概率分布,在此使用probabilistic matrix factorization来建模,

先验分布
例如以下

后验分布;

用户对item评分的高斯分布为:

期望和方差为:

物品的相关性能够用 knn 或 皮尔逊相关系统算出

2、投资组合优化

主要关注投资组合中物品的权重优化分析。

以下又一次定义用户的投资期望 。 b是用户的风险规避系数 。

被减数是

期望。 凑数是方差乘以系数。

那么如今的期望-风险系统数就变成了二次曲线。有效边界与二次曲线的切点就

是该点的权重

3、选择算法

期望优先:

风险优先:

等其他算法

这仅仅是初读论文。兴许会跟进对应的推导过程解析

引用论文  To personalize
or not: A risk: management perspective

时间: 2024-10-25 00:33:03

从风险管理的角度来看是否须要个性化推荐的相关文章

从jvm的角度来看单例模式

最近在看jvm,发现随着自己对jvm底层的了解,现在对java代码可以说是有了全新的认识.今天就从jvm的角度来看一看以前自以为很了解的单例模式. 了解单例模式的人都知道,单例模式有两种:"饿汉模式"和"懒汉模式". 引用一段网上对这两种模式的介绍: "饿汉模式的特点是加载类时比较慢,但运行时获取对象的速度比较快,线程安全.饿汉式是线程安全的,在类创建的同时就已经创建好一个静态的对象供系统使用,以后不在改变.懒汉模式的特点是加载类时比较快,但是在运行时获取

从程序员的角度来看为什么我们需要工作流

每一个程序员,在接触到工作流的时候,都会有这么一个疑问--我用一般的方法可以实现,为什么还要用工作流? 我曾经也问过这个问题,不过现在稍微有点明白了.别着急要答案,看过下面的例子,或许你也就明白一些了. 这是一个简单的业务--订货流程: 客户提交采购订单 业务员执行订单处理 如果缺货,转工厂生产 仓库出货 物流发货 如果不使用工作流技术,从头开始开发这个订购流程的业务逻辑,我们需要: 每个活动点都需要开发交互页面和后台处理程序 每个活动的流转都需要硬性判断下一步活动节点及其操作人 每次操作都需要

从统计学角度来看深度学习(2):自动编码器和自由能

从统计学角度来看深度学习(2):自动编码器和自由能 原文链接:http://blog.shakirm.com/2015/03/a-statistical-view-of-deep-learning-ii-auto-encoders-and-free-energy/ 作者:Shakir Mohamed  翻译:钟琰    审校:何通    编辑:王小宁 本文得到了原英文作者Shakir Mohamed的授权同意,由钟琰翻译.何通审校.感谢他们的支持和帮助. 基于前馈深度神经网络的判别模型已经在许多

从统计学角度来看深度学习(1):递归广义线性模型

从统计学角度来看深度学习(1):递归广义线性模型 原文链接:http://blog.shakirm.com/2015/01/a-statistical-view-of-deep-learning-i-recursive-glms/ 作者:Shakir Mohamed        翻译:王小宁      审校:冯凌秉  朱雪宁   编辑:王小宁 本文得到了原英文作者Shakir Mohamed的授权同意,由王小宁翻译.冯凌秉和朱雪宁审校.感谢他们的支持和帮助. 深度学习及其应用已经成为实用机器学

时间序列的自回归模型—从线性代数的角度来看

Fibonnacii序列求解通项的线性代数方法 ? Fibonacci的递归通项 \[F_n = F_{n-1} + F_{n-2} \] ? 递归的通项的矩阵形式 \[\left( \begin{matrix} F_{n+2} \F_{n+1} \end{matrix} \right) = \left( \begin{matrix} 1 & 1 \1 & 0 \end{matrix} \right) \left( \begin{matrix} F_{n+1} \F_{n} \end{ma

主打个性化推荐阅读的摘客,玩的是什么?

你的朋友圈是不是关注几十上百个微信公众号,每天打开来看的次数却少之又少?你是不是 每天去不同的牛逼哄哄的网站逛,看所谓的大流干货呢?你是不是想找感兴趣领域的专业技能,面对如此众多的平台,花费大量的时间和精力确也看花眼呢? 在如今资本市场寒冬的舆论下,摘客依然迈进了个性化推荐聚合阅读的领域.众所周知,“今日头条”作为主打个性推荐的聚合阅读产品,已经成功累计了大批的用户,且在这个同质化泛滥的应用海洋,摘客为什么要飞蛾扑火呢? 大部分主打个性化推荐阅读产品,大多遵从传统媒体的主流分类,涵括社会.时政.

聊聊淘宝天猫个性化推荐技术演进史

引言:个性化推荐技术直面用户,可以说是站在最前线的那个.如今,从用户打开手机淘宝客户端(简称"手淘")或是手机天猫客户端(简称"猫客")的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅.本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史. 本文选自[<尽在双11--阿里巴巴技术演进与超越>. 1.个性化推荐All-in无线 无线个性化推荐起步于2013年10月.现在往回看,当时的阿里很好地把握住了移动端快速发展的浪潮,以集团A

产品学习之个性化推荐和热度算法详解

今日头条的走红带动了"个性化推荐"的概念,自此之后,内容型的产品,个性化算法就逐渐从卖点变为标配. 伴随着"机器学习","大数据"之类的热词和概念,产品的档次瞬间提高了很多.而各种推荐算法绝不仅仅是研发自己的任务,作为产品经理,必须深入到算法内部,参与算法的设计,以及结合内容对算法不断"调教",才能让产品的推荐算法不断完善,最终与自己的内容双剑合璧. 本文以新闻产品为例,结合了我之前产品从零积累用户的经验,整理了作为PM需要了

互联网广告的个性化推荐平台设计--相关知识

人群分类模型 根据用户人群数据记录,建立人群属性分类模型,根绝用户特点,将用户标记为特定类别.据此进行精准定向服务,并进行效果评估.主要分类方法: 1.采用模糊数学综合判定理论,构建关系矩阵,判定类别属性的映射关系.采样真实数据,模拟真实数据分布,统计属性取值的概率分布,作为概率的估计值,另外,将广告类别的点击次数作为权重矩阵R.构建映射关系公式: R是关系矩阵,W是出现次数矩阵,C是计算结果的类别判定矩阵. 2. 采用分类器算法构建分类模型.根据数据特点,利用数据挖掘和机器学习 相关的分类器算