个性化推荐中的用户兴趣建模浅析

http://in.sdo.com/?p=1386

引言

在互联网上,信息的数量越来越大。用户可以选择的面也越来越广,推荐系统的任务是,要从众多的资讯中,过滤并挑选出符合每个用户口味的内容,推荐给不同用户。在这个过程中,对用户兴趣的刻画、建模是最为重要的一环。

传统的用户兴趣刻画,大多集中于用户基本属性上,例如性别、年龄、职业、收入等,这样提取的用户属性,对用户兴趣的刻画并不够直接,对推荐系统来说,更需要一类直接面向待推荐内容的用户兴趣描述方法,并能方便的应用于个性化推荐系统,进行精准的个性化推荐。本文就此简单做些介绍,注意实际运用时会因地制宜进行更深入的改进。(文/陈运文)

符号标记方法(Notation)

本文中,约定 user代表用户,item代表被推荐对象,log代表用户点击的历史,tag代表标签(标签由一个或多个词汇构成,例如 范冰冰、曲棍球、美国职业篮球联赛等);category代表分类(例如 体育、娱乐、军事等);

实现步骤

1 用户点击行为的日志记录

2 基于点击行为,对用户兴趣进行建模,分为三部分进行挖掘,也是本专利的核心内容

3 基于上节生成的用户兴趣模型,进行个性化推荐

4 用户接收到个性化推荐结果后,点击反馈行为将被回收并记录到用户点击行为日志中,用户下一次循环时更新兴趣模型

点击行为记录

点击行为是后续的用户兴趣建模的数据基础。以系统日志的方式进行存储,记录有userid,itemid,时间,点击行为等

用户兴趣建模过程

用户兴趣建模从日志中提取近一段时间的用户点击行为后,对该用户点击的item(对象)进行一下的分析。首先从标签系统说起,因为标签(tag)是对item的一种灵活描述方法。(如下图是图书标签示例)

假定用户日志中,有N个item,分别为item1,item2…, itemN, 每个item携带若干个标签,如item1的标签为:tag1_1, tag1_2, tag1_3…

同样的,我们可以通过item所属的类别(category)来对用户进行建模刻画,例如采用贝叶斯(Bayers)的统计思想进行计算:

公式中,p(click)表示用户点击的概率,计算方法为: 用户点击的总数/用户被推荐的结果总数;P(category_i|click)表示类别category_i被点击的条件概率,计算方法为:属于该category_i的item被点击的数量/用户所有点击的item数量

与该用户的兴趣相似的其他用户,也可以作为用户兴趣建模的一部分。因为这些用户阅读的内容,也可以作为结果推荐给该用户。因此,用户兴趣建模的第三部分,是挖掘相似兴趣的用户并记录在用户兴趣模型中(user interest profile):

这样能形成User—>User—->Item的推荐过程,将下图中虚线框的部分存储起来,可以构成用户模型的一部分。如果有来自SNS的user间关系,则这里的sim计算可以更复杂一些。

用户兴趣建模和推荐过程

此处的个性化推荐从上面挖掘的3个来源来生成结果,分别是:

1根据user-tags关系,从item中,挑选其中有感兴趣tag的item,加入推荐列表

2 从用户感兴趣的category中,取出最新的item,加入推荐列表

3 用和用户兴趣相似的user中,取出最新观看的item列表,加入推荐列表

以上所有item合并起来,构成candidate item列表,为候选的个性化推荐结果,给用户。用户对这些item的点击情况,将返回到“用户点击日志”系统中,供下一次更新用户兴趣模型时使用。因为用户的兴趣往往是不断变化的,通过这样一套循环系统,能够不断的捕捉用户的兴趣点,让推荐结果保持优质

时间: 2024-10-20 00:21:11

个性化推荐中的用户兴趣建模浅析的相关文章

(8)个性化推荐中标签系统的建设

推荐系统的技术要点包括对用户行为以及用户信息数据化后的标签系统的建立.对于用户行为的分析.数据库的设计等.文章针对分析用户行为的标签系统的建设进行了详细的研究.推荐系统的标签系统主要分为三大模块,其一是建立资源的标签系统,其二是建立用户的标签系统,其三是这两个标签系统之间的关系,即如何通过用户标签系统中的数据从资源标签系统中提取出最优的资源链接并进行推荐.通过建立两个标签系统以及分析两个标签系统之间的关系,我们可以对推荐算法进行一些改进和调整,通过公式和属性加权的方式得到一个推荐的公式,从而将合

(7)个性化推荐中的隐语义模型

协同过滤是一种非常流行的推荐算法,通常协同过滤可以分为两种类型:邻域模型和矩阵分解模型.基于邻域的协同过滤算法包括基于用户的协同过滤算法和基于物品的协同过滤算法.隐语义模型是对矩阵分解的改进,通过矩阵分解建立了用户和隐类之间的关系,物品和隐类之间的关系 ,最终得到用户对物品的偏好关系.隐语义模型问世之后,诞生了若干对于隐语义模型的改进算法,包括基于标签的隐语义模型推荐算法,基于社交的隐语义模型推荐算法和基于时间的隐语义模型推荐算法等.为了推动基于隐语义模型的发展,下一步的主流研究趋势有标签,社交

互联网广告的个性化推荐平台设计--相关知识

人群分类模型 根据用户人群数据记录,建立人群属性分类模型,根绝用户特点,将用户标记为特定类别.据此进行精准定向服务,并进行效果评估.主要分类方法: 1.采用模糊数学综合判定理论,构建关系矩阵,判定类别属性的映射关系.采样真实数据,模拟真实数据分布,统计属性取值的概率分布,作为概率的估计值,另外,将广告类别的点击次数作为权重矩阵R.构建映射关系公式: R是关系矩阵,W是出现次数矩阵,C是计算结果的类别判定矩阵. 2. 采用分类器算法构建分类模型.根据数据特点,利用数据挖掘和机器学习 相关的分类器算

谷歌新闻个性化推荐

(未编辑完) 谷歌新闻有数百万的用户,聚合了>4500个新闻源的新闻数据,并把类似的新闻聚合在一起,个性化的展示给用户,假设用户点击一篇文章表明他对这文章感兴趣,(其实未点击一篇文章也不能说明他不对这样的文章感兴趣),由于用户众多,不同用户点击次数差异很大,有的仅仅点击了几篇,而有的点击数百数千文章.新的文章分秒不断的加入也是新闻推荐不同于其他推荐的特点. 新闻推荐的问题描述:给定N个用户,M篇文章,和每个用户的点击历史C,给每个用户推荐K篇他可能喜欢的文章.系统也需要通过用户的点击即刻反映出用

从风险管理的角度来看是否须要个性化推荐

一  背景 1.现今 ,个性化技术被广泛用于推荐系统 . 特别是基于用户的偏好数据进行个性化预測的 协同过滤算法,已被证是实际可行的.然而 在某种程度上我们并不知道个性化推荐是否总是 能优于非个性化推荐.<Performance of recommender algorithms on top-n recommendation tasks>已证实基于热门的推荐也有相当好的效果.下图是Bayesian personalized ranking 和 popularity-based 推荐算法的结果

CSDDN特约专稿:个性化推荐技术漫谈

本文引自http://i.cnblogs.com/EditPosts.aspx?opt=1 如果说过去的十年是搜索技术大行其道的十年,那么个性化推荐技术将成为未来十年中最重要的革新之一.目前几乎所有大型的电子商务系统,如Amazon.CDNOW.Netflix等,都不同程度地使用了各种形式的推荐系统.而近来以“发现”为核心的网站正开始在互联网上崭露头角,比如侧重于音乐推荐的八宝盒,侧重于图书推荐的豆瓣等等. 那么,一个好的推荐系统需要满足什么目标呢?个性化推荐系统必须能够基于用户之前的口味和喜好

个性化推荐入门

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用.同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法.本文作为这个系列的第一篇文章,将深入介绍推荐引擎的工作原理,和其中涉及的各种推荐机制,以及它们各自的优缺点和适用场景,帮助用户清楚的了解和快速构建适合自己的推荐引擎. 信息发现 如今已经进入了一个数据爆炸的时代,随着 We

聊聊淘宝天猫个性化推荐技术演进史

引言:个性化推荐技术直面用户,可以说是站在最前线的那个.如今,从用户打开手机淘宝客户端(简称"手淘")或是手机天猫客户端(简称"猫客")的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅.本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史. 本文选自[<尽在双11--阿里巴巴技术演进与超越>. 1.个性化推荐All-in无线 无线个性化推荐起步于2013年10月.现在往回看,当时的阿里很好地把握住了移动端快速发展的浪潮,以集团A

个性化推荐漫谈

如果说过去的十年是搜索技术大行其道的十年,那么个性化推荐技术将成为未来十年中最重要的革新之一.目前几乎所有大型的电子商务系统,如Amazon. CDNOW.Netflix等,都不同程度地使用了各种形式的推荐系统.而近来以“发现”为核心的网站正开始在互联网上崭露头角,比如侧重于音乐推荐的八 宝盒,侧重于图书推荐的豆瓣等等. 那么,一个好的推荐系统需要满足什么目标呢? 个性化推荐系统必须能够基于用户之前的口味和喜好提供相关的精确的推荐,而且这种口味和喜欢的收集必须尽量少的需要用户的劳动.推荐的结果必