亚马逊 协同过滤算法 Collaborative filtering

这节课时郭强的三维课。他讲的是MAYA和max 。自己对这个也不怎么的感兴趣。而且这个课感觉属于数字媒体。自己对游戏,动画,这些东西一点都不兴趣,比如大一的时候刚开学的时候,张瑞的数字媒体的导论课。还有就是秀霞的动画课,自己记录一下自己的思想
我在网上看见了这样一个说法,说的是跟着本科生导师做项目。就比如一个人说的,先找一个APP运行一遍,然后再这个基础上修改,各种的粘贴代码。是继续的做这个项目,还是学一点计算机的基础知识了。
开始写算法,亚马逊的协同过滤算法

第一:初次印象,进入一个网站的时候,可以看见你的最近在收缩一些什么东西。

提出问题:网易云音乐的推荐算法。 淘宝商品推荐算法,amazon发明的"喜欢这个商品的人,也喜欢某某"

算法的核心是:多维空间中两个向量夹角的余弦公式

collaborative filtering 分为两大类
1.先找到与你相似的人,看看他们买了什么东西,而你没有买的什么东西,那么就推荐给你。这个第一类方法的实现的核心是,多维空间两个向量夹角的余弦公式

2.第一个是郭强讲的矩阵

由一个简单的例子来引入问题
在第一类的方法中最大的问题就是判断并且量化两人的相似性。
例子:假如网易云音乐现在有3首歌曲,A,B,C
甲收藏了A歌曲,而拉黑了B,C
乙总是循环播放A, 而跳过B.听完C
丙跳过了A,主动播放了B,分享了C

依据上面可以看出,A和B比较相似

把这3首歌曲看成是三维空间的三个维度。 A歌曲是X轴 B歌曲是Y轴 C歌曲是Z轴
对歌曲的喜欢程度即是该维度上的坐标。现在量化喜欢程度(单曲循环=5 分享=4 收藏=3 主动播放=2 听完=1 跳过=-1 拉黑=-5)。那么每个人的口味就是一个向量。甲=(3,-5,-5)
乙=(5,-1,1),丙=(-1,2,4)
a*b=15+5-5=15 |a|=√(x1^2+y1^2+z1^2)=7.68 |b|=5.196
cosθ=a*b/(|a|*|b|) =0.3797
相应的甲和丙 a*b=-33 |c|= 4.582 cosθ=35.18976
第一个θ的值算出来,cos70=0.3420201433 第二个算出来接近是180度。知乎说:0度角,余弦的值是1,表示两个人完全想相同 180度角表示两个人完全的口味不相同
第一类算法的好处就是精准。缺点就是:运算量很大,对于新来的人,听的少,动作的少,也不太好用,那么就发明了第二类方法

时间: 2024-10-10 18:31:45

亚马逊 协同过滤算法 Collaborative filtering的相关文章

【转载】协同过滤(Collaborative Filtering)

Collaborative Filtering 协同过滤的主要目标:由于网络信息量的增多,用户往往被淹没在信息的海洋里,很难很轻易的找到自己感兴趣的topic.协同过滤就是为了把用户最可能感兴趣的信息推送给用户(Recommer system). 协同过滤的方法: model-base,user-base,item-base,content-base. user-based:搜集用户profile.对于一个active user,找到跟其比较接近(或者相似)的几个neighbour.使用这些ne

Spark机器学习(11):协同过滤算法

协同过滤(Collaborative Filtering,CF)算法是一种常用的推荐算法,它的思想就是找出相似的用户或产品,向用户推荐相似的物品,或者把物品推荐给相似的用户.怎样评价用户对商品的偏好?可以有很多方法,如用户对商品的打分.购买.页面停留时间.保存.转发等等.得到了用户对商品的偏好,就可以给用户推荐商品.有两种方法:用户A喜欢物品1,商品2和物品1很相似,于是把物品2推荐给用户A:或者用户A和用户B很类似,B喜欢商品2,就将商品2推荐给用户A.所以协同过滤分为两类:基于用户的协同过滤

Collaborative Filtering(协同过滤)算法详解

基本思想 基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买,收藏,内容评论或分享),并对这些喜好进行度量和打分.根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系.在有相同喜好的用户间进行商品推荐.简单的说就是如果A,B两个用户都购买了x.y.z三本图书,并且给出了5星的好评.那么A和B就属于同一类用户.可以将A看过的图书w也推荐给用户B. 基于用户协同过滤算法的原理图 所以,协同过滤算法主要分为两个步骤: 1.寻找相似的用户集合: 2.寻找集合中

如何解锁亚马逊A9的新算法?

亚马逊每一次变动总能在跨境圈里掀起一场场风波,最近A9算法的更新更是牵动着不少卖家的心. A9算法是亚马逊运行的内核算法,只要消费者在亚马逊上面搜索了商品,那么他就已经开始使用了A9算法,通过分析每一位客户的行为记录,亚马逊就可以尽可能精准的向消费者推荐其需要的商品. A9算法的核心 1.从大量的产品“目录”中选出相关的结果.2.将这些排序为“最相关”的结果推荐给用户. A9算法的影响因素 为了让客户能最快最精确的搜索到"想要购买的产品",亚马逊会分析每一个客户的行为并记录. 简而言之

推荐算法之基于物品的协同过滤算法

基于物品的协同过滤算法(ItemCF)是业界应用最多的算法,主要思想是利用用户之前有过的行为,给用户推荐和之前物品类似的物品. 基于物品的协同过滤算法主要分为两步: 1)计算物品之间的相似度. 2)依据物品的相似度和用户的历史行为给用户生成推荐列表. 第一步的关键点在于计算物品之间的相似度,这里并不採用基于内容的相似性,而是去计算在喜欢物品i的用户中有多少是喜欢物品j的,这样计算的前提是用户的兴趣爱好通常是比較确定的,不easy变,那么当一个用户对两个物品都喜欢的时候,我们往往能够觉得这两个物品

推荐算法之基于用户的协同过滤算法

协同过滤是推荐算法中最基本的算法,主要分为基于用户的协同过滤算法和基于物品的协同过滤算法. 这篇文章主要介绍基于用户的协同过滤算法,简单来说,要给用户u作推荐,那么只要找出那些和u之前的行为类似的用户,即和u比较像的用户,把他们的行为推荐给用户u即可.所以基于用户的系统过滤算法包括两个步骤:1)找到和目标用户兴趣相似的用户集合  2)找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户. 第一步的关键点在于计算用户之间的相似度,相似度一般通过Jaccard公式或者余弦相似度即可求

探秘推荐引擎之协同过滤算法小综述

数学大神.统计学大神和数据挖掘推荐大神请关注. 一.数学期望的理解 早些时候,法国有两个大数学家,一个叫做布莱士·帕斯卡,一个叫做费马.帕斯卡认识两个赌徒,这两个赌徒向他提出了一个问题.他们说,他俩下赌金之后,约定谁先赢满5局,谁就获得全部赌金.赌了半天,A赢了4局,B赢了3局,时间很晚了,他们都不想再赌下去了.那么,这个钱应该怎么分?是不是把钱分成7份,赢了4局的就拿4份,赢了3局的就拿3份呢?或者,因为最早说的是满5局,而谁也没达到,所以就一人分一半呢?这两种分法都不对.正确的答案是:赢了4

亚马逊——不一样的电商公司

其一: 电商公司就是电子商务公司.电子商务通俗的说就是利用电子工具进行各种商务活动,如网上购物.在线电子支付等.可以说电子商务是传统商业活动的电子化和网络化.离我们最近的就是网购了,通常我们会在淘宝.天猫.聚美优品.亚马逊等购物平台上购买东西,他们已然成为了我们生活的一部分.但我们不曾留意,他们分别代表着不同的电商公司,拥有不同的理念与策略.下面我们将通过与淘宝的对比,谈一下与众不同的电商公司亚马逊公司. 亚马逊公司,是美国最大的一家网络电子商务公司,于2004年进入中国.再他的发展史上有三次定

协同过滤算法原理介绍

协同过滤推荐算法是诞生最早,并且较为著名的推荐算法.主要的功能是预测和推荐.算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品.协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based collaborative filtering).简单的说就是:人以类聚,物以群分.下面我们将分别说明这两类推荐算法的原理和实现方法. 1.基于用