寒假学习进度01

常见的推荐系统的模型:协同过滤推荐模型、基于内容的推荐模型和混合推荐模型

推荐算法:

  1) 基于流行度的算法

    比如各种新闻,微博热榜,根据单页点阅率(PV),“访问次数”和“独立访客数(UV),或日均PV或收藏数等数据来按某种热度排序来推荐。这用于刚注册的用户,它无法针对用户进行个性化推荐.

  2)协同过滤算法

    分为基于用户和基于物品的算法,基于用户的原理:①.分析各个用户对item的评价(通过浏览记录、购买记录等)②依据用户对item的评价计算得出所有用户之间的相似度;③选出与当前用户最相似的N个用户;④将这N个用户评价最高并且当前用户又没有浏览过的item推荐给当前用户;基于物品的原理:①分析各个用户对item的浏览记录。②依据浏览记录分析得出所有item之间的相似度;③对于当前用户评价高的item,找出与之相似度最高的N个item;④将这N个item推荐给用户。

  3)基于内容的算法

    通过分析用户的行为以及新闻的文本内容,我们提取出数个关键字,将这些关键字作为属性,把用户和新闻分解成向量,之后再计算向量距离,便可以得出该用户和新闻的相似度了,

我们便可以引入词权的概念。在大量的语料库中通过计算(比如典型的TF-IDF算法),我们可以算出新闻中每一个关键词的权重,在计算相似度时引入这个权重的影响,就可以达到更精确的效果。

  4)基于模型的算法

    通过分析系统中用户的行为和购买记录等数据,通过对影响用户行为的各种特征属性,如用户年龄段、性别、地域、物品的价格、类别信息的记录,通过反复测试和经验,调整特征属性的组合,拟合出最准确的回归函数

  5)混合算法

    通过给不同算法的结果加权重来综合结果,或者是在不同的计算环节中运用不同的算法来混合,达到更贴合自己业务的目的。

注意:数次推荐后用户依然对某个标签毫无兴趣,我们就需要将这个标签降低权重,调整排序。

  6)基于关联规则推荐

    基于关联规则的推荐(Association Rule-based Recommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y,其直观的意义就是用户在购买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。

    

原文地址:https://www.cnblogs.com/zhao-teng-ass/p/12250463.html

时间: 2024-10-11 21:03:24

寒假学习进度01的相关文章

寒假学习进度02

日期:2020.01.15 博客期:124 星期三 嗯,把这几天学习进度汇总一下: 1.CSV文件.XML文件.JSON文件的处理整合 这一部分详细的让我明天把博客整理出来,你们就能看到了,不过这一部分代码,借鉴了好多其他博主的,我在此声明一下:数据的文件读写部分(除CSV文件外,其余两个)不是本博主原创,剩下的这三者之间的转换和前面构造好的BeanGroup类型的相互转换是自己写的.嗯,具体看下一篇博客吧! 2.数据爬取详细信息 嗯,爬取的话,现在是只能爬取一页上的所有信息,没能做到页面跳转继

学习进度01

第一周学习进度 由于这是这学期的第一周,不熟悉老师的教学风格和要求,学习量和博客量不多.   第一周 所花时间(包括上课)    代码量(行)    博客量(篇)    了解到的知识点  

2020年寒假学习进度(一)

由于下学期就要进行毕业设计答辩,打算这个寒假在家先继续巩固知识和学习新的技术要点,然后着力进行毕业设计的开发. 今天主要复习了一些关于javaweb的内容,总结如下: (1)WEB,也就是网页的意思,它用于表示Internet主机上供外界访问的资源.常用动态web资源开发技术:JSP/Servlet.ASP.PHP等 本人主要学习java运用于web开发的重要技术在Java中,动态web资源开发技术统称为Javaweb. (2)servlet/jsp: 这是SUN公司(SUN现在已经被Oracl

寒假学习进度三——安卓的一些基本组件

今天主要学习了安卓一些简单的组件,前两天都是按照案例(demo)敲的,对其中用到的组件不是特别的了解. TextView(文本框组件):主要用来显示文字的一些信息.通过修改TextView的属性可以改变文字的颜色,大小,位置.这个组件较比较简单,容易上手.这里就不过多叙述了. Button(按钮):是程序用于和用户进行交互的一个重要控件.Android Studio会对Button中的所有英文字母自动进行大写转换,你可以使用将textAllCaps属性改为false来禁用这一默认特性. Edit

2020年寒假学习进度第十天

今天主要学习了实验 7 Spark 机器学习库 MLlib 编程实践, 主要代码: import org.apache.spark.ml.feature.PCA import org.apache.spark.sql.Row import org.apache.spark.ml.linalg.{Vector,Vectors} import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator import org.apa

寒假学习进度03

日期:2020.01.17 博客期:126 星期五 这几天要准备离开家,出一趟远门,嗯~先把任务安排妥了,我最近由于需要还学会了一些简单脚本的制作,虽然也不难就是了.嗯~扯远了,今天干了什么呢?首先是把昨天的博客修补了一下,把JSON类的附加方法补了进去,将新的类图绘制并发布了.紧接着我在努力的使用C#编写成型的修改器,从网上翻遍了教程,那真的是难找啊!我做出来了发现还要做偏转,还有我的程序是64位的,它调用的方法是32位的,整在一起就是报错,唉~我找了这么多资源,真的有点儿绝望了,这才第几个小

寒假学习进度二

回家之后还是一如既往的一堆活需要干,前天写完进度二没有保存,就没有再发. 所以我从新捋一下思路,记得上次的内容有一个点,我相信初学linux 的同学都会有这个问题-----在linux 的系统中要配置hadoop首先会有配置文件内容这一步骤.然而Linux操作系统中文件的修改方式是完全不同于windows的. 以下是ubuntu中使用vi 命令修改文件并保存的实例: https://blog.csdn.net/guoqingshuang/article/details/81137587 我也是翻

寒假学习进度(一)

毕业设计进度: 今天毕业设计没有进行新功能的实现,改进了一下原有的安全帽和未佩戴安全帽的人数统计功能,使之更加符合现实中的工程要求.原有的人数统计是 统计每一帧中的佩戴安全帽的人和未佩戴安全帽的人,在每一帧中实时更新显示.但是这种人数统计没有多大意义,真正的统计,应该是统计给出一段视 频中的总佩戴人数和未佩戴人数,这种统计才符合现实中的工程要求. 但是要完成这却有不小难度,现在的深度学习检测识别算法都是将视频逐渐分解成每一帧,识别每一帧中的内容,但是怎样判断上下相连接的帧中相同物体 和不同物体的

寒假学习进度3

今天主要完成了pyqt库及相应工具的安装,以及简单的实现了界面功能. 开发工具IDE选择pycharm,因为之前就进行过python爬虫学习,所以IDE早就以及安装配置好了. 还有一点需要提的就是pyqt提供一个可视化工具叫QTDesigner,就像我们之前做过的C#一样,直接拖动控件完成界面布局就可以,省时间又省力气. 大致界面如下: 明天就要开始看考研网课了,界面开发可以先放一放. 原文地址:https://www.cnblogs.com/Aduorisk/p/12250056.html