推荐领域数据集

转自:http://blog.csdn.net/dajunxing/article/details/51357132,感谢分享!

http://www.grouplens.org/taxonomy/term/14

Movielens Dataset:

其中Movielens-100k和movielens-1M有用户对电影的打分,电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。

HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中,电影的信息更加丰富了,有IMDB和Rotten Tomatoes的信息,具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息,当然还有打分信息。

在delicious-2k中,是用户对bookmark(书签)的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。

在last.fm-2k中,是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息(有weight)、用户对艺术家的tag信息、艺术家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用户对书的打分信息,用户城市、用户年龄、书在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

(下图摘自论文Recommender System Survey)

Flixster Dataset: 用户对电影的打分以及用户的friendship信息。 http://www.sfu.ca/~sja25/datasets/

Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。 http://www.trustlet.org/wiki/Epinions_datasets

Yelp Dataset: https://www.yelp.com/academic_dataset

Bibsonomy Dataset: 与delicious类似。http://www.kde.cs.uni-kassel.de/bibsonomy/dumps

Foursquare Dataset:Location-based 推荐。http://www.public.asu.edu/~hgao16/dataset.html

Epinions and Ciao Dataset:http://www.public.asu.edu/~jtang20/datasetcode/truststudy.htm

另外还有一些社交网络分析的数据集

http://snap.stanford.edu/na09/resources.html

http://snap.stanford.edu/data/

以上转自:http://www.cnblogs.com/startover/p/3261476.html

A Collection of Recommendation Data Sets  & data sets crawled and used in our research work

DoubanEpinions (665K)Epinions (510K)Epinions (Extended)FlixsterFilmTrustJesterMovieLens 1MMovieLens 10M

http://www.librec.NET/datasets.html

时间: 2024-12-11 13:33:40

推荐领域数据集的相关文章

深度学习在搜索和推荐领域的应用

/* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林 深度学习在搜索和推荐领域的应用 大纲: ?深度学习在搜索领域的应用 –通用框架与抽象模型 –几种常见的DL搜索模型 –搜索周边功能 ?深度学习在推荐领域的应用 扫一扫关注微信号:"布洛卡区" ,深度学习在自然语言处理等智能应用的技术研讨与科普公众号.

从手淘搜索到优酷短视频,阿里巴巴是如何在搜索推荐领域下应用深度学习的?

摘要:深度学习是一个既可以处理特征.学习特征又可以实现最后的排序打分的一套整体解决方案,借助深度学习的解决方案,搜索推荐的工作方式将发生巨大的变化.想知道阿里巴巴如何将在搜索推荐领域下应用深度学习技术的吗?想知道手淘和优酷搜索结果的个性化又是如何实现的吗?本文不容错过! 本节视频地址:http://click.aliyun.com/m/48161/ PDF下载:http://click.aliyun.com/m/49207/ 演讲嘉宾简介: 孙修宇(花名:翎翀),阿里巴巴机器智能技术实验室算法专

Mahout in action 中文版-2.推荐器的介绍-2.1~2.2

2?推荐器的介绍 本章概要: ???????? Mahout中的推荐器 ?????????推荐器实战一瞥 ?????????推荐引擎精度与质量评估 ?????????基于一个真实数据集的测试:GroupLens 每天我们都会对一些喜欢的.不喜欢的甚至不关心的事物进行一些评价.这中行为往往是无意识的.你在收音机上听到一首歌,你可能会因为它的美妙或者难听而注意到它,也可能直接忽略.这样的情形也会非常普遍的发生在人们对于T恤.沙拉酱.滑雪场.发型.脸型或者电视节目. ???????? 尽管人们的口味多

物理学背景下的推荐与协同过滤的理解

物理学背景的推荐算法与协同过滤 随着个性化推荐技术的发展,各种各样的推荐算法也竞相参与到这片新兴应用领域中进行开荒,一时间百花齐放,其中就有一些基于物理学背景的算法参与其中,本文阐述的是这篇文章在推荐算法上的主要内容,及其与传统的协同过滤算法在形式上的对比. 文章原名为<Solving the apparent diversity-accuracy dilemma of recommender systems>,要解决的正是当下推荐系统领域炙手可热的问题:怎样平衡推荐的精确度与多样性.作者的专

开源推荐系统软件

收集和整理了目前互联网上能找到的和推荐系统相关的开源项目(Open Source Software | Recommendation),罗列如下,希望对本领域感兴趣的朋友有帮助 SVDFeature 由上海交大的同学开发(开发语言C++),代码严谨.质量高,我们参加KDD竞赛时用过,很可靠和方便,而且出自咱们国人之手,所以置顶推荐! 项目地址: http://svdfeature.apexlab.org/wiki/Main_Page SVDFeature包含一个很灵活的Matrix Factor

关于asp.net 的强类型数据集(原创)

在网上找资料找了很多却发现很少有人使用net提供的强类型数据集的资料. 目前研究了一个月,做下整体总结. 首先强类型数据集,强在那里. 我们创建的数据集 dataset 如果我们用代码创建,由于没有对代码的表,字段进行强类型定义,我们必须知道表和字段的名字才能进行执行. 而用vs 建立的dateset 强类型数据集,其表与字段都已经进行强类型命名,其字段的数据类型都已经进行定义了,最好的是强类型的数据字段完全可以使用中文. 在使用的时候可以直接使用. 强类型数据集推荐将数据集建立在app_cod

推荐决策 对比user-based 和item-based推荐算法

转自 :http://blog.csdn.net/hxxiaopei/article/details/7695740 推荐系统,整体上有三种方式: user->user->item, 推荐与其相同兴趣的用户喜欢的item,user-based user->item->item, 推荐与其喜欢的item相似的item,item-based user->item-feature->item,抽取用户喜欢item的特征,推荐具备这些特征的item, model-based 针

推荐算法学习笔记

推荐算法举个简单的例子,比如有个用户进来看了一堆内容,我们把他看的所有的历史行为,嵌入到推荐引擎当中去.这个推荐引擎就会生成个性化的频道,下次这个用户再登录,或者都不用下一次,过几分钟之后,他看到的内容就会根据他最近发生的历史行为发生变化,这就是推荐系统的基本逻辑.这种方法叫基于用户行为的推荐,当然是有一定局限性的.比如你只有一个用户行为的时候,你就不知道他会不会看一个从来没人看过的内容,这其实就是长尾问题.当你可以积累越来越多的用户,用户的历史行为会有助于你对长尾内容的理解. 推荐系统本质是在

协同过滤推荐算法的原理及实现

一.协同过滤算法的原理及实现 协同过滤推荐算法是诞生最早,并且较为著名的推荐算法.主要的功能是预测和推荐.算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品.协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based collaborative filtering).简单的说就是:人以类聚,物以群分.下面我们将分别说明这两类推荐算法