推荐领域数据集

转自：http://blog.csdn.net/dajunxing/article/details/51357132，感谢分享！

http://www.grouplens.org/taxonomy/term/14

Movielens Dataset：

其中Movielens-100k和movielens-1M有用户对电影的打分，电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。

HetRec2011 Dataset：包括了movielens-2k、delicious-2k和last.fm-2k。

在movielens-2k中，电影的信息更加丰富了，有IMDB和Rotten Tomatoes的信息，具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息，当然还有打分信息。

在delicious-2k中，是用户对bookmark（书签）的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。

在last.fm-2k中，是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息（有weight）、用户对艺术家的tag信息、艺术家tag信息。

Wikilens Dataset

BookCrossing Dataset: 用户对书的打分信息，用户城市、用户年龄、书在Amazon的信息及url。

Jest Joker Dataset

Eachmovie Dataset

(下图摘自论文Recommender System Survey)

Flixster Dataset: 用户对电影的打分以及用户的friendship信息。 http://www.sfu.ca/~sja25/datasets/

Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。 http://www.trustlet.org/wiki/Epinions_datasets

Yelp Dataset: https://www.yelp.com/academic_dataset

Bibsonomy Dataset: 与delicious类似。http://www.kde.cs.uni-kassel.de/bibsonomy/dumps

Foursquare Dataset：Location-based 推荐。http://www.public.asu.edu/~hgao16/dataset.html

Epinions and Ciao Dataset：http://www.public.asu.edu/~jtang20/datasetcode/truststudy.htm

另外还有一些社交网络分析的数据集

http://snap.stanford.edu/na09/resources.html

http://snap.stanford.edu/data/

以上转自：http://www.cnblogs.com/startover/p/3261476.html

A Collection of Recommendation Data Sets & data sets crawled and used in our research work

Douban、Epinions (665K)、Epinions (510K)、Epinions (Extended)、Flixster、FilmTrust、Jester、MovieLens 1M、MovieLens 10M

http://www.librec.NET/datasets.html

时间： 2024-12-11 13:33:40

深度学习在搜索和推荐领域的应用

从手淘搜索到优酷短视频，阿里巴巴是如何在搜索推荐领域下应用深度学习的？

摘要:深度学习是一个既可以处理特征.学习特征又可以实现最后的排序打分的一套整体解决方案,借助深度学习的解决方案,搜索推荐的工作方式将发生巨大的变化.想知道阿里巴巴如何将在搜索推荐领域下应用深度学习技术的吗?想知道手淘和优酷搜索结果的个性化又是如何实现的吗?本文不容错过! 本节视频地址:http://click.aliyun.com/m/48161/ PDF下载:http://click.aliyun.com/m/49207/ 演讲嘉宾简介: 孙修宇(花名:翎翀),阿里巴巴机器智能技术实验室算法专

Mahout in action 中文版-2.推荐器的介绍-2.1~2.2

2?推荐器的介绍本章概要: ???????? Mahout中的推荐器 ?????????推荐器实战一瞥 ?????????推荐引擎精度与质量评估 ?????????基于一个真实数据集的测试:GroupLens 每天我们都会对一些喜欢的.不喜欢的甚至不关心的事物进行一些评价.这中行为往往是无意识的.你在收音机上听到一首歌,你可能会因为它的美妙或者难听而注意到它,也可能直接忽略.这样的情形也会非常普遍的发生在人们对于T恤.沙拉酱.滑雪场.发型.脸型或者电视节目. ???????? 尽管人们的口味多

物理学背景下的推荐与协同过滤的理解

物理学背景的推荐算法与协同过滤随着个性化推荐技术的发展,各种各样的推荐算法也竞相参与到这片新兴应用领域中进行开荒,一时间百花齐放,其中就有一些基于物理学背景的算法参与其中,本文阐述的是这篇文章在推荐算法上的主要内容,及其与传统的协同过滤算法在形式上的对比. 文章原名为<Solving the apparent diversity-accuracy dilemma of recommender systems>,要解决的正是当下推荐系统领域炙手可热的问题:怎样平衡推荐的精确度与多样性.作者的专

开源推荐系统软件

收集和整理了目前互联网上能找到的和推荐系统相关的开源项目(Open Source Software | Recommendation),罗列如下,希望对本领域感兴趣的朋友有帮助 SVDFeature 由上海交大的同学开发(开发语言C++),代码严谨.质量高,我们参加KDD竞赛时用过,很可靠和方便,而且出自咱们国人之手,所以置顶推荐! 项目地址: http://svdfeature.apexlab.org/wiki/Main_Page SVDFeature包含一个很灵活的Matrix Factor

关于asp.net 的强类型数据集（原创）

在网上找资料找了很多却发现很少有人使用net提供的强类型数据集的资料. 目前研究了一个月,做下整体总结. 首先强类型数据集,强在那里. 我们创建的数据集 dataset 如果我们用代码创建,由于没有对代码的表,字段进行强类型定义,我们必须知道表和字段的名字才能进行执行. 而用vs 建立的dateset 强类型数据集,其表与字段都已经进行强类型命名,其字段的数据类型都已经进行定义了,最好的是强类型的数据字段完全可以使用中文. 在使用的时候可以直接使用. 强类型数据集推荐将数据集建立在app_cod

协同过滤推荐算法的原理及实现

一.协同过滤算法的原理及实现协同过滤推荐算法是诞生最早,并且较为著名的推荐算法.主要的功能是预测和推荐.算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对用户进行群组划分并推荐品味相似的商品.协同过滤推荐算法分为两类,分别是基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based collaborative filtering).简单的说就是:人以类聚,物以群分.下面我们将分别说明这两类推荐算法

推荐领域数据集