淘宝APP用户行为数据分析之一 —— 数据集介绍

UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,用于隐式反馈推荐问题的研究。

数据来源? 传送门

数据情况介绍:

UserBehavior.csv

本数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

数据集的每一行表示一条用户行为,由用户ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。

关于数据集中每一列的详细描述如下:

列名称 说明
用户ID 整数类型,序列化后的用户ID
商品ID 整数类型,序列化后的商品ID
商品类目ID 整数类型,序列化后的商品所属类目ID
行为类型 字符串,枚举类型,包括(‘pv‘, ‘buy‘, ‘cart‘, ‘fav‘)
时间戳 行为发生的时间戳

注意到,用户行为类型共有四种,它们分别是

行为类型 说明
pv 商品详情页pv,等价于点击
buy 商品购买
cart 将商品加入购物车
fav 收藏商品

关于数据集大小的一些说明如下

维度 数量
用户数量 987,994
商品数量 4,162,024
商品类目数量 9,439
所有行为数量 100,150,807

由于源数据量较大(3.41G),后续只对300万条数据进行处理,这部分数据中包含29178名用户的行为记录。

原文地址:https://www.cnblogs.com/ohou/p/12112261.html

时间: 2024-07-30 16:59:28

淘宝APP用户行为数据分析之一 —— 数据集介绍的相关文章

淘宝APP用户行为数据分析之二 —— 数据清洗

由于源数据量较大(3.41G),本文只对300万条数据进行处理 处理时间戳 异常日期处理 生成本地CSV文件 原文地址:https://www.cnblogs.com/ohou/p/12112206.html

做大数据时代的“淘宝”平台,IBM数据分析战略浮出水面

(上图为IBM研究人员在展示通过数据分析提高城市交通水平) 下个世纪是大数据的世纪,是从IT走向认知计算的时代.在IT时代成就了一家超级平台,这就是淘宝,而认知时代要做的是数据的生意,那是否有一个类似淘宝的超级数据平台呢?IBM正在做这件事情. IBM在全球布局了40多个基于Softlayer的数据中心,以Bluemix作为其主力云端开发平台, 在之上通过合作和收购网罗了从Twitter到The Weather Company以及这些年投入250亿美金收购的Cognos.SPSS.ILOG.Al

淘宝APP商品搜索API提取

@TOC 淘宝APP商品搜索API提取 业务部门反馈PC和WAP版的协议有访问频次限制,经测试APP端基本可以满足,因此,今天我们开始提取相应API. 流程 抓包:经过分析得知,此处为搜索相应接口 分别分析请求头及参数,分别封装成类: 请求头 @Data @Builder @NoArgsConstructor @AllArgsConstructor public class TaobaoHttpHeader { @Builder.Default private String utdid = Ra

#淘宝#复制分享宝贝内容,打开淘宝APP,自动弹出宝贝提示信息

场景描述: 淘宝复制连接,分享出去,比如复制到QQ好友,微信好友,一个宝贝信息,然后你朋友长按复制你分享它了的这个宝贝,当然打开手机淘宝时,自动会跳出宝贝的信息,点击确定可以直接进入宝贝详情 简单实现方式: - (void)applicationDidBecomeActive:(UIApplication *)application { NSString  *string = [UIPasteboard generalPasteboard].string; if (string) { UIAle

点击微信内网页a标签,直接跳转打开淘宝APP的方法如此简单

我提出过问题:https://segmentfault.com/q/10... 后来解决了.大概是这样的 点击微信里面的网页a标签,就可以跳转到预设的APP页面 不需要通过浏览器唤起APP 代码如下: <a href="https://t.asczwa.com/taobao?backurl=打开淘宝需要显示的页面链接">test</a> 新建html文件,复制上面代码保存上传到服务器测试 例如: <a href="https://t.asczwa

UINavigationController 自定义转场动画(模仿淘宝App跳转)

制作目的 想要自定义系统转场动画速度 放弃不顺畅的 NavigationBar 隐藏消失 干脆直接干掉每个页面的 NavigationBar,在使用 UINavigationController 管理的同时,每个页面的 NavigationBar 都使用自定义的 UIView, 这样既定制程度高又可以在不需要 NavigationBar 的页面无缝对接,包括一些之前 NavigationBar 动画也可以更轻松的利用自定义的 UIView 的适配动画来更灵活的实现 实现功能 可以设置一个自己认为

来谈谈那淘宝和微店的区别

线上线下结合来开店,让大数据分析现有的盈利模式,然而看看给PC零售业带来了怎样的商业生态的变革.我们简单的从三个模式上去谈一下: 1.产品模式 淘宝的产品就是把线下的集贸市场从一个人进去到最后出来的所有交易环节搬到了网上,思路非常清晰.其他的不谈,首先解决是开店成本降低,其次是交易安全和便捷兼具,把消费者的付款动作极度压缩.然后监测用户消费行为,大数据分85析. 2.用户模式 淘宝的用户是什么呢?是那些没钱开店的草根创业者.是个人都可以上来开一个店.因为就几行代码嘛.为什么教育淘宝做不起来,因为

淘宝优惠券最全攻略!省钱攻略!

工具/原料 淘宝APP 好券捕手APP 首先我们来说一下淘宝优惠券的由来! 淘宝优惠券分两种 一.公开优惠券 用户在淘宝店家店铺就可以直接看到的优惠券 二.卖家用于淘客推广的优惠券(这种券是不公开的,一般买家是看不到的) 卖家设置这种优惠券有以下几种意图 吸引站外流量(因为淘宝平台流量有限) 变相优惠给用户,刷销量 接下来就是重点!重点!重点! 如何如何用最低的价格买到你所需的东西!(淘宝优惠券) 第一步.首先我们打开淘宝APP 查我们所需的产品 1.搜索你需要的宝贝 2.打开宝贝 3.在宝贝详

“折叠”的淘宝二楼,何以《一千零一夜》叫板院线电影!

深夜,掏出手机玩淘宝下拉首页"上楼"去,别问为什么?我已经改追广告剧了,抢鲜看刚出炉的<一千零一夜>小片,已成为很多年轻人每周三.四最大的期待! 你永远想不到,那个文艺范大叔和他那顶帐篷在何时.何地以什么样方式出现,透着天方夜谭的魔幻,还带着一丝丝戒备与好奇,一旦味蕾顿开的精美食物摆在你眼前,烦心事.生疏感全抛到了九霄云外,要做的就是大饱口福,世间或许只有美食才有这等魅力! 故事听完了,还意犹未尽,OK!点击"我要吃",跳转到片中推荐的美食,买买买的效率