大客户流失模型数据项整理

可能面临的问题有:
大客户共享账号,行为数据可能不准,通过机器+人工的方式,要么去掉这部分的样本集,要么只取大客户本人的行为样本集(但是如果用户的ip不准怎么办),要么忽略
大客户可能玩过多个区服,只取充值最多的区服
为什么要精确到区服呢?因为玩家是在区服里玩的,玩家的单位是区服,为了真实反映玩家的行为规律,所以我们也要精确到区服。数据项里需要的聊天信息的个数、登录时间等,都是以玩家充值最多的区服的数据为准
游戏合服后,需要特别注意计算其他数据时,区服数据的过渡(从哪里获取合服时间数据呢?人工可以,查看公告)

数据项如下

用户基本属性
qid
充值总额
性别
年龄
省市(充值最多的地区)
登录过几个区服
主打区服(充值最多的区服)
QQ

角色属性
等级
角色职业

社交属性
好友数量
相关聊天信息个数
自己发送的负面信息个数(骂游戏、骂客服、骂玩家、不玩了等)
公会地位
论坛发言(难获取,可舍弃)
客服投诉

活跃属性
首次登录时间
最后一次登录时间
生命长度
最后一次保持在每周三天登录频率的登录时间(看最后一次活跃的登录时间)
最后一次在充值省市内登录的时间
是否已经流失
登录ip省市个数
是否存在账号共享
(对可能原主流失后 送人的账号 可以进行人工过滤)

第n周:
登录天数
平均每日首次登录时间段(小时)、首次登录小时的方差
末次登录的平均时间段、末次登录的小时差
(游戏内活跃任务完成率)

充值属性
第n周:充值总额、充值频率

首充金额
单笔最大充值
单笔最小充值额度

横向影响属性
表示的是游戏玩家的群体行为可能会影响单个玩家的行为,以下几项都是大客户所在区服的整体数据
第n周的:
活跃玩家的数量
付费情况
聊天信息条数
客服系统的投诉量

游戏产品自身属性
需要跟用户数据分开
第N周:
游戏是否更新
更新质量打分

大客户流失模型数据项整理

时间: 2024-10-14 15:12:31

大客户流失模型数据项整理的相关文章

学习盒模型的整理转述

前言:这是笔者学习之后自己的理解与整理.如果有错误或者疑问的地方,请大家指正,我会持续更新! 1. css盒模型有标准盒模型和IE盒模型,结构是:content.padding.border.margin. css3有个box-sizing属性,设置用哪种盒模型: box-sizing:content-box(默认)  标准盒模型: box-sizing:border-box IE盒模型: 用的比较多的就这两种. 页面中每个元素都被当成一个矩形盒子,占一定空间: 标准盒模型所占空间宽度=marg

css3弹性盒模型属性整理

display:box;是css3新添加的盒子模型属性,它的出现可以解决我们通过N多结构.css实现的布局方式.经典的一个布局应用就是布局的垂直等高.水平均分.按比例划分. 设置父容器样式display:box;  .father{ margin: 0 auto; width: 1000px; height: 200px; border:1px solid red; /* 设置父元素的显示方式 */ display: -webkit-box; /* Chrome ,Opera, Safari *

UML软件设计模型图整理

UML建模 程序设计ER图 UML建模(一)---UserCase用例图 UML建模(二)--流程图 (程序框图) UML建模(三)--部署图 UML建模(四)--类图 UML用例图.流程图 (五) 原文地址:https://www.cnblogs.com/liqianglog/p/11111807.html

Qt 学习之路:模型-视图高级技术

PathView PathView是 QtQuick 中最强大的视图,同时也是最复杂的.PathView允许创建一种更灵活的视图.在这种视图中,数据项并不是方方正正,而是可以沿着任意路径布局.沿着同一布局路径,数据项的属性可以被更详细的设置,例如缩放.透明度等. 使用PathView首先需要定义一个代理和一个路径.除此之外,PathView还可以设置很多其它属性,其中最普遍的是pathItemCount,用于设置可视数据项的数目:preferredHighlightBegin.preferred

流失预测模型的应用

流失预测模型的应用 一.概述 对于一个互联网企业来说,用户流失是一个不可避免的问题.一定范围内的用户流失率是可以被接受的,因为并不是所有的用户都是我们的目标用户.但是当用户的流失率超出我们的预期时,就应该思考用户为什么会离开?有没有办法预测出具有流失倾向的用户?并通过针对性的挽留工作避免其流失. 本文主要介绍对游戏行业用户流失情况进行数据挖掘的过程,通过对大量用户的历史数据进行分析处理,归纳出具有流失倾向的用户行为特征,然后利用Spark ML的随机决策森林算法建立分类模型,通过多次的交叉验证,

qt模型学习

# -*- coding: utf-8 -*- # python:2.x __author__ = 'Administrator' from PyQt4.Qt import * from PyQt4.QtGui import * from PyQt4.QtCore import * import sys,os #Qt 模型类 """ 在模型/视图中,模型提供了一个标准操作供视图和委托(view/delegate)来访问数据,由类QAbstractItemModel定义的 无论

整理的70道阿里高级Java面试题,都来挑战一下,看看自己有多厉害

整理的70道阿里高级Java面试题,都来挑战一下,看看自己有多厉害.1.java事件机制包括哪三个部分?分别介绍.2.为什么要使用线程池?3.线程池有什么作用?4.说说几种常见的线程池及使用场景.5.线程池都有哪几种工作队列?6.怎么理解无界队列和有界队列?7.线程池中的几种重要的参数及流程说明.8.什么是反射机制?9.说说反射机制的作用.10.反射机制会不会有性能问题?11.你怎么理解http协议?12.说说http协议的工作流程.13.http有哪些请求提交方式?14.http中的200,3

国内主流新一代用户行为分析系统选型过程分享

企业在选择用户行为分析工具时,大都不清楚如何选择适合自己业务的用户行为分析工具.笔者自己公司之前网站分析用百度统计APP分析用友盟,公司是做电商行业的,最近公司提出要精细化运营,用数据驱动业务增长,因此在10月份分别考察了国内做得比较出色的几家公司:数极客(阿里系).神策数据(百度系)和GrowingIO(LinkedIn系)三家公司的用户行为分析产品. 我在选型过程中将各家公司的功能和服务对比文档进行整理,从团队背景和产品定位.数据接入方式.定量分析功能.定性分析功能.二次开发与数据应用.服务

Knowledge Generation Model for Visual Analytics

1 摘要 可视分析使得人们能够分析大量的信息,为了支持复杂的决策和数据探索.人类作为一个中心的角色在知识产生的过程,从片段的证明到可视数据分析.虽然前者的研究提供了框架来产生这些过程,他们的范围通常聚焦很窄,所以他们不包含不同等级的不同视角.本文提供一个知识产生的可视分析模型,将这些分离的框架结合到一起,但是,仍然保留以前先进的模型(例如.KDD过程)来描述整个可视分析流程的个体片段.为了测试这个模型的有效性,用一个现实世界的可视分析系统来比较这个模型,证明当开发和评估这个系统,这个支持产生流程