转化率预测项目失误总结

我们项目目标是要预测每个用户在点击广告后APP游戏和电商的转化率。期间两个半开发,从开始做到完成一共用了3个多月时候,完成了第一版转化率预测。从中的确学到了不少东西。学到的就不说了,就只提一下感觉做不好的地方。

失误1:不应该将电商和APP的数据混在一起。甚至完全可以先做类别比较平衡的APP数据,这个失误的后果是模型要预测两个任务,对模型所有的参数调整都要考虑对这两个任务的影响,往往是一个好一个不好。这对我们做第一版造成很大的精神压力,特别是还面临着交接和KPI的时候。更糟糕是APP是可以认为是类别平衡的数据,而电商是严重类别倾斜的数据,现在我怀疑是否电商的数据我们真的训练好了。

失误2:特征一开始就复杂了。我们有Doc特征,User特征,交叉特征。做前一版的同事已经证明了只用Doc特征是可以提高转化率的。我们并没有在实现中先使用Doc特征让系统run起来,相反,我们加入了过多的特征,我有三周多的时间,都是在写hadoop job去处理特征逻辑。如果我们只用Doc特征去训练,并行的做加入其它特征的工作,进度不会是三个月才出一个版本。

失误3:特征和参数的实验没有留下常人能理解的结果。先说特征,特征的加入,有很明显的随意性,没有通过实验说明特征加入的重要性,也没有认真的通过特征选择算法去确认。以致于我们第一个版本刚发布上去的时候,我们发现还没上一个版本好时都惊讶了,为什么有User特征还比没有User特征要差。再说参数,隐层的结点数,学习率,时间窗口的结果都不能用图来表示出来,后来我写PPT的时候很郁闷,没这些图,我怎么去搞升级面试,总不能临时造几幅图吧。就算不升级,给别人解释的时候,也不能傲慢的说一句,我实验出来的,但数据乱的很。

失误4:对线上工程的轻视。本来想着线上工程的工作是比较少的,算法搞完再搞也可以,但事实上线上工程也有不少事。我在写工程部分的代码时,才发现连Hash算法也无法解决Binarize时的速度问题,又只能把一部搞Binarize任务移到线下。并且还要写一些工具,数据同步,监控任务,其实花了不少时间。这些本可以在算法开发的时候就同步进行的工作。搞到最后,它反而成了项目完成时间的瓶颈,导致晚了两周。

失误5:外部原因。搜搜被卖后,搜索广告就和我们合并了,我们的转化率预测最后的主人就不确定了。渐渐的,我对转化率预测已经失去兴趣了,因为这个项目已经逐渐离开我了。我在工作中比较实际,可做可不做的事,那我当然是不做了,除非那工作很有意思。其实这也是我经常劝那些因为工作不爽就想辞职的同事的一个理由,通常,工作的变化要比你想的要大,要快。想想有多少公司消失了,多少部门解散了,多少领导离职了,真的就不能忍一下吗?

失误6:缺少更上层领导的支持。我从没听过我组长以上的领导问我们项目进度。没有领导的支持,这就不是一个重要项目,推动的时候会有阻力,你不可能让同事去冒发布风险去发一个他感觉都没听过的项目。并且别人的配合情绪也不高,人人天天听那么多项目,对别人来讲,只是又一个不知所云的项目而已。

时间: 2024-10-22 22:47:17

转化率预测项目失误总结的相关文章

大数据技术之_26_交通状态预测项目_01_数据模拟 + 数据采集 + 数据建模 + 数据预测 + 项目总结

一 项目背景二 项目架构与环境2.1 项目架构2.2 项目环境三 项目实现3.1 数据模拟3.1.1 数据结构3.1.2 编写代码3.1.3 测试3.2 数据采集3.2.1 编写代码3.2.2 测试3.3 数据建模3.3.1 编写代码3.3.2 测试3.4 数据预测3.4.1 编写代码3.4.2 测试四 项目总结 小段子分享:有个人姓铁,他不长头发,请问他得了什么病?答:老铁没毛病. 一 项目背景 该项目以车辆预测为基础,学习业务解决的方法论.学习完本项目后,可以解决如下问题或适用于如下业务场景

机器学习预测足球比赛项目——80%准确率

项目背景 FBP项目全称FootBallPrediction,历经9个月完成的足球比赛预测项目.项目结合大数据+机器学习,不断摸索开发了一款软件.软件根据各大博彩公司赔率多维度预测足球比赛结果(包含胜和不胜).机器学习用的是自己建立的“三木板模型”算法,已在国家期刊发表论文并被万方数据库收录(三木板模型算法论文地址:网页链接 搜索“基于机器学习的预测算法模型及其在环评领域的应用”).目前准确率可达80%.目前软件版本为14.0.FBP项目在Github网站已经有超过80人关注(网页链接),并在自

AI干货(一):为什么说基于机器学习的AI预测更智能?

在观远数据"AI+BI"的服务模式中,AI技术作为跨越敏捷分析到智能决策的关键推力,一直以来引起了众多企业客户的好奇与关注.因此我们推出了这一特别企划,希望借此机会与大家分享观远团队关于AI技术的各项认知,并结合我们与500强企业合作的最佳实践案例,为AI技术在零售行业落地提供建议指导.接下来,就跟着我们一起进入AI的神秘世界吧! 趋势 当下,人工智能已成为科技领域最热门的技术.机器学习.深度学习.人脸识别.无人驾驶.NLP,各种名词不绝于耳.人工智能的应用一方面在不断改变我们每个人的

数据挖掘项目之---通过对web日志的挖掘来实现内容推荐系统

先说一说问题,不知道大家有没有这样的经验,反正我是经常碰到. 举例1,某些网站每隔几天就发邮件给我,每次发的邮件内容都是一些我根本不感兴趣的东西,我不甚其扰,对其深恶痛绝.         举例2,添加具有某功能的一个msn机器人,每天都有几次突然蹦出一个窗口,推荐一堆我根本不想知道的内容,烦不烦啊, 我只好将你阻止掉. 每一个观众只想看他感兴趣的东西,而不是一下与之无关的事物,那么如何才能知道观众的兴趣所在呢,还是数据挖掘,经过一番思考,终于有点思路,即根据用户以往的浏览历史来预测用户将来的行

信息系统项目管理师计算题之挣值分析、完工预测

挣值法又称为赢得值法或偏差分析法.挣得值分析法是在工程项目实施中使用较多的一种方法,是对项目进度和费用进行综合控制的一种有效方法.挣值法的核心是将项目在任一时间的计划指标,完成状况和资源耗费综合度量.将进度转化为货币,或人工时,工程量如:钢材吨数,水泥立方米,管道米数或文件页数.挣值法的价值在于将项目的进度和费用综合度量,从而能准确描述项目的进展状态.挣值法的另一个重要优点是可以预测项目可能发生的工期滞后量和费用超支量,从而及时采取纠正措施,为项目管理和控制提供了有效手段. 变量: EV.PV.

“项目数据分析师”(CPDA)简介

项目数据分析师是以数据为依据,对项目现状及远期进行统计.分析.预测并转化为决策信息的专业人才.通过掌握大量行业数据,运用科学的计算工具,将经济学原理与数学模型结合,进行科学合理的定量分析,预测项目未来的收益及风险,为项目做出科学的投资与管理决策. 在国外,数据分析工作已广泛应用于经济发展的各个领域当中,无论是国家政府部门.企事业单位还是个人,数据分析工作都是进行决策和作出工作决定之前的重要环节,其分析结果的质量高低直接决定着决策的成败.随着我国经济决策由“经验决策”向“数据决策”的不断规范,越来

强化学习之智能出租车项目总结

项目介绍 这是优达学院机器学习课程的第4个实习项目,需要训练智能出租车学习交通规则,然后安全可靠地到达目的地.项目通过循序渐进的方式展开,从熟悉基本的领域知识开始,再以随机动作来直观感受智能车的状态,也是在这一步,让初学者有了心潮澎湃的感觉,"车终于动了!",是的,从0开始一路走来,以游戏闯关的方式,终于来到了4级,第一次体验了传说中的"智能"了,也许是"眼见为实"吧,小车在自己算法的控制之下行动,是一种很美好的感受.然后项目通过引导,让大家开始

为什么绝大多数项目经理在不断救火?

为什么绝大多数项目经理在不断救火? ★ 如何有效管控项目风险? -- 摆脱每天救火的苦逼现状 系列连载文章 分享要点 文章概述 第一部分:项目风险管理没有效果的三个主要原因 第二部分:如何做到有逻辑的识别项目风险 第三部分:能讲明白风险的来龙去脉,才能获得他人的支持 第四部分:只有能落实到"人"的风险应对措施才能发挥作用 本期分享要点   1.为什么项目风险管理大家做不到? 2.为什么绝大多数项目经理在不断救火? 3.项目风险管理失效的三个主要原因:漫无目的识别风险.讲不清楚风险是什么

项目可行性评估

项目正式开发前,需要对项目做出可行性评估,对项目的可行性评估是项目立项前的重要工作.上节就是从客户需求.产品服务.市场.竞争等方面让创始人对项目做了简单评估. 可行性评估的任务就是用最小的代价在尽可能短的时间内确定项目的可行性,有没有做的必要性.可行性评估一般是从技术可行性.经济可行性和操作可行性三个方面来考虑.可行性评估的成果是可行性研究报告,可行性研究报告模板参见附录1. 项目的可行性评估根据项目的规模和项目来源,可适当对评估项进行裁剪.国家计划或大中型投资类项目,评估项要满足GB/T 85