我们在上一篇文章中给大家讲述了一部分提高数据挖掘能力的办法。当然,这也只是从一个方面进行讲述的,还需要从多个角度才能够全面提高数据挖掘能力,下面我们就给大家讲述一下数据挖掘能力提高的其他方法。
首先,需要我们降低变量准备时间,这是因为数据挖掘中数据准备时间过长,企业除了考虑数据仓库建模,还需要考虑是否在此基础上建立一个数据挖掘的数据中台,我们必须了解数据中台的价值,数据挖掘中台属于数据中台的一部分,行业特性会比较明显,比如电商有电商的数据挖掘中台,运营商则有运营商的数据挖掘中台,只要你在某个行业数据挖掘做多了,变量准备做多了,这样我们自然会找到一些共性的东西,如果能把它们沉淀下来,就能降低变量准备时间,而建立数据挖掘中台涉及IT战略问题,对于传统被动型的数据管理机制流程都是挑战,比如要建立一支中台团队就不容易。由此可见,中台是一个十分重要的事物,了解了这些,我们才能够为提高数据挖掘能力做好准备。
然后就是通过运营保有挖掘资产,就目前而言,离网模型在某些企业做的次数会超过几十次,重做有很多理由,比如市场环境变了,原来模型不好用了等等,但重做意味着对原有投入资源的极大浪费,是最大的不敏捷。很多的企业在建设IT的时候都是重视建设,轻视运营,由于数据挖掘的模型受业务和数据变化的影响很大,随着时间推移效果下降是必然的事情,而且这个折损跟固定资产折损还不一样,很多折损虽然说还是能够正常使用的,但模型效果变差就意味着效益变差,模型更要拼运营能力。
从这个角度看,如果你觉得一个模型重要,就要把它当成一个产品,用产品化的思维去运营它,比如设置独立的模型经理,从用户、流量和效果等角度去持续的做提升,很多企业模型建完推广完了就撒手不管了,这注定了模型的悲剧。模型运营投入的代价是巨大的,一个有1000个挖掘模型的公司,负担和压力会非常大,这就需要我们重视模型和运营。
好了,在这篇文章中我们给大家讲述了两个提高数据挖掘能力的方法,在进行数据挖掘的时候,一定要重视模型的应用,这样我们才能够做好数据挖掘工作,进而提高自己的工作效率。
原文地址:https://www.cnblogs.com/CDA-JG/p/10277108.html