从大数据的应用谈如何成为大数据大师的历程

以下数据显示,中国大数据IT应用投资规模,应用以五大行业最高,其中以互联网行业占比最高,占大数据IT应用投资规模的28.9%,其次是电信领域(19.9%),第三为金融领域(17.5%),政府和医疗分别为第四和第五,请看如下图:

根据国际知名咨询公司麦肯锡的报告显示:在大数据应用综合价值潜力方面,信息技术、金融保险、政府及批发贸易四大行业潜力最高,具体到行业内每家公司的数据量来看,信息、金融保险、计算机及电子设备、公用事业四类的数据量最大,因此:无论是投资规模和应用潜力来看,信息行业(互联网和电信)和金融行业都是大数据应用的重点行业。

例:证券行业大数据应用

大数据时代,券商们已意识到大数据的重要性,券商对于大数据的研究与应用正在处于起步阶段,相对于银行和保险业,证券行业的大数据应用起步相对较晚。目前国内外证券行业的大数据应用大致有以下三个方向:

第一方面:利用大众社交情绪指数数据来预测股票

华尔街的数学精英设计了社交情绪指数基金,其数据来源于人们在社交网络上每天早晨的情绪表达。基金购买的投资产品是经过投资银行家精挑细选的,同大众情绪相关度较高的股票。经过半年左右的测试,投资银行家发现社交情绪走势和股票基金的走势一致,相关度非常高。于是银行家将社交情绪指数基金投入实战,3个月就获得了十亿美元的收益。社交网络的情绪数据用在股票投资上,充分体现了大数据时代社交行为数据分析的商业价值。现在伦敦股票交易所大约有40%的股票基金是量化投资基金,投资决策来源于其背后的数学模型,社交网络的情绪指数也作为其中的一个重要输入数据。

第二方面:客户关系管理

(1)客户细分。通过分析客户的账户状态(类型、生命周期、投资时间)、账户价值(资产峰值、资产均值、交易量、佣金贡献和成本等)、交易习惯(周转率、市场关注度、仓位、平均持股市值、平均持股时间、单笔交易均值和日均成交量等)、投资偏好(偏好品种、下单渠道和是否申购)以及投资收益(本期相对和绝对收益、今年相对和绝对收益和投资能力等),来进行客户聚类和细分,从而发现客户交易模式类型,找出最有价值和盈利潜力的客户群, 以及他们最需要的服务, 更好地配置资源和政策, 改进服务,抓住最有价值的客户。

(2)流失客户预测。券商可根据客户历史交易行为和流失情况来建模从而预测客户流失的概率。如2012年海通证券自主开发的“给予数据挖掘算法的证券客户行为特征分析技术”主要应用在客户深度画像以及基于画像的用户流失概率预测。通过对海通100多万样本客户、半年交易记录的海量信息分析,建立了客户分类、客户偏好、客户流失概率的模型。该项技术最大初衷是希望通过客户行为的量化分析,来测算客户将来可能流失的概率。

 

例:基于大数据的精准营销一

采集和处理数据、建模分析数据、解读数据这么三个大层面。通过对客户特征、产品特征、消费行为特征数据的采集和处理,可以进行多维度的客户消费特征分析、产品策略分析和销售策略指导分析。通过准确把握客户需求、增加客户互动的方式推动营销策略的策划和执行。

1、数据层:采集和处理数据

大数据处理的数据类型包括:括图片、文本、网页、社交网络,还有传统的交易数据,不局限在传统采集数据的过程一般是有限的、有意识的、结构化的进行数据采集

2、业务层:建模分析数据

使用的数据分析模型,例如基本统计、机器学习、例如数据挖掘的分类、聚类、关联、预测等算法。

3、应用层:解读数据

数据指导营销最重要的是解读。传统一般是定义营销问题之后,采集对应的数据,然后根据确定的建模或分析框架,数据进行分析,验证假设,进行解读。解读的空间是有限的,而大数据提供了一种可能性,既可以根据营销问题,封闭性地去挖掘对应数据进行验证,也可以开放性地探索,得出一些可能与常识或经验判断完全相异的结论出来。可解读的点变得非常丰富。

例:基于大数据的精准营销二

美国T-mobiles采用Informatica - The Data Integration Company平台开展大数据工作,通过集成数据综合分析客户流失的原因,根据分析结果优化网络布局为客户提供了更好的体验,在一个季度内将流失率减半;韩国 SK telecom新成立一家公司SK Planet,通过大数据分析用户的使用行为,在用户做出决定之前推出符合用户兴趣的业务防止用户流失。美国AT&T公司将记录用户在Wifi网络中的地理位置、网络浏览历史记录以及使用的应用等数据销售给广告客户。比如当用户距离商家很近时,就有可能收到该商家提供的折扣很大的电子优惠券。

以上等等,例举出大数据的应用。

咱们国家在大数据方面刚刚起步,现阶段正是缺乏大数据人才之际,让我们紧跟技术潮流,走在别人的前面,现在正是学习大数据的最好机遇,不花一分钱就可以成为大数据高手,挑战自我,实现年薪50--100万的梦想。

王家林的第一个中国梦:免费为全社会培养100万名优秀的大数据从业人员!

您可以通过王家林老师的微信号18610086859发红包捐助大数据、互联网+、O2O、工业4.0、微营销、移动互联网等系列免费实战课程, 目前已经发布的王家林免费视频全集如下:

1,《大数据不眠夜:Spark内核天机解密(共100讲)》:http://pan.baidu.com/s/1eQsHZAq

2,《Hadoop深入浅出实战经典》http://pan.baidu.com/s/1mgpfRPu

3,《Spark纯实战公益大讲坛》http://pan.baidu.com/s/1jGpNGwu

4,《Scala深入浅出实战经典》http://pan.baidu.com/s/1sjDWG25

5,《Docker公益大讲坛》http://pan.baidu.com/s/1kTpL8UF

6,《Spark亚太研究院Spark公益大讲堂》http://pan.baidu.com/s/1i30Ewsd

7,DT大数据梦工厂Spark、Scala、Hadoop的所有视频、PPT和代码在百度云网盘的链接:
http://pan.baidu.com/share/home?uk=4013289088#category/type=0&qq-pf-to=pcqq.group

王家林免费在51CTO发布的1000集合大数据spark、hadoop、scala、docker视频:

1,《Scala深入浅出实战初级入门经典视频课程》http://edu.51cto.com/lesson/id-66538.html

2,《Scala深入浅出实战中级进阶经典视频课程》http://edu.51cto.com/lesson/id-67139.html

3,《Akka深入浅出实战经典视频课程》http://edu.51cto.com/lesson/id-77672.html

4,《Spark亚太研究院决胜大数据时代公益大讲堂》http://edu.51cto.com/lesson/id-30815.html

5,《云计算Docker虚拟化公益大讲坛 》http://edu.51cto.com/lesson/id-61776.html

6,《Spark 大讲堂(纯实战手动操作)》http://edu.51cto.com/lesson/id-78653.html

7,《Hadoop深入浅出实战经典视频课程-集群、HDFS、Yarn、MapReduce》http://edu.51cto.com/lesson/id-77141.html

8,《从技术角度思考Hadoop到底是什么》http://edu.51cto.com/course/course_id-1151.html

“DT大数据梦工厂”团队第一个中国梦:免费为社会培养100万名优秀的大数据从业人员。每天早上4点起持续分享大数据、互联网+、O2O、工业4.0、微营销、移动互联网等领域的

精华内容,帮助您和公司在DT时代打造智慧大脑,将生产力提高百倍以上!

DT大数据梦工厂微信公众号:DT_Spark,二维码如下,期待大家加入!

时间: 2024-10-12 15:52:56

从大数据的应用谈如何成为大数据大师的历程的相关文章

浅谈百度司南大数据企业的风向标

不知道什么时候大家都開始谈论大数据,筑尼玛第一次接触大数据是在今年年初出差的时候在机场见到的,筑尼玛比較喜欢看书所以当时就跟风买了一本维克托?迈尔?舍恩伯格的<大数据时代:生活.工作与思维的大变革>,只是由于工作比較忙一直放在角落里落灰,直到4月14日百度的新功能百度司南正式开售,筑尼玛才又開始好好的关注了下大数据. 筑尼玛是软件project师出生,所以自认为对数据还是比較敏感的,对于数据这东西,它一直是是企业发展重要工具,无论是客户数据还是財务数据,当时小筑做软件开发时自我认为发改委要求大

大讲台谈如何运用大数据完善数据中心平台

随着大数据的各个领域的深入应用,大数据的价值正逐渐凸显,而大数据的核心价值在于从海量的复杂数据中挖掘出有价值的信息,通过大数据技术进行更快地分析.更准确地预测,发掘出新的业务模式,创造新的商业发展机会. 因此,大数据时代下,企业迫切需要思考如何应用大数据技术改造完善已有数据中心平台,提升企业的数据处理能力,提高数据分析水平,将大数据融入企业的整体数据方案.CDA数据分析师覆盖了国内企业招聘数据分析师所要求的所有技能,包括统计知识.软件应用(SPSS/SAS/R等).数据挖掘.数据库.报告撰写.项

AdMaster技术副总裁谈Hadoop、营销数据、Python和挖掘平台

http://www.infoq.com/cn/news/2014/09/admaster-hadoop 卢亿雷是现任AdMaster技术副总裁,曾在联想研究院.百度基础架构部.Carbonite China工作,关注高可靠.高可用.高扩展.高性能系统服务,以及Hadoop/HBase/Storm/Spark等离线.流式及实时分布式计算技术.他对分布式存储和分布式计算.超大集群.大数据分析等有深刻理解及实践经验,对Lustre.HDFS.HBase.Map/Reduce.Storm.Spark等

【PPT&amp;视频】《陈新河:万亿元大数据产业新生态》——央视网大数据名人讲堂之大数据产业系列

[PPT&视频]<陈新河:万亿元大数据产业新生态>--央视网大数据名人讲堂之大数据产业系列 原创 2016-07-16 陈新河 软件定义世界(SDX) 热门下载(点击标题即可阅读) ?[下载]2015中国数据分析师行业峰会精彩PPT下载(共计21个文件) 因微信限制,部分图不能显示出来,高清完整版全文请扫描二维码,见每篇文章底部专栏 <陈新河:万亿元大数据产业新生态>--央视网大数据名人讲堂之大数据产业系列 嘉宾介绍 陈新河   中关村大数据产业联盟副秘书长 Talking

浅谈 T-SQL语句操纵数据表

SQL是结构化查询语言,也是关系数据库的标准语言,各类数据库都支持SQL作为查询语言.T-SQL 是标准SQL的加强版,除了标准的SQL命令之外,还对SQL命令进行了许多扩充.提供类似于程序语言的基本功能.如变量说明.流程控制.功能函数等.当我们安装上数据库时,在其上常做的操作无非就是插(增).删.改.查这四类,今天我们就来围绕这四个操作来谈一谈.插入数据: insert into **表名** (列名1,列名2.....) 其中into为可选项,可以省略 #多个列名和多个值列表用逗号隔开 va

多线程十大经典案例之一 双线程读写队列数据

本文配套程序下载地址为:http://download.csdn.net/detail/morewindows/5136035 转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/8646902 欢迎关注微博:http://weibo.com/MoreWindows 在<秒杀多线程系列>的前十五篇中介绍多线程的相关概念,多线程同步互斥问题<秒杀多线程第四篇一个经典的多线程同步问题>及解决多线程同步互斥的常用方法

浅谈:各大电影网站评分最低的电影。

大家说说都有在各大电影网站看过评分最低的电影吗?是否是真烂片?还是评分被故意拉低? 推荐大家到 远近电影网看电影 浅谈:各大电影网站评分最低的电影.,布布扣,bubuko.com

秒杀多线程第十六篇 多线程十大经典案例之一 双线程读写队列数据

版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[+] 本文配套程序下载地址为:http://download.csdn.net/detail/morewindows/5136035 转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/8646902 欢迎关注微博:http://weibo.com/MoreWindows 在<秒杀多线程系列>的前十五篇中介绍多线程的相关概念,多线程同步互斥问题<秒杀多

大数据学习总结(8)大数据场景

大数据场景一.各种标签查询 查询要素:人.事.物.单位 查询范围:A范围.B范围.... 查询结果:pic.name.data from 1.痛点:对所有文本皆有实时查询需求2.难点:传统SQL使用WHERE子句匹配LIKE关键词,在庞大的数据字段中搜索某些想要的字,需遍历所有数据页或者索引页,查询效率底,当出现千万级以上数据时,耗时较高,无法满足实时要求3.方案:使用全文检索方案,分布式架构,即使PB级量级也可做到毫秒级查询 大数据场景二.客户事件查询 查询条件:城市.区域.时间跨度(2017