数据自生长机制:数博会揭示大数据成功的新逻辑

在大数据领域,我国已经出现4家估值超过100亿美元的超级独角兽企业,分别是蚂蚁金服(估值750亿美元)、滴滴出行(估值500亿美元)、美团点评(估值178.8亿美元)、今日头条(估值103亿美元),4家估值之和占我国大数据独角兽总估值比例达到67.1%。

2017年5月27日,在贵阳数博会上,北京市长城企业战略研究所(简称“长城战略咨询”)发布了《2016中国大数据独角兽企业发展报告》(简称《报告》)。根据该《报告》,2016年中国大数据(准)独角兽企业共83家,其中大数据独角兽企业29家,大数据准独角兽企业54家,共分布于10个行业领域、11个城市。83家大数据(准)独角兽企业总估值2284.2亿美元,平均估值27.5亿美元。

(中国大数据独角兽产业生态,北京市长城企业战略研究所制图)

《报告》对比各领域大数据独角兽和准独角兽企业的分布,发现了三个重要的现象:首先,金融和大数据技术领域虽然已经是独角兽企业分布最为集中的领域,但仍有大批的准独角兽企业,表现出极强的爆发潜力;其次,医疗健康、企业服务、教育三个领域将是大数据正在等待爆发的下一个风口,准独角兽企业大量涌现,数量远超过独角兽企业,尤其是教育领域,虽然尚未出现独角兽企业,但已有一批准独角兽企业正在快速发展;第三,物流、交通出行、生活服务、电子商务、文化传媒等领域,已经得到市场的认可,竞争正处于胶着时期。

《报告》特别提出了大数据企业一个独特的成长机理:建立数据自生长机制。所谓数据自生长机制,即建立“数据积累——数据算法优化——数据价值提升——数据积累增加”的正反馈循环。换句话说,“数据自生长机制”就是找到一种方法,让现有数据能够源源不断地产生新的数据,或通过某种方式源源不断获得新数据。

“滴滴出行”的数据自生长机制是让用户在使用服务的过程中不断产生数据,并且将数据用于优化调度算法,以提供更好的服务,从而获得更多的数据。旷视科技的数据自生长策略是提供开放人脸识别API服务,尽可能多地吸引用户,获取大量的图像数据,用于训练提升人脸识别算法的性能,形成数据获取和算法提升的自循环。《报告》指出,一旦能够建立“数据自生长机制”,大数据企业将会成为指数型增长的企业,将进入爆发阶段。

可以理解为“数据自生长机制”就是通过开放共享的方式,吸引数据流量,再把数据流量用于算法优化,通过算法优化产生更好的开放共享体验,从而吸引更多的数据流量。可见,“数据自生长机制”适用于接入了移动互联网的商业模式和数据算法产品。比如微软小冰通过更好的情感体验来吸引流量,从而产生更多数据来优化自身的情感算法;京东APP通过更好的购物和物流体验来吸引流量,从而产生更多的数据来优化自身的购物推荐和物流等算法。

(上图为2016大数据独角兽名单,北京市长城企业战略研究所制表)

除了“数据自生长机制”外,《报告》还提出了其它四条大数据企业的成长机理。

第一:活化数据价值是大数据创新创业的起点,即互联网和其它信息技术已经产生了海量数据,并且继续以指数级增长,其中蕴含了巨大的机会,活化数据如新的数据服务、优化供需匹配、满足小众需求、提升运营效率等,典型例子如“滴滴出行”利用大数据技术优化出行的供需匹配等。

第二:服务海量个性化市场是数据价值创新的方向。灵活应用大数据,能够解决传统大规模工业模式无法满足个性化需求的矛盾,通过满足海量个性化市场需求,开辟新的蓝海市场。典型例子如“今日头条”根据用户的阅读数据对客户进行细分,并根据消费者偏好推送新闻资讯,满足了使用者的个性需求,从而快速成长为了估值103亿美元的超级独角兽。

第三:“平台+数据”是大数据企业的制胜商业模式。一方面,许多平台企业正在转向“平台+数据”模式,如阿里系的蚂蚁金服、京东的京东金融、360的360金融,互联网平台企业正在将数据驱动模式叠加于原有的平台模式,延伸平台生态价值;另一方面,技术起家的大数据企业,如旷视科技、格灵深瞳、奇点汽车、云知声等,正在努力向平台化发展,将数据技术与平台模式相融合。

第四:智能企业是大数据企业的新形态。随着人工智能技术的成熟,充分利用人工智能技术的大数据企业将超越现有模式,成为更有发展潜力的智能企业。如“碳云智能”将人工智能带入海量的生命大数据分析和应用中、“旷视科技”运用深度学习技术提供识别服务等。

在《报告》统计的83家大数据(准)独角兽企业中,估值为1-9亿美元的准独角兽企业最多共54家、占企业总数65.06%,估值为10-19亿美元的独角兽企业17家、占企业总数20.48%,估值为20-99亿美元的独角兽企业8家、占企业总数9.64%,估值为100亿美元及以上的超级独角兽企业有4家、数量占比4.82%、估值占比67.1%。

其中,金融、大数据技术、物流三大领域独角兽企业数量集中,分别为9家、5家和5家,占企业总数量的65.52%。金融领域是大数据独角兽企业的主要来源,数量占比31.03%。

在地理分布上来看,“北上深杭”地区的大数据(准)独角兽企业为73家,占比达到87.95%。其中,北京企业最多,有44家;上海其次,为17家;杭州和深圳各有6家。在全国的其他城市中,南京有4家,广州、苏州、成都、武汉、贵阳、厦门各有1家。

北京大数据(准)独角兽占据全国半壁江山,涉及领域多,也是大数据技术企业最为集中的区域。上海大数据(准)独角兽企业集聚于金融领域,大数据技术快速发展,且拥有榜单中唯一一家数据驱动汽车企业。深圳大数据(准)独角兽企业主要集中在金融和医疗健康领域。杭州在大数据方面发展较快,阿里系衍生效应明显。

《报告》指出,在大数据概念被广泛认可的短短几年内,中国大数据产业实现了爆发式发展,向世界展示了大数据的中国创新和中国高成长。大数据产业将会成为中国最有发展潜力的原创性新兴产业之一,虽然目前仍然处于产业的起步期,但未来将涌现众多新企业和新业态。(文/宁川)

时间: 2024-08-09 09:07:17

数据自生长机制:数博会揭示大数据成功的新逻辑的相关文章

数加平台——阿里大数据OS实践

数加是什么 在阿里云的官网打开大数据部分(整个大数据部分统称为数加),其中包括:大数据基础服务部分,MaxCompute.ADS.流计算.大数据开发套件:人工智能部分,机器学习(基础平台是PAI).语音识别.ET等:数据分析展现部分,数据可视化(大屏.BI报表).I+关系网络分析(安全领域用的比较多):数据应用部分,推荐引擎(提供面向终端用户的服务,以大数据中间件存在)等.天池比赛也是基于数加平台,数加数据市场相当于大数据的App Store. 数加是什么?数加=数加平台+数加市场+数加应用.平

dataguru(炼数成金)大数据培训基地印象

dataguru访问地址:http://f.dataguru.cn/?fromuid=99611 课程优惠码:C4B6  这段时间一直在dataguru(炼数成金)上学习<hadoop数据分析平台(第十四期)>,说说我对炼数成金的印象. 最开始听说dataguru是通过它的广告邮件中的链接,发送的对象是itpub会员,如果你也是itpub会员,应该也会收到这么一封邮件. 后来才知道dataguru的前身是是ITPUB培训,ITPUB的创始人正是dataguru的主讲师-黄志洪(同时也是分布式系

中科院 | 大数据的力量来自“大成智慧”信息时代大数据的再认识

文章出处:http://www.thebigdata.cn/YeJieDongTai/29119.html 大数据已成为媒体与大众关注的新技术,大数据的应用也预示着信息时代将进入一个新阶段,但人们对大数据的认识有一个不断加深的过程.首先从"信息时代新阶段".数据文化和认识论的高度阐述了对大数据的理解;接着通过对驱动效益和大成智慧的解释,探讨了如何正确认识大数据的价值和效益,并从复杂性的角度分析了大数据研究和应用面临的挑战;最后对发展大数据应避免的误区提出几点看法. 1 大数据兴起预示&

大数据架构和模式(五)——对大数据问题应用解决方案模式并选择实现它的产品

摘要:本文使用了一个基于场景的方法,概述了可能有助于定义大数据解决方案的解决方案模式.每个场景都从一个业务问题开始,并说明为什么需要大数据解决方案.本文会将一个具体的解决方案模式(由原子模式和复合模式组成)应用到业务场景.这个逐步分析的方法有助于用户确定解决方案所需的组件.在文章的末尾,提供了一些建议使用的典型产品和工具. 简介 本系列的 第 3 部分 描述了针对最常见的.经常发生的大数据问题及其解决方案的原子模式和复合模式.本文将推荐可以用于架构大数据解决方案的三个解决方案模式.每个解决方案模

大数据架构和模式(五)对大数据问题应用解决方案模式并选择实现它的产品

作者: Divakar等  来源: DeveloperWorks  发布时间: 2015-01-29 18:22  阅读: 1073 次  推荐: 2   原文链接   [收藏] 摘要:本文使用了一个基于场景的方法,概述了可能有助于定义大数据解决方案的解决方案模式.每个场景都从一个业务问题开始,并说明为什么需要大数据解决方案.本文会将一个具体的解决方案模式(由原子模式和复合模式组成)应用到业务场景.这个逐步分析的方法有助于用户确定解决方案所需的组件.在文章的末尾,提供了一些建议使用的典型产品和工

大数据学习:hive篇,入门学习大数据开发

大数据开发之路漫漫其修远兮,吾将上下而求索.对于很多入门学习大数据开发的小伙伴,可能第一个接触到的,是我们的大数据领域的数据仓库工具hive.在大数据生态中,hive一般作为数据仓库来使用. Hive本身是不做数据存储的,它是构建在分布式存储系统HDFS之上,我们平常看到的表数据其实本质上来说还是HDFS的文件. Hive把这些HDFS数据文件,通过元数据规则映射为数据库的表,并且可以提供SQL操作的功能.Hive总体结构比较简单,总体有三个组件:用户接口.元数据系统.驱动器.用户通过用户接口来

大数据学习笔记6&#183;社会计算中的大数据(4)

上一篇介绍了LifeSpec项目,这个项目是关于用户理解和用户画像的.这篇是社会计算部分的最后一篇,关于用户连接和图隐私. 用户连接与隐私保护 用户连接与隐私保护有很强的相关性. 上图中,左边有两个网络.对于用户连接,我们的目标是映射这两个网络和连接这些网络中的用户节点.然后,我们就能产生一个更大的网络.这样,用户就能够被连接在一起,我们就可以知道跨网络的用户信息. 但是,如果从隐私的角度来看这个问题,把第一个图看成一个匿名化处理后的图,称其为目标图:把第二张图看成辅助图或者攻击者可获得的信息.

大数据好学习吗?如何快速掌握大数据开发技能

大数据好学习吗?如何快速掌握大数据开发技能?经常被学员问到:大数据好学吗?想学大数据怕学不会等问题.我想说的是,大数据在当下是个非常热门的话题,大数据在深刻的影响着这个世界,在促进传统行业升级改造.引领新兴产业和新兴应用蓬勃发展.提升社会运行和管理效率等方面,大数据正引发新一轮革命.大数据是时代潮流,如果学一下就会了,那大数据行业现在恐怕已经被挤破门槛了吧,想学大数据还是得下苦功夫才行. 想学大数据,先把这几个技能学会再说: Apache Hive2.1 Hive是建立在Hadoop上的数据仓库

消费大数据公司“重分析-强应用”引领企业大数据营销

近日,消费大数据公司信柏科技树立"大数据-重分析-强应用"理念发布新一代大数据业务平台,以大数据为基础.软硬件结合的方案来辅助企业进行经营决策与精准营销.该大数据业务平台定位于"人群 ."内容"."行业 "与"地域"精准分析与挖掘,覆盖到企业营销中较为关注的用户特征画像.精准人群标定.定向数据采集内容监听 .采集内容的关联分析.行业报告与市场动态.竞品分析.新店开张选址报告.指定地区常驻人群特征分析等业务,致力于成为