数澜天湛分享:地产大数据下一站——数据中台

从 IT 时代到 DT 时代,每个企业无一不被「大数据」、「数字化转型」这样陌生又熟悉的词汇环绕着。似乎一夜之间,这条通往未来的数据之路旁早已挤满了拿着车票却不知该如何上车的企业主们,特别是一些传统行业的巨头们,更是早早挤在了队伍的前头。

他们往往凭借着多年的深耕和积累,积累了海量的、价值难以衡量的数据,在传统行业增量市场急剧减少的今天,这些数据如何指导企业对已有的存量市场进行更加精细化运营,则成为了他们所最为关心的话题。

近日,在深圳举办的一场地产行业 CIO 春季峰会中,数澜科技合伙人兼 CDO 付登坡(天湛)发表了《大数据的下一站——数据中台》的演讲,分享他在地产领域帮助企业构建数据中台的思考与实践。

(以下内容源自天湛演讲整理,略有删改)

提到数字化转型,很多企业都无一例外的会向诸如 BAT 一类的大厂去进行学习,为什么他们业务越来越多,却不会被冗杂的事物羁绊,反而效率逐渐提升?在这个过程中,大家逐渐接触到一个名词:中台。而最近两年,关于中台的讨论不断,各厂商也开始启动中台战略,百度搜索指数也持续升高。

那问题来了,这个能帮助企业实现转型的中台到底是什么?中台的概念又从何而来?

数据中台是什么?它从何而来?

首先说说究竟该怎样理解数据中台。

数据中台,我们将其称为是数据应用的基础设施。为让数据更加灵活的支撑到前端业务,企业通过建立数据中台,将数据复用能力沉淀下来,形成数据从汇聚、开发、管理、到数据服务的一整套数据使用的机制。

而中台这个概念最初由阿里巴巴提出,而它之所以能在阿里萌芽,来源于马云的一次探索之旅。

2015 年,他拜访了芬兰赫尔辛基的一家手游公司——Supercell,这个一百多人的团队,却能为公司创造出税前 15 亿美元的利润。经过一番探究后他们发现,公司高效运转的核心就在于,将通用的基础设施由一个团队统一负责,而业务则个性化的生长在在这个基础设施之上。

在这一次探访归来,阿里就启动了自己的中台战略,构建符合互联网大数据时代灵活创新的「大中台,小前台」机制,即作为前台的一线业务会更敏捷、更快速的适用瞬息万变的市场,而中台将集合整个集团的运营数据能力和产品技术能力,对各前台业务形成强有力的支撑。所谓中台,也就是企业互联网架构,把公共的资源共建,服务化共享。

地产行业为什么需要数据中台?

回顾企业数据发展的历程,从 2.0 时代为了解决单个业务问题而形成类似烟囱式野蛮生长,逐步过渡到如今 3.0 时代数据互联互通,由业务产生的数据沉淀下来,并反哺并驱动业务的发展。对于拥有着大量数据的企业而言,急需要在此时把握机会,进入快车道,迅速完成向数据 3.0 时代的过渡。

我们认为,拥有卓越的大数据体系和平台整合能力,是未来优秀的房地产企业应该具备的特质。

地产行业在最近几年,从市场、政策和舆论环境角度来看,都发生了很大的变化。在增量市场不断萎缩的今天,为了探索新的业务,地产商们也开始探索更多的业务形态,也更加重视对存量市场的精细化运营。此时,正是转型的关键时期,房地产企业需要建设属于自己的数据中台,它不一定能够完全解决业务问题,但中台提供的能力可以让问题变得简单,帮助企业将沉淀的数据用起来,驱动业务更加高效运转。

特别是在 2019 年,除了地产行业万科、碧桂园、恒大等头部客户外,很多企业也都开始尝试数据中台,这无疑是一个未来发展趋势。

数据中台如何运转才能实现价值?

企业一旦构建起自己的数据中台,便能够让数据源源不断地赋能自有业务,同时拓展新业务方向,为企业增添新的活力。但我们必须明确一点,数据中台并不产生数据,而是将企业自身在业务中产生的全域数据,汇入进数据中台中建立一套标准,形成企业数据资产后再进行服务化、业务化的过程。

我们认为,数据中台整体架构应包含如下内容:

拆分出来看,数据中台的建设,核心需要做以下几件事,即数据交换、数据开发、资产建设、资产管理、资产服务。而在数据资产建设领域,我们具有丰富的地产领域实践经验。

地产行业的数据资产该如何建设?

我们着重了解一下地产行业的数据究竟需要通过哪几步才可以变成真正的数据资产:

数据中台数据总体分为四层:

原始数据层尽可能保留原始全量业务数据,只在汇聚之后进行简单的清洗;
中间数据层保留统一规范的标准业务数据;
标签数据层通过 ID-Mapping 把各业务板块各个业务过程统一实体数据打通,保持以对象为中心的全域标签数据;
应用数据层按照业务的需要从中间层、标签层抽取数据进行组装,满足业务以及性能需求。最后数据通过应用层以服务的方式开放,整个过程完成了从数据到数据资产的建设。


举个例子,通过数据资产的建设,我们最终希望能够实现×××的业主在同一集团酒店入住,多业态跨域对业主都能够产生认知,这才是大数据真正的价值。

构建数据中台,数澜能做什么?

数据中台不是一个产品,是一个战略和体系,企业以数据驱动业务发展,业务沉淀的数据回归中台强化数据能力,形成不断沉淀并反哺业务的「活」的数据资产,为业务源源不断赋能。而数澜旗下核心产品——数栖平台,作为大数据技术平台,可以帮助企业创建属于企业独一无二的数据中台。

数栖的核心能力主要集中在数据开发平台、数据资产体系及数据资产管理平台中,这三个体系能够让数据真正的被用起来,降低开发的成本。即使一个普通的工程师拿着帮助手册,也能够在短时间内变成一个大数据工程师,成为一名数据挖掘专家,企业无需再耗费大量人力物力去搭建庞大的大数据团队,并将这些内容从头学起。

而在数据应用层,我们能提供许多服务及数据标准管理,方便业务人员和运营人员通过灵活配置相应的数据和服务,生成全新的服务来赋能业务,从而高效响应及支撑业务,通过平台的能力快速解决业务问题。

因为数栖将数据中台建设过程中的全部流程产品化,因此数栖平台能够在中台构建的过程中发挥最大价值,从数据的开发治理,到将数据变为资产,进而对其进行管理并对接上层业务应用,跑通全流程,将整个链路完整无误的串联起来——这是我们的能力及价值所在,从此企业无需再东拼西凑,便可一站式构建自己的数据中台。

未来的商业世界中,信息不对称将会被大幅度降低,企业生产效率、销售效率都会大幅度提高,甚至质变。从这个意义来讲,未来中国乃至世界的商业生态基因都将是「大数据」,而对于优秀的房地产企业而言,数据基础设施的搭建将在彼时显得更加重要,如果不能提前上车,未来 3 至 5 年,「大数据」或许无法帮助房地产企业更好更快的前进。

关于数澜

数澜科技成立于 2016 年 6 月,秉持“让企业的数据用起来”的使命,致力于成为客户信赖的数据应用基础设施供应商。2019 年初,跻身“杭州准独角兽企业”榜。

自成立之日起,数澜团队即坚持以“数据中台”作为核心战略构建和培养团队。目前已有成员 200+, 建成以数据科学家、数据产品专家、数据咨询专家及数据可视化专家为核心的数据科技研发团队,核心成员来自阿里、华为、金蝶及运营商等大型 B 端企业,拥有大数据业务和技术多年实战经验,是国内最早一批大数据服务创新实践者。

目前,数澜已为万科、方太、兴业银行、百果园、中信云网、时尚集团、温州检察院、喜茶、视源股份等多家行业头部企业和政府客户,提供了数据中台建设和数据资产开发服务,并基于数栖帮助企业持续挖掘数据资产,赋能业务创新。

原文地址:https://blog.51cto.com/13936314/2375520

时间: 2024-10-06 18:44:44

数澜天湛分享:地产大数据下一站——数据中台的相关文章

大数据下一站:智慧医疗?

基于大数据技术,有朝一日,机器的诊疗准确率甚至可能超过人类历史上最有名的名医. 日前,美国最大的医疗保险公司 Wellpoint已经开始通过运用IBM的超级计算机“Watson”帮助医生来针对病人的病情进行诊断,服务7000万人.在癌症治疗领域,目前需要 一个月或更长时间才能制定出针对性的药物治疗方案,未来利用Watson的认知计算技术可以将周期缩短至一天,极大提高癌症患者的治愈率. “Watson在医疗.医药行业可以帮助肿瘤中心做几个复杂癌症疾病的诊断和数据分析:还能够帮助分析疾病风险,保证理

澜讯 | 大数据赋能金融,宁波银行携数澜打造实时数据平台

近日,宁波银行签约数澜科技,双方将共同打造「实时数据平台」,通过引入实时计算来加工.处理和分析数据,从而高效的挖掘到数据价值. 宁波银行成立于 1997 年,2007 年成为国内首家在深圳证券交易所挂牌上市的城市商业银行(股票代码:002142).目前拥有 12 家分行,327 家营业网点,已经发展成为一家资本净额超 930 亿元,总资产超 10000 亿元,员工人数超 1.5 万人的区域性股份制上市银行,跻身全球前 200 家银行之列. 随着银行业务往线上.移动化集中,诸如反欺诈.事件式客户营

兴业银行正式签约数澜科技,携手共建信用卡大数据平台

近日,兴业银行信用卡中心与数澜科技正式签署合作协议,携手共建信用卡大数据平台.这也是继中国金融期货交易所.宁波银行.恒大人寿.绍兴银行等客户之后,数澜再次签约金融行业头部客户. 兴业银行于 1988 年 8 月成立,是经×××.×××批准成立的首批股份制商业银行之一,也是中国首家赤道银行.2007 年 2 月在上海证券交易所挂牌上市(股票代码:601166),目前注册资本 207.74 亿元. 根据 2018 年英国<银行家>杂志「全球银行 1000 强」排名,兴业银行按一级资本排名第 26

老李分享:大数据性能调优案例

老李分享:大数据性能调优案例 1.“空间换时间”以及“内存中处理数据” 比如user_id.csv文件中有20万个不同的user_id,根据user_id去查其对应的用户最近发表的一篇帖子,取出post_id,post_title.post_time和user_id(post表中查,post表中有一列是user_id,表示帖子所属者),而帖子数目有大概两百万,那么如何处理呢?我的解决方案是:A. 先将post表post_id,post_title.post_time和user_id这四列导出到p

大数据知识点分享:大数据平台应用 17 个知识点汇总

一.大数据中的数据仓库和Mpp数据库如何选型? 在Hadoop平台中,一般大家都把hive当做数据仓库的一种选择,而Mpp数据库的典型代表就是impala,presto.Mpp架构的数据库主要用于即席查询场景,暨对数据查询效率有较高要求的场景,而对数据仓库的查询效率要求无法做大MPP那样,所以更多地适用与离线分析场景. Hadoop已经是大数据平台的实时标准,其中Hadoop生态中有数据仓库Hive,可以作为大数据平台的标准数据仓库, 对于面向应用的MPP数据库,可以选择MYCAT(mySql的

老李分享:大数据,数据库,数据仓库之间是什么关系

老李分享:大数据,数据库,数据仓库之间是什么关系 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.如果对课程感兴趣,请大家咨询qq:908821478,咨询电话010-84505200. 首先简单的看一下云计算与大数据的概念. 1)云计算:云计算本质上是一种计算资源集中分布和充分共享的效用计算模式,其中集中是为了计算资源的集约化管理,分布是便于扩展计算能力.集中分布式是针对云服务提供商的,充分共享是针对用户,在云计算中,虽然对

好程序员分享自学大数据入门干货

首先,提及大数据一词的概念.大数据本质还在于数据,但是它有着新的特征亮点.包括:数据来源广,数据格式多样化(结构化数据.非结构化数据.Excel文件.文本文件等).数据量大(最少也是TB级别的.甚至可能是PB级别).数据增长速度快等等. 扩展讲大数据的4个基本特征,我们将进行下面额思考: 1.数据来源广? 广泛的数据来源从何而来,通过何种方式进行采集与汇总?相对应的我们出现Sqoop, Cammel,Datax等工具. 在这里还是要推荐下我自己建的大数据学习交流群:529867072,群里都是学

【华为云技术分享】大数据容器化,头部玩家尝到了甜头

[摘要] 大数据容器化,大势所趋.头部玩家在进行大数据容器化后,尝到了甜头? 大数据的需求热度,从来都是这个时代的浪尖.然而由于大数据系统的复杂性,一度导致业界大数据已死的各种声音不断.尤其是当MapR被HPE收购,Cloudera公司股票持续跌成狗,使得这种声音进一步放大.其实,大数据的需求一直在,只是传统的大数据实现系统需要考虑重新构建.而容器依靠其自身的标准化,一次构建,随处运行的能力,使得非常适合大数据系统的构建和管理.容器技术当前正是那只火遍全球的当红辣子鸡. 1 华为云BigData

澜讯 | 时尚集团携手数澜科技 引领传统内容数字化新风潮

近日,国内领先的文化传媒集团--时尚集团与数澜科技签署大数据战略合作协议.双方将共同打造集团内容资产数据化平台,拉动建设并健全集团数据资产体系,为其提供丰富的数据服务与商业应用探索,最终帮助时尚集团完成传统内容的数字化转型,引领行业数字化新风潮. 时尚集团成立于 1993 年,作为时尚生活的领导者.时尚文化的创造者和时尚产业的推动者,旗下拥有<时尚芭莎>.<时尚 COSMOPOLITAN>.<时尚先生>.<男人装>等多个知名传媒品牌,其中"时尚&q