[个推 CTO、前MSN中国首席架构师 谈数据智能] 之本质及技术体系要求

安森,个推CTO
毕业于浙江大学,现全面负责个推技术选型、研发创新、运维管理等工作,已带领团队开发出针对移动互联网、金融风控等行业的多项前沿数据智能解决方案。

曾任MSN中国首席架构师,拥有十余年资深技术开发与项目管理经验,在大数据处理系统、大规模并发平台、分布搜索系统、手机应用开发、无线通信领域和智慧金融系统等领域拥有丰富实践经验。

引言
中国移动互联网的发展见证了中国大数据行业的蓬勃发展。数据智能作为移动互联网时代的自然产物,也是未来很长一段发展阶段的核心所在。个推(每日互动)和业界的共识不谋而合,从2010年成立到现在,经过多年的发展,从一家移动互联网时代服务于开发者的基础推送平台服务商,已经成长为创业板的上市公司,也是国内首家在A股上市的数据智能公司。作为专业的数据智能服务商,个推立足开发者服务,将不断致力于用数据推动产业智变。

围绕“数据智能”主题,我将通过一系列文章进行阐述。本文主要从技术角度来探讨数据智能中涉及的各个方面,希望通过这一系列内容,能让大家对数据智能以及所涉及的技术体系有一个比较清晰的了解。

本系列将从以下五方面展开:
01数据智能时代的来临:本质和技术体系要求
核心内容:我们根据个推在数据智能领域多年的实践来讲讲我们对于数据智能的理解,并且从总体上提出对应的技术体系要求。

02数据智能下的数据资产治理思路

核心内容:主要探讨作为资产后的数据如何进行治理,需要具备的基础,具体如何实施,最终保证数据资产的安全、合理使用、以及价值创造。

03数据智能下的安全计算体系

核心内容:在保证数据资产的所有权和使用权分开的前提下,目前可以采用的技术和方法论。

04数据智能下的数据质量保证体系

核心内容:大数据之所以为大,是因为其规模以及多样性,不同于传统的小数据,可以很快去验证其正确性,那么可以采取什么方法去保证数据的质量及可检验性呢?

05数据智能下的不同行业的业务探索实践
核心内容:隔行如隔山,数据智能也具有鲜明的行业区分性,这个主题会讲述几个我们涉及比较深的行业的探索实践,并总结一些经验和教训。

正文
大数据的发展历程
本文是系列文章的开篇,首先聊一聊我们理解中的数据智能的本质;同时作为公司技术负责人,和大家探讨一下基于技术体系的要求,也就是数据智能时代,要从数据中体现智能,从技术方面需要做哪些事情。

什么是数据智能,这个概念怎么来的呢?

记得从2010年开始,随着移动互联网的兴起,大数据也随之出现在各个媒体网站和行业论坛,大家见面都会问一句:“你们搞大数据了吗?” 其实大家对大数据该如何加以应用都不太清楚。

大数据的发展过程是什么样的呢?下图比较清楚地对此进行了诠释。

我把它称之为大数据成熟度模型。这个过程实质上我们理解也是数据从工具变成为资产的过程,从一个辅助的东西变成生产资料的过程。现在在提的数字经济,很多人试图对此进行理论定义,以便把数字经济和实体经济从概念上区分开来,我的建议是就从数字是否作为主要生产资料,是否作为核心资产这个角度去界定,会比较简单明了。

从这几年的实际发展来看,大数据基本上按照上图的这个模型在演进发展。

2013年左右,企业已经开始认知到数据价值,各个具有大数据生产环境的行业如电信运营商、政府、公安、金融等开始建设大数据平台,收集并存储企业业务产生的数据。同时,金融等行业也开始大量购买外部数据,希望通过外部数据快速挖掘数据的价值,弥补自身数据短缺的问题,不少从事数据聚合和相关服务公司获得了发展机遇。

2015年,大数据进入到了监测阶段,通过数据大屏等形式,实现对业务的监测,这是大数据最早、最先成熟的应用方向。对于政府、央企及大型国企而言,数据大屏、领导看板等数据展现应用是大数据最直接能够反映价值的方式。

2017年,大数据平台建设基本完善,单纯数据展现开始难以满足企业的多样化需求,大数据开始与业务场景结合,基于大数据实现对业务问题的洞察,呈现出百花齐放的局面,分别应用在金融领域的精准营销和风控反欺诈,公安领域的刑侦破案,工业领域的故障预测预警等。

企业对业务场景的洞察,单纯靠简单的数理统计已经不足以满足要求,因此,数据挖掘、数据建模技术应运而生。AI建模平台、数据科学平台开始进入人们的视野,出现了一些主打建模平台的创业公司,但更多公司将AI建模平台内化成自身的能力,基于AI建模平台,形成解决方案,帮助企业客户落地大数据应用。

在2019年左右,大数据开始进入到业务决策阶段,也就是说,由机器形成数据报表或者数据报告,业务人员进行决策变成机器直接给出决策建议,让机器具备推理能力。例如,在外卖、出行场景,美团和滴滴的系统直接形成最佳调度方式,系统自动完成决策环节,将任务下发给骑手和司机。这种消费互联网相对常见的场景,将在产业互联网、企业业务场景中逐渐出现。也就是说,大数据开始从业务数字化阶段向数据智能化阶段迈进。

数据智能的特征和定义
从上节中的大数据发展历程中,我们看到数据智能目前对应的是决策、优化以及商业重塑阶段,也就是说让机器具备推理能力;而这些能力意味着自然语言处理(NLP)、知识图谱(Knowledge Graph) 等认知技术的逐渐成熟,这也是为何2018年NLP、知识图谱成为市场的热点的原因。因此,数据驱动决策,数据驱动业务发展的企业新需求,也必然会带动一批数据智能公司的兴起。

未来,随着技术更加成熟,大数据会从决策进入到最后一个环节,也就是业务重塑。很多执行环节可以由机器来实现,但仍然有很多环节需要人参与其中。因此,人机协同会迎来迅猛发展,从人工智能 AI (Artificial Intelligence ) 向人类智力增强 IA (Intelligence Augmented) 进发。

至此, 我们试着给数据智能做一个定义:数据智能就是以数据作为生产资料,通过结合大规模数据处理、数据挖掘、机器学习、人机交互、可视化等多种技术,从大量的数据中提炼、发掘、获取知识,为人们在制定决策时提供有效的数据智能支持,减少或者消除不确定性。

大数据的发展历程
数据智能首先需要有数据提供,而且数据在其中充当着核心资产和生产资料的角色,那么对于数据的治理就显得尤为重要。什么是数据治理(Data Governance) 呢? 我们经常听到公司治理这个词,公司治理在经济学上主要解决几个问题:
所有权和经营权如何分离?
公司所有者如何向职业经理人进行科学的授权及监督?
那么对应地,数据治理也要解决类似的几个问题:
数据(资产)有哪些?
如何让数据所有权和使用权分离?
数据资产所有者如何向数据使用者进行科学的授权及监督?

数据智能的所有手段其实都是在解决上述的几个问题。关于数据治理方面的内容我将在本系列的第二部分进行详细描述。

同时,我们知道穷人和富人之间的差别在于对待财富的态度,富人更多的是从资产增值的角度去对待财富,想的是如何创造更多资产,并且让资产不断增值;穷人更偏向于从消费的角度去看待财富,赚来的钱更多的是用于消费。那么在数据智能时代,如果我们想成为一个“富人”,就需要考虑如何让数据发挥更大的价值,如何找到其他合作者去联合创造价值,但是数据不同于别的资产,其具有可复制性、难确权的性质,这就需要我们去解决数据安全问题,也就是目前行业内比较关注的安全计算技术,在本系列的第三部分我将对此进行详细阐述。

还有一个需要我们关注的点是:大数据由于其具备的 4V 特性,特别是量大、种类多,有时候会让我们对于其聚合或者产生的结果存疑,虽然有一些可以通过常识或者直觉去判断,但是总是有说不出的味道。这就需要有一个质量保证体系来让我们对于数据从产生到最终的各个环节有一个完整的检验过程,本系列的第四部分会对质量保证体系进行详细描述。

在这里小结一下,数据智能的技术体系至少需要包含三个方面:
数据治理系统
数据质量保证系统
数据安全计算体系

结语
数据智能作为大数据时代一个重要且激动人心的阶段,机会与挑战并存。作为本系列开篇文章,本文对该主题内容进行了一个整体概述,后续会对具体内容逐步展开,希望对大家有所帮助。

番外

文章构思于2019年7月24日,忽然发现这个数字很应景。7*24 是很多行业中服务的态度和承诺,表示一周每天24小时提供服务。在数据智能时代,个推的产品和服务也必定是全天在线,一周七天!

我们一直深耕于开发者服务领域,以消息推送为基础,发展了“用户画像”、“应用统计”、“一键认证”等一系列面向APP开发和运营的产品,构建开发者新生态。同时,个推不断拓宽以数据智能为核心的服务边界,以创新的技术为移动互联网、品牌营销、金融风控、智慧城市和公共服务等各垂直领域提供定制化的大数据解决方案。未来,个推希望用数据和技术的力量与更多的行业共筑数据智能共赢生态!

更多精彩内容,请关注:个推技术学院

原文地址:https://blog.51cto.com/13031991/2427549

时间: 2024-11-09 06:05:37

[个推 CTO、前MSN中国首席架构师 谈数据智能] 之本质及技术体系要求的相关文章

作为首席架构师,我是如何选择并落地架构方案的?

如何针对当前需求,选择合适的应用架构,如何面向未来,保证架构平滑过渡,这个是软件开发者,特别是架构师,都需要深入思考的问题. 本文首发于InfoQ垂直号「聊聊架构」,ID:archtime 无架构,不系统,架构是大型系统的关键.从形上看,架构是系统的骨架,支撑和链接各个部分:从神上看,架构是系统的灵魂,深刻体现业务本质. 架构可细分为业务架构.应用架构.技术架构,业务架构是战略,应用架构是战术,技术架构是装备.其中应用架构承上启下,一方面承接业务架构的落地,另一方面影响技术选型. 如何针对当前需

Seele元一首席架构师刘文思:分片技术是把双刃剑,单纯看TPS或分片数量毫无意义

导语:近日, seele团队成立了"Seele最前线"媒体平台,希望可以通过此平台向全球社区伙伴实时同步团队动态与工作进展.正值Seele元一技术团队对测试网进行了新一轮测试,"Seele最前线"第一期内容便邀请到Seele元一首席架构师刘文思,并针对分片技术同大家进行交流. 事实上,区块链的扩展性问题一直是大多数公链发展过程中难以避开的拦路石,随着数字货币的集体性下跌,区块链技术正逐渐回归理性,公链的吞吐量问题再次成为焦点.比特币网络平均每秒只可以处理7-10笔交

【转】】CTO、技术总监、首席架构师的区别

经常有创业公司老板来拜访我,常常会拜托给我一句话:帮我找一个CTO. 我解释的多了,所以想把这个写下来,看看你到底需要的应该是啥. 一.高级程序员 如果你是一个刚刚创业的公司,公司没有专职产品经理和项目经理,你就是公司的产品经理,你如果对你现在的开发员能力不满,那么你只需要的是一个高级程序员. 你定义功能.你做计划推进和管理,他可以带1-2个副手把你规划的功能实现了,他是主力干活者,有技术难题也是他来亲自攻克解决. 所以,一个高级程序员,他的职责很清晰: 1.负责核心复杂功能的实现方案设计.编码

[转]CTO、技术总监、首席架构师的区别

经常有创业公司老板来拜访我,常常会拜托给我一句话:帮我找一个CTO. 我解释的多了,所以想把这个写下来,看看你到底需要的应该是啥. 一.高级程序员 如果你是一个刚刚创业的公司,公司没有专职产品经理和项目经理,你就是公司的产品经理,你如果对你现在的开发员能力不满,那么你只需要的是一个高级程序员. 你定义功能.你做计划推进和管理,他可以带1-2个副手把你规划的功能实现了,他是主力干活者,有技术难题也是他来亲自攻克解决. 所以,一个高级程序员,他的职责很清晰: 1.负责核心复杂功能的实现方案设计.编码

资深首席架构师眼中的架构应该是怎样的?

“架构的视角每个人都不一样,这位在eBay.携程.唯品会等平台型互联网公司都工作过的老司机就以平台架构视角和大家分享架构心得体会.一家之言,欢迎讨论. 本文首发于InfoQ垂直公众号「聊聊架构」,ID:archtime. 我对架构定义的理解 大概在7~8年前,我曾经有一个美国对口的架构师导师,他对我讲架构其实是发现利益相关者(stakeholder),然后解决他们的关注点(concerns),后来我读到一本书<软件系统架构:使用视点和视角与利益相关者合作>,里面提到的理念也是这样说:系统架构的

老兵不死,只是凋零:前九枝兰架构师王晓辉

他曾是以一位人民教师,他是程序开发界的一名老兵,你可能没有听过他,他有着十多年的开发经验,先后在做过计算机老师,并且在私企.外企.互联网公司.创业公司里做程序开发和技术管理工作."惟正己可以化人,惟尽己可以服人."他就是本期程序员客栈专访前九枝兰架构师,王晓辉:https://www.proginn.com/community/topics/356 1,程序员客栈王鑫:我还是叫你老师吧,您先做个自我介绍 王晓辉:大家好,我是王晓辉,毕业后当过两年的高中老师,于2006年辞职到北京从事专

新浪微博技术架构分析-微博首席架构师杨卫华

新浪科技讯 11月16日下午消息,由新浪微博主办的中国首届微博开发者大会在北京举行,这是国内微博行业的首场技术盛宴.作为国内微博市场的绝对领军者,新浪微博将在此次大会上公布一系列针对开发者的扶持政策,以期与第三方开发者联手推动微博行业的整体发展.视频:中国首届微博开发者大会杨卫华演讲媒体来源:新浪科技 以下为演讲实录: 大家下午好,在座的大部分都是技术开发者,技术开发者往往对微博这个产品非常关心.最晚的一次,是12点多收到一个邮件说想了解一下微博底层是 怎么构架的.很多技术人员对微博的构架非常感

全球直播的罗胖跨年演讲背后技术支撑故事——罗辑思维首席架构师方圆访谈

导读:最近几年,知识付费型产品纷纷登上舞台,大家可能了解过最近的罗辑思维的跨年活动,或者也用过得到 app 来进行新知识学习.对于得到这样的产品,背后的技术挑战及经验外界了解不太多,恰逢罗辑思维首席架构师方圆作为中间件论坛的出品人参加 2017 年 12 月的 GIAC 大会,高可用架构对其进行了采访.方圆,罗辑思维首席架构师,曾先后在 Cisco,新浪微博从事基础架构研发工作.十多年一直专注于后端技术的研发,在消息通信,分布式存储等方向有着丰富的经验.个人技术兴趣广泛,主要专注 Go/Java

葡萄城首席架构师:前端开发与Web表格控件技术解读

讲师:Issam Elbaytam,葡萄城集团全球首席架构师(Chief Software Architect of GrapeCity Global).曾任 Data Dynamics.Inc 创始人兼资深产品经理,个人研究方向主要为 MS.NET语言及平台.动态化系统构建,以及高性能大型分布式Web系统架构,主导了葡萄城多款畅销控件产品的系统架构与性能优化.   “25年来每天只休息4小时,除了日常作息时间,Issam不是在研究技术和产品,就是在去研究技术发展趋势的路上”这就是葡萄城同事对他