MaxCompute2.0助力众安保险快速成长

摘要:2017云栖大会阿里云大数据计算服务(MaxCompute)专场,众安保险数据总监王超群带来MaxCompute助力众安保险方面的演讲。本文主要从MaxCompute优势开始谈起,进而谈及大数据能够公司运营带来的好处,最后重点分析了众安保险的数据平台建设,包括任务调度、元数据和数据质量监控等。

原文地址:http://click.aliyun.com/m/43993/

2017云栖大会阿里云大数据计算服务(MaxCompute)专场,众安保险数据总监王超群带来MaxCompute助力众安保险方面的演讲。本文主要从MaxCompute优势开始谈起,进而谈及大数据能够为公司运营带来的好处,最后重点分析了众安保险的数据平台建设,包括任务调度、元数据和数据质量监控等。

以下是精彩内容整理:

众安保险作为国内第一家互联网公司,我们从创立之初计算平台就使用MaxCompute。

为什么会选择MaxCompute?

成立之初我们也在自建平台和MaxCompute上作出了选择,我们主要从五方面考虑:健壮性、与应用系统交互、扩展性、强数据安全和低成本。

健壮性:7*24的服务能力、异常恢复时长;

与应用系统交互:数据源的获取与数据输出效率和成本;

扩展性:当数据成倍增长时,计算能力弹性;

数据安全:数据异常攻击防护,提供多层沙箱防护及权限体系;

成本:自建成本和MaxCompute成本对比。

首先,2013年能够提供完整能力的计算平台并不是很多,MaxCompute孵化于阿里金融的生产系统验证后对外输出,支持5000台以上的计算能力,满足我们对弹性和扩展性的要求;其次,我们对阿里云专业能力的信任,可以看到阿里云在国内的计算份额遥遥领先;最后,MaxCompute不仅仅是一个计算平台,它还提供了分析和挖掘工具的能力支持,提供可用的IDE(DataWorks、Studio)开发工具,这会降低我们最初加工开发过程中的开发成本。

大数据能给公司运营带来哪些颠覆?

云计算和大数据整体生态链的发展如图,国内云计算年增长率超60%,AWS新增功能数可观,云计算正日益接近生活,从hadoop诞生以来,十年间产品丰富性大大增加,生态圈越来越大。

大数据不仅仅在于它的工具、平台和生态圈,更在于它能够赋能于人、场景,通过赋能支持生态发展,阿里每天都有上万人在使用MaxCompute在工作,大数据是对人赋能创造的新职业,反过来从业者也会反馈大数据,丰富大数据的场景,在十年的发展中,人和资源的投入也在反馈结果,同时还有资本的良性回报继续投入大数据行业,形成闭环。

众安是一家以保险为核心的公司,我们提供跨生态的连接,与各个子行业进行跨生态合作,包括电商、3C、汽车等,这些产品打通了各个生态伙伴同时也会增加我们对用户的接触,通过与300多个生态伙伴的合作,我们积累了大量用户数据及信息。最终,我们希望众安既能服务这些生态,又能通过数据积累、客户积累、品牌积累来做大做强众安自己的开放平台。

截至到2016年底,我们服务的用户为4.92亿,保单数72亿,为中国互联网的新生代提供了第一张保单。其中,30岁以下人群大约占比50%,说明众安保险代表这新的生活理念方式,而且这群人群有着充足的资产生产能力,他们对保险的认可度和意识是更高的,他们是将来的消费主力。

众安保险的数据平台建设

每串数字后面都是公司全体员工努力的结果,那么,基于MaxCompute数据平台做了哪些事情呢?怎样支撑业务快速发展?

数据平台分为平台工具、数据监控和数据服务。数据本身是有多源异构数据,数据价值体现在于它的流动性和开放性,只有把数据经过加工、质检提供到用户手中,才能产生价值。平台工具包括MaxCompute、数据同步、任务调度和计算存储管理;数据监控有预警系统、元数据、血缘关系和数据质量;数据服务包括数据门户、自助取数和服务API。

任务调度系统

任务调度本质上是要完成数据加工工作流的状态,数据加工是一个多链路的过程,如何保证数据顺序的正确性,我们支持日、周、月等不同周期调度,支持分组优先级,支持小时任务,支持自定义时间调度,日任务量超1W。

任务调度是一个有向图,每一个节点都可以看到来源数据是非常多的,红色数据代表出错状态,蓝色代表成功,绿色代表正在运行,×××是存在的状态。不同任务加工来源于很多的数据源,就会给我们带来困惑,如果信息出现错误,那么到底是自身任务出错还是上游数据源结果引来的问题呢?那么,怎么让开发更快的定位问题,减轻开发成本,提供统一口径?我们通过元数据来解决。

元数据

数据包括打通数据和数据间关系,利于模型优化和异常定位,打通数据与人之间的关系,利于成本优化。数据关系包括数据字典信息、血缘信息、存储和产出信息、表责任人信息和业务元数据信息,推动存储计算优化来降低MaxCompute使用成本。

左图为数据间的基本信息,还有数据产出信息、血缘关系;右图展示表的来源,输出会影响下一轮哪些表,获取信息以后,我们会把数据和数据之间打通,人和数据之间打通。

存储优化后成本下降了30%,通过存储计算优化降低无效存储,计算效率会提升。

数据质量监控

数据质量监控通过切片方式嵌入到任务自身执行状态中,执行任务的自处理,自己判定自己的状态,基于规则与模板验证数据的准确性,只有Ok才会被下游使用,这样避免了数据污染,自身暴露错误不依赖于下游。它的特点是利用MaxCompute的统计项收集功能,规则是统计项规则,包含表和字段级别,模板为规则+周期+统计函数的整合,把事后监控变为事中监控,支持用户自定义,覆盖重点任务,覆盖率30%。

数据服务与安全

在消费时,我们会去考虑哪些东西呢?数据是要开放和流通的,在开放和流通中我们还要小心什么?数据泄露和安全都会导致公司的灾难。

在技术上,我们基于ACL与角色管理,赋予不同等级,我们做了表和字段级别的权限等级控制,建立敏感信息掩码、涉密信息的加密审批流程,开放与安全,基于技术控制和流程控制,各种角色需要数据。开放基础是安全控制,开放关键在流程管理,我们在开放与安全间做平衡。

在数据平台的建设中,要保持可用、易用、适用三个阶段,需要经历多次迭代升级系统。数据即服务,要满足用户不同的数据需求,数据是基础设施,每家公司都面临数据平台的搭建和使用。

MaxCompute生态的丰富,资源与工具的共享,对挖掘算法的深入及支持都可强大到满足我们的使用需求,我们可以有更多时间去接触用户,为用户创造价值。MaxCompute成本也在逐步下降。未来,希望MaxCompute提供更多种模式支持,包括UDF\资源库如IP库,包括挖掘的python算法包、人工智能平台支持。

识别以下二维码,阅读更多干货

原文地址:http://blog.51cto.com/13641484/2088427

时间: 2024-11-03 01:20:30

MaxCompute2.0助力众安保险快速成长的相关文章

张兴华:云端架构助力企业快速成长

欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 企业IT最大的需求就是能够快速的构建和稳定高速的发展.腾讯云资深架构师张兴华认为,企业在发展过程中的IT架构会遇到的四个问题:第一,高可用挑战.如果在架构设计上或者在容灾方面考虑不周,将面临高可用的挑战,并给出高可用架构设计及规划的建议及方案.第二,性能瓶颈,需要针对不同的场景或者业务类型需求,选择不同的云服务来进行不同的优化.第三,数据库设计.需要提前做好业务上长期规划,提前做好业务分库.分表的设计.第四,安全.目前DDos攻击流量

.Net程序员如何快速成长之我见

转自:http://www.cnblogs.com/kangshif/archive/2008/07/24/starter.html 在面试一些新程序员的时候,当问他为什么选择.net方向时,经常听到一些这样的回答:记得曾经我的老师对我们说,当你在开发语 言和工具方面不知道怎么选择的时候,那么你只要跟着微软走就行了.所以最终他选择了.net.我想大家都曾有过类似的经历. 当经历过数年之后,一些人在.net的某方面成为了专家,有些人精通数据库方面,有些人精通web界面设计,有些人精通系统架构.还

5月19日云栖精选夜读:性能追求之路——MaxCompute2.0的前世今生

摘要: <大数据计算服务MaxCompute产品最新动态>,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍. <大数据计算服务MaxCompute产品最新动态>,首先介绍了MaxCompute的发展历程和技术架构,然后对MaxCompute 2.0版本新特性和新技术进行了详细介绍. 热点热议 性能追求之路--MaxCompute2.0的前世今生 作者:大数据史记 "奔三"了,程序员,你该怎么

项目经理想要快速成长,请做到七点

项目经理的工作并不简单.如果,你是刚毕业的项目管理菜鸟,或者是刚从技术组长被任命过来的,想要让自己快速成长起来.倘若项目经理想要快速成长,请做到七点.简单来说就是做工作安排,不仅要管理好自己的工作,也要让你的团队成员学会管理好他们自己的工作.另外,要明白一点项目管理需要不断计划和调整,没有一成不变的项目计划,所以如何做好项目计划和项目调整,需要不断积累经验.管理好项目团队需要依靠规章,也需要做人际关系管理.项目经理想要快速成长,专业知识要学习积累外,情商也要提高哦. 1.设立优先级 富有效率的项

如何快速成长?

刚看到知乎问题<毕业后工作成长速度差异是如何造成的>,进而思考那些内部的我们可控制的能让自己成长的方法,总结如下: 毕业后成长速度差异和很多因素有关,总的来说分两方面:内部的和外部的,我们能控制的和不能控制的.大多数人应该更关注内部的我们的控制的因素,因为我们可以学习用来加快自己的成长速度.所以下面就重点关注内部的我们能改变的因素总结. 一.坚持一日三省 孔子说”吾日三省吾身“,反省一次就成长一次,坚持反省是让自己进步的最好的方法.因为反省改变思想,思想决定行为,行为形成习惯,习惯决定性格,性

[直播预告] 程序媛跨前端,我如何快速成长为核心骨干的!

随着互联网浪潮的推进,前端岗位的需求量也越来越大. 而大学并没有开设前端方面的课程,导致前端岗位缺口增加,许多非 IT 人员想转行前端,苦于没有良好的学习规划以及有效的学习方法,很多人踩了很多坑. 本次直播,范范师姐将以一个非科班出身,成功转行前端的程序媛角度,深度剖析如何在前端的道路上快速成长. 关于范范: 自学编程倡导者,环境工程硕士毕业.半年时间辅助近 1000+学生改变人生轨迹. 自学编程? so easy ! 直播时间:周六晚 20 : 00 直播间(微信扫一扫进入) 另外,明日晚 8

程序员初入职场如何快速成长

近期收到很多的朋友留言关于程序员初入职场如何快速成长,因为在it行业中,新的技术在不断的更新,如果你不充分利用有限的时间,在未来的竞争中该如何成长.针对这个问题,下面将给出三条比较有实际意义的建议. 培养自己的沟通能力 作为程序员大部分的时间都是和电脑进行沟通,但是我们要想把一个项目做好,沟通能力很重要,因为一个项目会涉及很多方面的,有些知识你可能不具备,但是其他的同事可能很精通,这个时候,沟通就显得尤为重要.说起沟通,建议先学会和你的上级领导沟通,最好做到一对一的沟通,有效的沟通可以让你少走很

捷配PCB再次提速,助力电子行业快速发展

2019年随着智能手机***率增加以及5G的试商用推行,电子行业下游产业需求量逐渐增大,不断增长的需求也成为了推进PCB产业发展的稳定动力,对PCB产业提出了更高的需求,同时也正在加速PCB行业的整合.作为长三角地区PCB行业的领头羊,捷配PCB通过大数据,对生产.管理.服务等方面进行了进一步的资源整合,继推出"12小时提速券"后,又推出了5大提速券,实现了PCB再次提速,出货速度领跑PCB行业.捷配推出提速券是为了满足对交期速度有更高要求的用户,推出的一项提速加急免费服务.此次提速券

TOM企邮后台2.0 助力管理员轻松管理

TOM企业邮箱管理后台2.0版本全新升级,秉承TOM邮箱一直以来的简洁风格,为企业管理员提供操作更便捷的后台服务. 三大亮点独家揭秘 完美交互,功能××× 企业名称.企业Logo.域名及状态.用户数及分配情况等,首页直观展示,出现域名解析异常或无可分配用户,登录管理员首页一目了然,帮助管理员迅速了解企业邮箱当前使用情况,快速定夺下一步执行工作. 开启高端随心邮,助理员工高效办公 管理员创建账号自动开启高端随心邮服务,员工仅需一步扫描二维码轻松绑定随心邮,随时随地在微信里收发邮件,避免错过重要邮件