选型宝分享Informatica中国数据管理5大经典案例

写在前面

我们请来了Informatica大中国区的首席架构师但彬先生,和大家聊一聊数据和数据管理的话题。

李维良(主持人)

在数据管理这个大概念下,有哪些细分领域?在每个细分领域中,Informatica又布局了哪些产品?

但彬

我们常说IT(Information Technology信息技术),其中一半是I,也就是信息,尤其在今天,数据和信息变得越来越重要。从数据库(Database)到数据仓库(Data Warehouse)和数据挖掘,再到今天的大数据(Big Data)和数据治理,数据管理的概念一直在变化和延伸。

大家最初认识我们,大多是从Power Center和Power Exchange这样的数据集成软件开始的,认为它只是一个ETL工具。而今天,经过近25年的不懈努力,已经建立起了从智能数据平台到数据管理解决方案,从数据集成到数据质量管理、大数据管理、云数据管理等的完整的数据管理框架和产品线。

我们的数据管理框架分为三层。最下面是支撑层,称为 “ 智能数据平台 ”。为什么这样说呢?因为其中应用了很多AI(人工智能)技术,比如数据模式识别,它会智能地区分出,哪些是客户数据,哪些是交易数据。平台层通过企业级统一元数据管理、人工智能、数据监控、管理与计算等功能,为产品和解决方案提供统一的支撑。

在平台层之上,是产品和解决方案。这其中,除了经典的数据集成、数据归档、数据质量管理、数据安全、主数据管理等,我们近年来又不断推出了很多新的产品和解决方案,比如:企业信息目录(EIC),以及面向数据交换的DIH(Data Integration Hub)、面向流式数据处理的IIS(Informatica Intelligent Streaming)等。再比如,数据湖和数据治理在几年前还只是概念,现在也都被产品化了(IDL和Axon)。

李维良

您刚才提到了主数据、元数据、大数据、ETL等,请您先为大家普及一下这些基本概念。

但彬

在这几个概念中,大数据(Big Data)可能是大家了解最多的,它的特征可以用几个V来概括:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)和Veracity(真实性)。对大数据来说,量大并不是难题,真正具有挑战性的,是数据来源的多样性和数据结构的复杂性。当然,大数据的挑战,对我们来说,也是创新的机遇。

主数据和元数据是两个容易混淆的概念。主数据(MD Master Data)通常是相对于交易数据而言的,它描述了交易数据中的各种主体,比如:客户、商品等,而“某客户在某个时间以某个价格买了某件商品”则是交易数据。主数据有时也被称为基准数据,只有主数据得到正确的维护,才能保证交易数据的正确性和完整性。

元数据(Metadata)是描述数据的数据(Data about Data),是数据及信息资源的描述性信息。比如,一张数据表中的字段名称、字段长度和字段类型等定义数据结构的信息就是元数据。另外,业务术语也通常被纳入元数据的范畴,比如:余额、期末余额、应收、应付账款等。

另外一个理解主数据和元数据的方法,是借助OO(Object Oriented 面向对象)的思想。元数据是一个类(Class),而主数据是一个对象(Object),它是类的一个实例。元数据是一种定义,比如“员工”,它没有值;而主数据则是具体的员工,比如:张三、李四……

ETL是Extract-Transform-Load的缩写,这三个词的意思,分别是抽取、转换和加载。但是,现在我们说起ETL,已经不再局限于它原来的含义,而是包含了实时数据交互、增量数据发现等更多功能的ETL。今天,ETL基本可以看成是数据集成的代名词。

李维良

数据集成是企业数据管理的基础,您能否为大家介绍一下数据集成的应用场景和成功案例?

但彬

数据集成的应用确实非常广泛,比如数据仓库和BI(商业智能),它们都会催生对数据集成的需求。数据集成的另一个应用方向,就是数据交换,在这里,我想先举一个清华大学的例子。

清华大学是中国的知名学府,经过多年建设,校园信息化应用已基本覆盖了学校运行的各个方面。但是,由于在校园信息系统的建立过程中,缺乏顶层和统一的信息标准,致使信息流通不畅,数据不能共享,形成了一个个 “ 信息孤岛 ” 和 “ 应用孤岛 ”。

要解决这个问题,第一步就是要打通数据流通的渠道,就在这时,他们发现了Informatica的价值。首先,它可以实现各个系统之间的对接与沟通,能够完成各种数据格式之间的转换,而且,系统越是复杂多样,越能体现出Informatica的优势。

其次,清华大学很看重系统架构的灵活性和稳定性,他们希望各系统之间的数据访问能通过Web Service来完成。正好,Informatica的SOA架构可以把数据和数据的访问过程封装成服务,并为清华的校园系统提供底层的数据集成和数据交换支持,从而实现了真正的数字化校园。

还有一些企业或组织,是用Informatica的数据集成工具,完成了数据仓库的升级转型。这里,我正好有一个南京市儿童医院的案例。

南京市儿童医院原先已经建成了包括HIS、LIS、PACS、移动护理、病案管理、财务管理、物流管理和手术麻醉等几十个应用系统,这些异构系统间的数据非常分散,无法实现集中统一和标准化的管理。而且,紧耦合式的数据交互接口为应用开发和后期维护带来了很大困难,数据交换、信息共享的问题日益突出。

为解决这些问题,医院开始尝试使用一些开源工具来实现数据的集成和交换,但随着项目的深入,系统的性能和稳定性等问题慢慢凸显了出来。

经过反思和比较,医院最终选用了 Informatica的数据集成工具。利用Power Center和Power Exchange等软件,他们提升数据仓库系统,并基于数据仓库,建成了医院数据调用公共资源中心库,从而实现了实时的数据交互和信息共享,干净、标准的数据,为跨应用系统数据关联分析打下扎实的基础。

李维良

主数据是企业最核心的、最有价值的数据,针对主数据管理,请您为大家介绍一些应用案例。

但彬

主数据管理也是这两年很火的一个话题。如果说大数据能让人心潮澎湃的话,那么主数据则是一个能让你冷静下来思考的东西。一般来说,主数据不会像大数据那样,直接为企业带来让人眼前一亮的创新价值,但它所反映的问题,通常是和业务直接相关的,是企业数据真正的本质上的痛点。

关于主数据管理,我给大家介绍一个国泰航空的案例。国泰航空一直非常注重客户数据的管理,并已经在数据集成、数据标准化、数据模型建设等方面取得了很多成果,但是他们发现,企业在主数据管理方面,还有待进一步加强。

国泰航空的客户来源非常复杂,超过50%的客户是非会员或线上预订者,还有一些是来自非官方的旅游奖励计划。客户记录是企业内部能够跨业务、跨系统重复使用的高价值数据,但由于缺乏对应的制度、流程和系统支撑,导致各业务系统间主数据的不一致性日益明显,无法给分析人员提供统一口径的主数据信息和及时的差异比较。

为解决这些问题,国泰航空引入了Informatica MDM主数据管理平台,从而使企业的数据管理能力得到了全面的提升。Informatica MDM为国泰航空建立了客户统一视图,确保了客户记录的完整性和唯一性。通过高效查询和精准分析功能,业务人员能够及时洞察客户信息变化,实现个性化营销和服务。主数据管理平台还缩短了数据处理时间,节省了数据管理成本。

主数据管理的另一次成功应用,是帮助南方电网建成了数据资源管理平台。Informatica MDM产品能够用灵活的数据模型定义任何类型的主数据,允许南方电网快速、方便地进行二次开发,大大提升了工作效率。Informatica MDM 支持对数据模型、业务规则、安全和数据管理功能的完整配置,实现了对主数据整个生命周期的全面跟踪管理,从而能够帮助南方电网轻松适应不断变化的业务需求。

李维良

数据安全是企业CIO最关注的问题之一,针对数据安全,Informatica有哪些技术、产品和应用案例?

但彬

最近有两件事,大家可能还记忆犹新。一个是5月12日,WannaCry勒索软件病毒大面积爆发,让我们感到,安全威胁就在身边。第二件事,是 6月1日起《×××网络安全法》开始正式实施。可以说,网络安全和数据安全,从来没有像今天这么重要。

信息安全的范畴很大,而Informatica则主要专注于敏感信息、隐私信息的保护。在这个领域,我们的主要产品包括:TDM(Test Data Management 测试数据管理)、DDM(Dynamic Data Masking动态数据遮蔽/脱敏)、[email protected](数据安全智能)等。

关于数据脱敏,我可以给大家介绍一下大连银行的应用案例。

做为一家业务发展十分迅速的金融机构,大连银行的业务系统积累了大量包含客户账户等敏感信息的数据,这些数据在银行的很多工作场景中都会用到,例如:业务分析、开发测试、审计监管,甚至一些外包业务等。如果这些数据发生泄露或损坏,不仅会给银行带来经济上的损失,更会大大影响用户对于银行的信任度。

为此,大连银行通过采用Informatica的数据脱敏解决方案,帮助他们管理对敏感数据的访问,建立了企业内部完善统一的脱敏机制与管理流程。通过创建可在内部和外部安全共享的真实但无法识别归属的数据,成功防止了信用卡卡号、电话号码等个人或组织机构信息的意外泄露。

Informatica成熟的数据脱敏解决方案,满足了大连银行对易用性、可用性、高可扩展性以及高效率等方面的要求。我们的DDM等产品,能够为任意格式的敏感数据创建数据脱敏算法,包括替换、随机化、顺序、时滞和取消,并且数据处理加工的速度更快,效率更高,原始数据可直接在内存中计算,不侵入应用程序或数据库,大大减轻了数据外泄的风险。

李维良

在云时代,企业数据的分布、数量等出现了很多新的变化,Informatica是如何应对这种变化的?

但彬

在云时代,客户数据问题确实变得更加复杂,但越是这样,越需要Informatica这样完整而专业的数据管理产品和解决方案。

积极拥抱云时代,向云端数据管理转型,也是这两年Informatica最重要的努力方向之一。目前,我们的产品已经可以全面支持云端数据管理,并为混合架构提供了成熟的解决方案,包括云集成、云安全、云交互、云主数据管理等等。

以CRM为例,我们的产品可以既可以连接本地CRM系统中的数据,也可以轻松连接Salesforce这样的云平台中的数据,从而屏蔽了底层的复杂性,使数据管理问题变得简单。

凭借我们在数据管理领域多年的积淀,Informatica很快就走在了云数据管理的前列。大家可以关注一下Gartner发布的iPaaS(Integration Platform as a Service 集成平台即服务)魔力象限,Informatica是处在Leader位置的。

李维良

对企业来说,数据管理工具最核心的价值是什么?

但彬

我们可以从两个角度去思考这个问题,一是做减法,它为我们解决了什么问题?二是做加法,它为我们带来了什么?

一方面,企业的数据越来越复杂,导致数据的使用成本越来越高,在这个日益高企的成本中,有很大一部分是隐性成本,比如人员工资等。而数据管理工具可以提高数据处理的效率,使复杂、繁琐的问题变得简单、快捷,从而将人解放了出来,也因此大幅降低了使用数据的成本。

另一方面,通过清理、匹配、优化、集成等一系列处理,数据管理工具使数据变得更一致、更有效,从而能够为业务提供更好的支撑,为创新提供更好的支持。

降低数据获取和使用的成本,提高数据价值的利用水平,是数据管理工具最核心的价值。

李维良

对于那些有志于发掘企业数据价值的CIO们,您还有什么好的建议?

但彬

依据我个人的经验,我在这里给大家提供三个原则性的建议:

第一:大处着眼、小处着手。我们首先要有全局观,对企业数据管理的现时状况和未来目标要做到心中有数。以此为基础,我们需要制定一个切实可行的计划,将大的目标分解成阶段性的任务,一步一步去解决、去完成。

第二:认清难度、长期规划。在任何一个数据管理项目启动之前,我们都需要对项目的难度、周期、预算等做出正确的预判,并根据预判,制定一个长期的规划。很多数据管理项目的失败,都是由于初期低估了难度和预算。

第三:既重展示,也重数据。我发现,有些客户急于去做那些看得见的东西,比如华丽的报表,可是,仔细去看报表,数据却是错误的。Informatica更侧重底层数据的支撑,我们认为,对任何一个业务支持系统来说,数据就是血液,只有源源不断地提供健康血液,我们的信息系统、我们的企业才能保持旺盛的生命力。

原文地址:https://blog.51cto.com/14440256/2421026

时间: 2024-10-09 09:58:38

选型宝分享Informatica中国数据管理5大经典案例的相关文章

多线程十大经典案例之一 双线程读写队列数据

本文配套程序下载地址为:http://download.csdn.net/detail/morewindows/5136035 转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/8646902 欢迎关注微博:http://weibo.com/MoreWindows 在<秒杀多线程系列>的前十五篇中介绍多线程的相关概念,多线程同步互斥问题<秒杀多线程第四篇一个经典的多线程同步问题>及解决多线程同步互斥的常用方法

秒杀多线程第十六篇 多线程十大经典案例之一 双线程读写队列数据

版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[+] 本文配套程序下载地址为:http://download.csdn.net/detail/morewindows/5136035 转载请标明出处,原文地址:http://blog.csdn.net/morewindows/article/details/8646902 欢迎关注微博:http://weibo.com/MoreWindows 在<秒杀多线程系列>的前十五篇中介绍多线程的相关概念,多线程同步互斥问题<秒杀多

多线程面试题系列(16):多线程十大经典案例之一 双线程读写队列数据

前十五篇中介绍多线程的相关概念,多线程同步互斥问题(第四篇)及解决多线程同步互斥的常用方法--关键段.事件.互斥量.信号量.读写锁.为了让大家更加熟练运用多线程,将会有十篇文章来讲解十个多线程使用案例,相信看完这十篇后会让你能更加游刃有余的使用多线程. 首先来看第一篇--第十六篇 多线程十大经典案例之一 双线程读写队列数据 <多线程十大经典案例之一双线程读写队列数据>案例描述: MFC对话框中一个按钮的响应函数实现两个功能:显示数据同时处理数据,因此开两个线程,一个线程显示数据(开了一个定时器

如何通过AI 全面提升运维效率?AIOps实战案例在选型宝分享

前言 运维,是企业IT最基础的工作,也是痛点.槽点最多的工作.海量的数据.频繁的报警.艰难的排障.无情的投诉,足以让运维工程师们感到崩溃和绝望-- Gartner在ITOA (IT Operations Analytics IT运营分析)的基础上,提出了AIOps的概念.当时,AIOps的含义是"基于算法的IT运维(Algorithmic IT Operations)".随着AI热潮的到来,Gartner也顺时应势,在2017年的一份报告中,将AIOps重新定义为"Artif

选型宝访谈:海底捞 如何打造全渠道+全场景的智能客服系统?

01直播简介 说起客服系统,大家可能会首先想到呼叫中心(Call Center),想到那些熟悉的客服号码:10086.95588.12306.400.800...... 曾经,电话和邮件,是客户与企业连接的主要纽带. 然而,"移动+社交"改变了这一切. APP.微信.小程序.电商网站.QQ.邮件.电话-..客户可能会通过任何一种方式,与你的企业发生连接, 客服的渠道,正在变的极度碎片化. 移动+社交时代,我们应该怎样构建新的客服系统? 在新一代智能客服系统的赛道里,UDESK 是颇受关

选型宝访谈:做好邮件安全,斩断威胁数据安全的“杀伤链”!

写在前面 信息安全是一个永恒的话题,也是企业CIO.CSO们关注的重点.就在今年的5月12日,WannaCry勒索病毒大规模爆发,再一次为企业的信息安全敲响了警钟. 可以说,我们面对的安全问题,从来没有像今天这么复杂,企业的信息安全,也从来没有像今天这么重要.一方面,随着大数据时代的到来,数据已成为企业的核心资产,变得越来越重要.云计算和移动互联网的普及,又使企业IT基础架构的边界越来越模糊,数据变得无处不在.另一方面,来自外部和内部的安全威胁越来越频繁,威胁手段也越来越多样化.专业化. 在这样

选型宝访谈:超融合, 能否承载联想的转型梦想?

写在前面 IT大势,合久必分,分久必合.在虚拟化技术出现10年之后,计算与存储分立的传统架构正逐步被另一种更简约.更高效.更可靠的IT架构所替代,这种云时代的新兴架构就是超融合. 权威机构的调研数据显示,2016年,超融合的销售额同比增长了116%,到2019年,超融合的全球市场规模将超过1000亿美元.在中国,互联网产业蓬勃发展,传统产业云化转型,互联网+战略全面推进--这一切,使中国成为了全球超融合基础架构增速最快的市场. 当一个巨大蛋糕遇到正在寻找新兴市场的联想集团时,超融合自然成了这家中

选型宝访谈:企业网盘,能否成为联想企业云市场的突围尖兵?

写在前面 云端存储与协作是企业的刚性需求,也是企业SaaS应用中的第一大门类,而SaaS百亿级的市场规模,则占了国内整个云服务市场70%的份额. 和超融合一样,企业网盘对联想来说,也不仅仅是一款产品或解决方案,它是联想从传统的硬件设备供应商向新时代的云服务提供商转型的重要依托,是联想"设备+云"业务的突破口. 那么,联想企业网盘到底是怎样一款产品?它能否担得起联想突围企业云市场的重任呢?做为联想的新生力量,网盘团队是联想这家IT老字号本分守成的"富二代",还是锐意进

选型宝访谈:AI时代,如何重新定义客服软件?

写在前面 客户服务(Customer Service)是连接企业与客户的纽带,是企业竞争力不可或缺的组成部分.做为现代企业标配的客服系统,已成为企业提高客户满意度,并进而赢得客户.赢得市场,保证企业可持续发展的重要工具. 随着信息技术的发展,以及C端客户消费场景和沟通方式的改变,企业传统的客服系统正经历着从语音客服向全媒体客服.从服务客服向营销客服.从人工客服向智能客服的转变过程. 那么,今天的企业应该选择怎样的客服系统?应该建设怎样的客服中心?应该建立怎样的客服体系? 李维良(主持人) 企业传