平衡成本与业务风险 “去IOE”话题的思考与实践

很多人谈到“去IOE”话题,会理所当然的认为,将IBM、Oracle、EMC的全部产品从信息架构中移去就是去IOE,其实不然。IOE其实是特指IBM、Oracle、EMC的专有系统:“I”指的是IBM大/小型机;“O”指Oracle专有数据库;“E”指EMC存储设备。由于推出较早,行业应用丰富,性能指标优秀,所以“IOE”架构成为针对各行各业的企业关键应用而设计,基于向上扩展(Scale-up)技术高端设备,并形成了围绕着它们而开发的大型数据库、商业中间件与应用的产业生态。

由于出发点不同,不同的人在理解“去IOE”的过程与结果也是不一样的。“去 IOE”话题很容易走向到两个极端:一是单纯变为企业购买成本问题,二是简单地变成一个是否能用国内产品技术去替代IOE的问题。

笔者认为,企业业务才是价值的核心问题,在不影响或是更好全面支持业务的前提下,如何平衡成本与业务风险 ,实现安全、可复制的“去IOE”才是本文需要讨论的重点。而建设银行新疆分行应用国产主机代替IBM小型机的实践,则可成为我们参考的案例。

点燃“去IOE”话题

“去IOE”话题的开始,要从去年夏天阿里巴巴集团正式公布技术团队合并,并宣布用开源的MySQL数据库替换Oracle数据库说起。

2013年6月20日,阿里高调宣布其对为支付宝用户服务了5年的最后一台小型机下线。在阿里巴巴集团首席架构师王坚的主导下,采用PC-Server承载MySQL数据库,支撑大并发大数据量的核心业务系统。

王坚这样概括“去 IOE”运动和阿里云之间的关系:“去 IOE”将彻底改变了阿里集团 IT 架构的基础,是阿里拥抱云计算,产出计算服务的基础。“去 IOE”的本质是分布化,让随处可以买到的 PC 架构成为可能,是云计算能够落地的首要条件。

我们可以这样理解,在王坚的眼中,“IOE”是软件时代或是“买计算机”时代的产物,而在云计算时代,则变成买“计算能力”的时代。尽管“IOE”的性能与可靠性表现出众,但随着云计算能力的快速提升,理论上说,“IOE”就一定能去掉!

这明显是互联网思维下的“去IOE”。

观点看似没有问题,但抛开实际的“去IOE”过程而言,由于阿里以电商业务发迹,进而迈入公有云服务市场的业务特点来看,阿里高调“去IOE”的发布其实是在为自己的未来业务站台。

从阿里的技术发展历程来看,阿里是从主要依靠商业软件、到开源再发展到更多的自有技术或是说云计算的。

在最早依赖商业软件时,阿里是当时是亚洲最大拥有20 多个节点的 Oracle RAC 数据库集群,之后成为开发使用开源软件 MySQL 最好的企业之一,再到研发自己的关系数据库 OceanBase,目前也已用在了不同的业务场景。

从用 Oracle 做处理数据,到用 Hadoop 集群 (是业内单个机群节点数最多的 Hadoop 机群),再到用自己飞天平台上的 ODPS。这样演进的路径也表明:商业软件、开源软件跟自有技术永远是一个搭档,对于不同企业来说,是择优选择的问题。

传统企业几乎不可复制

从2010年开始的“去IOE”运动耗时3年,经过阿里巴巴集团1.7万名内部技术人员的努力,才高调的宣布了“去IOE”成功。阿里巴巴无疑将自身作为风险极高的“去IOE”创新试验品,下定决心才有了现在的成果。

阿里巴巴后来总结“去IOE”是“技术门槛很高、技术风险很大、水很深”的技术改革,敢冒如此风险的首要原因就是,考虑成本可控、技术可控等因素,不愿继续增加成熟商用系统以满足阿里巴巴特别是淘宝爆炸式业务增长的架构需求。由于其中的特殊性和特定性,这一过程虽然具有示范效应,但却有着太多不可复制的底层技术细节。比如互联网交易系统对数据一致性要求低于传统银行,但任何交易都存在数据复杂性与一致性的协调问题。因而虽然阿里巴巴采用分布式架构处理部分交易系统,但也需要对分布式开源数据库进行大量定制化改造。

在全新的IT架构下,淘宝的业务变得更加开放、灵活、高效,并在中国的互联网行业产生了很大的影响,欲效仿者甚众。当然,企业没有总结和沉淀积累,绝对不会盲目去实践,尤其是传统企业。

阿里技术保障部DBA负责人周宝方稍后接受记者采访时也表示,“去IOE”技术门槛很高,其他企业根本无法复制。”

“去IOE”的理性思考

成本问题恐怕是企业“去IOE”的最大动力了。

确实,负责掌管企业核心业务的“IOE”们的身价不菲,专有系统不仅仅售价高昂,每年去维护这些系统都是一笔不小的费用支出。这就像去买一辆豪车的价格其实只是个开始,而保养、修理费用是不可以忽视的。

之前说过,“去IOE”不应单独被视为企业购买成本的问题,至少说起来就像豪车的售价与4S店保养费用都是明码标价的。而很多企业为了成本问题,在“去IOE”的过程中使用购买成本几乎为零的开源软件来替代专有的Oracle数据库,就像淘宝采用MySQL去代替Oracle数据库之初,阿里和淘宝曾经多次尝试从Oracle数据库迁移到MySQL,但是都失败了,最根本的原因就是懂MySQL DBA技术的人才极少。

去Oracle并不是单纯的成本问题,但用户又不得不去考虑它的成本。首先,这是一个技术的替换过程,其次必然会考虑更加省钱的数据库软硬件解决方案,最后就是时间成本问题。很多人在谈阿里的成功,却忽视它背后花了3年、1.7万技术人员时间用重金打造的一个“成长”过程换来如今的低基础架构成本与高工作效率。

3年时间、1.7万人,在说明互联网模式下的“去IOE”不可复制的同时,也进一步清晰与量化了阿里“去IOE”的成本。

笔者看来,目前Oracle数据库是“IOE”中最难去掉的那个,原因就是因为与业务核心绑定紧密,去除所花的成本与风险很大。尤其是传统企业,以金融行业为例,目前国内就难以找到让客户满意又能替代Oracle的产品。原因其实很简单,在传统企业IT基础架构不是很完善,缺乏最佳实践,经常面临捉襟见肘的局面。如果冒然替换,不但起不到成本降低的要求,低效的工作会让自己的用户无法满足。另外一个问题,Oracle集成体系在传统行业已经根深蒂固,几乎渗透到金融业,运输业,电信业,连锁业等等,客户也是在这个过程中形成了一种依赖。

所以,从理性出发,“去IOE”其实是一种趋势,但并非是一种决绝的方式。

“去IOE” 服务器是第一步

诚实的说,就像阿里巴巴一样,很多企业“去IOE”的目的其实是为了平衡成本与支持实现业务价值。

作为企业IT系统的承载基础与计算核心,服务器的价值在于三点:可靠性(硬件)、计算性能(性价比)、操作系统(广泛支持与强壮性)。

由于摩尔定律的持续拉动,计算性能在最近十年的增长可以说是突飞猛进,IOE中IBM的大/小型机以往所能够傲视群雄的性能优势已经逐渐丧失,而服务器设计中也越来越考虑RAS特性,也将可靠性与“IOE”中的“I”逐渐拉近。与数据库与业务应用的强烈绑定,存储系统的多样性设计相比,对于传统企业来说,替换掉IBM专有服务器其实可以是“去IOE”过程的第一步。

新疆建行的实践

然而实际操作层面,企业如何才走出“去IOE”的第一步?

作为金融领域的龙头之一,在2011年,中国建设银行所辖的新疆区分行就使用了浪潮天梭K1系统替换掉了IBM小型机。

以往建行新疆分行的核心系统是IBM小型机加上IBM专用的AIX操作系统,支撑起核心交易数据库IBM的Informix,与管理信息系统Oracle数据库,中间件则是Oracle的WebLogic和Tuxedo。

在做了充分的调研之后,新疆建行采用整合、测试、迁移的“三步走”战略,将核心系统迁移到了浪潮天梭K1之上。迁移之前的新疆建行业务系统大多是分散部署,大约有18个。因此,在迁移核心系统之前,项目组花了半年时间将过去分散的18个子系统整合成一个统一的特色业务平台。

从一个国外专有系统迁移到国产主机,也必须对天梭K1与各个第三方软件的兼容性进行测试。由于天梭K1采用的是浪潮自主研发的K-UX操作系统,这也是全球第五个通过第三方Unix组织03认证的操作系统。项目组花了大量时间和精力进行测试和优化,成功的将Informix关系型数据库和 Tuxedo中间件,及各类工具软件、管理软件以及Oracle数据库、WebLogic等各种软件也迁移到了天梭K1上。

2010年8月,新疆建行第一批业务系统成功迁移上线。到了2011年5月,除了几个已经确定要下线的非常小的业务系统(大概占到整个系统的3%左右),其他所有的业务系统也就是新疆建行的特色业务系统全部顺利迁移到了天梭K1上面。此后又运行了一年的时间,2012年5月,整个项目顺利通过了国家组织的专家组的验收。直到现在,新疆建行的核心系统仍然运行在这台天梭K1样机上面,状况非常良好。

新疆建行试用国产小型机的成功,使得建行的其他省行动了心。其根本的原因,还是因为国产小型机的成本优势太明显:国外小型机的购置成本至少要比国产小型机高出三分之一,三年之后每年还要交纳高达10%-15%的维护成本。而且由于核心的技术人员都在美国总部,一旦小型机出现故障,本地工程师解决不了就只能反馈给美国总部,可能一个月之后才能解决问题。

在成功验收之后,就不断有很多省行联系新疆建行。最积极的是广东建行,他们专门派人在去年9月来到新疆,与新疆建行做了很深入的交流之后,开始用天梭K1替换IBM小型机,用于其“粤龙云”应用,逐渐将广东建行分散的数据统一到一个数据仓库当中。

2013年1月,在新疆建行应用了2年半之后,浪潮正式将天梭K1投入市场。

目前,国产小型机已经逐步从金融行业扩展到财税、电力、石油、农业等行业,开始逐步替代进口小型机。无论是在胜利油田、国家电网,还是在农业部、北京市财政局的机房里,都能够看到国产小型机的影子。

结语:去IOE需要平衡成本与业务价值

就像前文所提到的企业业务才是价值的核心问题,在不影响甚至是更好的支持全业务的前提下,如何平衡成本与业务风险 ,实现安全、可复制、逐步的“去IOE”才是企业应该去考虑的问题。

从这点来说,新疆建行的“去IOE”实践就很有代表性。

时间: 2024-10-03 14:25:08

平衡成本与业务风险 “去IOE”话题的思考与实践的相关文章

王坚:我为什么反对有些企业的“去IOE”运动?

在阿里巴巴首席技术官.阿里云总裁王坚的办公室有一面墙摆满了书,<丰乳肥臀>.<史蒂夫·乔布斯传>.<分布式系统原理与范型>这三本被摆放在右侧第三排上. 用这三本书来概括王坚似乎也很合适.工程心理学出身的王坚,用魔幻现实主义色彩带领着团队,所有的阿里云产品在内部被冠以传统神话中神的名字:阿里云的核心技术引擎被命名为"飞天",一位亲水的神仙:协同调度系统称为"女娲":"分布式文件系统"叫做盘古等等 从2008年11

去 IOE,MySQL 完胜 PostgreSQL

本文转载自: http://www.innomysql.net/article/15612.html (只作转载, 不代表本站和博主同意文中观点或证实文中信息) 前言 上周参加了2015年的中国数据库大会,差不多从第二届开始就每年都会北京参会,从最早的嘉宾到这次的会场主持人,也算见证了中国数据库大会的发展吧.记得最早的时候大会只有两天,分会场也比较小,而现在各种大会变为了三天,分会场也越来越细化,赞助商也从以前的出版社演变为各种高大上的软硬件公司,这是主办方的成功,也是整个数据库从业人员的骄傲.

最后一台小型机下线 阿里巴巴如何“去IOE”

2013年5月17日,阿里集团最后一台IBM小机在支付宝下线.这是自2009年“去IOE”战略透露以来,“去IOE”非常重要的一个节点.“去IOE”指的是摆脱掉IT部署中原有的IBM小型机.Oracle数据库以及EMC存储的过度依赖.告别最后一台小机,意味着整个阿里集团尽管还有一些Oracle数据库和EMC存储,但是IBM小型机已全部消失.7月10日,淘宝重中之重的广告系统使用的Oracle数据库下线,也是整个淘宝最后一个Oracle数据库.这两件事合在一起是阿里巴巴技术发展过程中的一个重要里程

“去IOE” 之 MySQL与PostgreSQL的抉择

前言 上周参加了2015年的中国数据库大会,差不多从第二届开始就每年都会北京参会,从最早的嘉宾到这次的会场主持人,也算见证了中国数据库大会的发展吧.记得最早的时候大会只有两天,分会场也比较小,而现在各种大会变为了三天,分会场也越来越细化,赞助商也从以前的出版社演变为各种高大上的软硬件公司,这是主办方的成功,也是整个数据库从业人员的骄傲.然而,这次会议讨论的最多的依然是去IOE问题,但是原来的主角从MySQL换成了PostgreSQL.在之前的去IOE之MySQL问答系列中,笔者其实已经回答过了这

去IOE,怎么去?

2013年5月17日,最后一台小型机在阿里巴巴支付宝下线,标志着阿里已经完成去IOE化.阿里巴巴的"去IOE"为市场带来了一个成功的范本,证明了打破国外厂商的垄断地位是有可能的,实现自主可控的"中国梦"并非遥不可及. 所谓 IOE 是个简称.是指以 IBM .Oracle.EMC 为代表的小型机.集中式数据库和高端存储的技术架构.其中 I 指 IBM p 系列小型机,操作系统是 AIX,IBM 专有的 Unix 系统: O 指 Oracle 数据库(RDBMS):E

深度解读海量数据存储和访问下的水平分库&amp;去IOE

随着大型互联网应用的发展,海量数据的存储和访问成为系统设计的瓶颈,分布式处理成为不二选择.数据库拆分,特别是水平分库是个高难度的活,涉及一系列技术决策. 本人有幸负责1号店订单水平分库的方案设计及实施落地,这里结合项目实践,对水平分库做一个系统地剖析,希望为大家水平分库(包括去IOE)改造提供思路,主要内容包括: 水平分库说明 分库维度– 根据哪个字段分库 分库策略– 记录如何分配到不同库 分库数量– 初始库数量及库数量如何增长 路由透明– 如何实现库路由,支持应用透明 分页处理– 跨多个库的分

去IOE八年后,Oracle用云计算改造了自己,现在重新回归

(Oracle CEO Mark Hurd说中国GDP增长率达6.7%,这个市场不容忽视 ) 众所周知,在2008年阿里提出了"去IOE"的概念.这与后来的设备与技术采购国产化.自主研发.国家创新等战略结合起来,成为了一场迄今已经历时八年的信息技术国产化运动.除了以IBM.Oracle和EMC为代表的外企受到影响外,其它不少知名外企都在寻找新的方式与中国企业合作,包括后来著名的49%合资公司. 然而,当年阿里提出"去IOE"本意并不是刻意要打压外企,而是因为当时以I

去IOE

IOE分别指IBM(国际商用机器公司).Oracle(甲骨文).EMC(易安信),三家企业分别是小型机.数据库和高端存储的领导厂商.中美关系.信息安全等因素不断掺杂其中,去IOE正变得越来越复杂,在技术.利益.安全.产业转移等多重因素的交织下,去IOE将走向何方? 传统行业:分布式不可行 技术上的"去IOE"包括两个层面,一是去IBM.Oracle和EMC三家美国厂商的产品,二是涉及到去IOE代表的技术路线--用分布式代替集中式数据处理方案. 由IBM小型机.大型机加上Oracle数据

银行难去IOE

金融是大数据的传统优势领域.从央行到工农中建四大商业银行,最早开始兴建核心业务平台和数据中心,其产品使用和维护几乎是清一色的IBM.中国政府真的如报道所称那样推动国内银行放弃IBM服务器转用本土品牌吗?对此,央行权威人士的回答是:“并不是让银行业弃用IBM.弃用IOE.如果弃用,有巨大的重置成本.国家层面有意降低对国外IT厂家的技术依赖,此外还有一个良好愿望是,同步促进国内IT产业的发展.” 财新记者同时获悉,银监会期望银行对IOE的技术依赖度逐年下降,而操作路径需要银行的技术人员研究决定.因为