编者按:本文为“千字千金!中国首届灾备行业征文大赛”参赛作品,文章列举了具体案例,探讨了“双模IT”这一趋势下,银行灾备系统架构的现状与发展趋势。此次征文活动仍在进行中,期待您的参与。以下为文章正文。
在今年的两会上,×××副行长范一飞指出,金融科技快速兴起,为金融发展持续提供了创新的活力。党的十九大也明确要求着力加快建设实体经济、科技创新、现代金融、人力资源协同发展的产业体系。
一、双模IT下的新旧业务之争
从已经释放出的众多信号中不难看出,来自客户新业务需求以及金融行业新的竞争者不断涌入当下,以银行为代表的金融行业借助科技红利实现降本增效、新旧动能转换的大幕已经开启。
金融行业的发展越来越依仗金融科技的不断创新,而金融每一次金融科技的创新的背后都是金融业务创新使然。在创新的常态下,原有业务与新业务之间的竞合关系恰恰是金融行业双模IT趋势的真实写照。原有业务追求的是可靠、可用和低成本,适用于那些需求明确、增量可预测的业务,数据以结构化数据为主。比如工作日柜台的业务数量;而新业务的总体需求量在规划阶段并不明确,具有一定的探索性和偶然性。比如一次节日促销活动或者一次大范围的消费者行为分析,数据以非机构化数据为主。
双模IT对比(摘自:Gartner发布的2017存储战略路线图)
但不管是传统型还是创新型,都要面临业务连续性的问题。受限于不可避免的突发情况,IT架构可以长期保障某个业务的连续运行,也可以短期保证所有业务的连续运行,但却无法永远保障所有业务的连续运行。
3月7日,巴黎银行宕机超过24小时。当天,众多用户跑到推特上吐槽该事件,声称无法使用网上银行、转账或在线支付。这不是法国巴黎银行第一次宕机,在一月份,巴黎银行也曾因为系统宕机导致大部分业务受到影响。这样的业务中断绝非单一的偶然事件,英国最近的一项研究表明,英国本土的银行频繁遭到IT系统的危机,平均每天超过一起,这已经促使英国议会和监管部门展开调查。
正所谓菩萨畏因,凡人畏果。
业务中断的果,其实是业务背后IT架构的因。业务中断只是表象,在业务中断的背后,以银行为首的金融行业面临的则是灾备系统架构以及业务连续性管理的方向性问题。
二、业务背后的灾备架构演进
如何在业务不断发展的当下,构建一套完善的业务连续性管理方案?这个问题是金融科技从业人员需要亟待回答和不断摸索的。从冷备到热备,从本地到异地再到云端,从物理平台到虚拟化平台……各种方式不一而足。本文我们挑选了双活及两地三中心来简要叙述。
1、 双活
相比于单纯的备份,双活是使用主备两套IT系统同时承载业务(一般“主”所承载的业务量会更多),这样既增加了业务承载量,同时主备又可以互为备援,当一套系统出现故障时可以快速切换到备端,从而保障业务的连续运行,最大程度降低人为或自然灾害对业务造成的影响。
但双活的一个致命问题是无法解决逻辑错误问题,基于存储层面的双活一旦遭遇误删除、恶意篡改这种逻辑性错误,也就是出现我们常说的“双死”问题,因此CDP走入了人们的视线。由于篇幅有限,其中的具体技术细节我们后续找机会讨论。数据是业务的基础,业务是数据的运行方式,所以在双活的架构下,数据备份模块同样重要。
2、两地三中心
相比于双活,两地三中心概念则显得高大上很多,并且也衍生出了异地多活、云上两地三中等新的形式。两地三中心的架构模式中,实时性要求高的关键应用在同城两中心同时提供服务,保证数据与应用完全一致。主生产中心发生故障时,备生产中心能够立刻接管应用,保障服务零间断,提高业务连续性;主、备生产中心的数据实时远程存储到异地的容灾备份中心,保障数据零丢失。不过,两地三中心并不能保证万无一失,它同样需要面对一系列的问题,比如切换时间长、操作风险大、建设成本高等问题。
以上两种灾备价格是我们实际工作中经常会遇到的,但不管是双活还是两地三中心,在灾备方案设计的过程和部署过程中,因为原有业务的存在,经常会出现“专机专用”的现象,即不同业务系统需要不同IT架构予以配合,进而造成IT系统中 “竖井”林立,每个“竖井”又需要配备一个灾备系统,而这些灾备系统又总是需要单独安装、配置环境、数据初始化、监控运维等,不仅对运维人员的技能要求极为严格,而且人力成本极高。
在这样的的情况下,灾备架构的演化首先需要以提高资源利用率,降低操作风险,实现弹性部署、快速交付为主要目标。
三、灾备的融合之路
天下大势,分久必合,但合久未必会分。双模IT并不是谁将替代谁的问题,二者适用于不同的业务场景,但对于数据管理层面来说,“少”一定会战胜“多”。
在享受IT创新所带来的高效与便利的同时,也需要承受整个数据中心的IT架构复杂度的不断增加,不断面临服务资源浪费、业务系统和系统响应能力底下、SOA架构的不合理等等的问题。同时,在各家银行转型升级的过程中,新业务的发展也必定会对创痛业务的IT架构造成影响, 这里以某银行的相关实践为例:原有一些IT业务架构是基于不同的物理机和虚拟化平台而搭建,采用分离部署的架构,单纯地定时备份无法解决数据及业务安全问题。
经过相关沟通和具体调研,该家银行决定采用英方的融合灾备方案予以解决,而在这个方案中包含了多个业务模块,包括:
- 使用英方i2Move在同城中心虚拟化平台快速搭建容灾服务器;
- 使用英方i2Avalibility实现业务系统故障自动切换到容灾平台,正常情况数据实时复制到容灾服务器;
- 使用英方i2CDP在容灾中心实现数据集中保护,可防止数据误删除、勒索病毒等故障。在容灾中心进行数据备份还可减少生产系统的读写压力;
- 使用i2Active数据库语义级复制产品,实现备端可查询的数据库双活;
融合灾备方案架构
从整个解决方案来看,这并非是单一的某款产品可以解决的,而是采用一种融合的整体解决方案,即通过一个统一的灾备管理平台,将容灾与备份合二为一,实现了灾备数据的“池”化管理,从而做到数据的统一管理。这种方式的优势在于可以从顶层设计出发,既适用于传统IT业务的集中性、大规模开发,也适用于新型IT业务的快速迭代、敏捷开发,从底层系统就开始构建一个统一的融合架构。
在大数据时代,如何确保数据安全和企业业务的连续性,是各行各业都无法避免的问题。行业本身的特殊性决定了金融行业更早的面对这些问题。在双模IT下,重新描绘银行乃至整个金融行业的灾备架构恰逢其时。
原文地址:https://blog.51cto.com/14117782/2373120