超融合基础架构与同城灾备建设实践

如何基于超融合及相应的 CDP 软件建设一个高可用、高稳定、高处理能力、低成本的灾备中心,进而满足监管要求,同时降低 IT 部门的 TCO?

2012 年监管单位发出 《关于加强基金管理公司信息系统备份能力建设工作》 的通知,通知里面明确了公募基金公司需要按照《证券期货经营机构信息系统备份能力标准》执行落实各业务系统备份能力建设目标和等级。2018 年底,监管单位发布的《证券基金经营机构信息技术管理办法》再次提到备份系统建设要求,即证券基金经营机构应当确保备份系统与生产系统具备同等的处理能力。

公募基金容灾方案面临的挑战

今年来,建设同城或者异地灾备机房,为核心生产系统建设同等处理能力的备份系统成为基金公司较为普遍的需求,但传统方案给 IT 部门带来较大的压力和挑战:

1.高昂的采购成本。传统架构需要购置大量服务器、同等性能的磁盘阵列并且对应的存储需要通过复制技术(例如 EMC VPLEX )保证数据冗余,应用系统层面需要通过负载均衡保证应用的高可用,才能构建同等处理能力灾备环境,这样的架构无疑需要高昂的预算才能满足。

2.复杂的运维工作。由于存储属于专业硬件设备,使用存储双活架构更是加大了存储运维复杂度,用户无法快速掌握产品运维能力,长期需要依赖原厂服务支持。

3.灾备演练流程繁琐。采用传统 SAN 架构建设灾备环境,无法高效完成灾备切换演练,需要多部门、多人员配合完成。

超融合架构配合基于虚拟化的CDP为容灾方案成本与效率带来重要突破

近些年随着虚拟化普及度不断提升,越来越多的生产应用都在虚拟化平台(例如 VMware )上部署,甚至包括 Oracle 、 SQL 等数据库应用也开始向虚拟化平台转移。在此基础上,进一步产生了基于超融合虚拟化架构(HCI)以及专门配合虚拟化的持续数据保护(CDP)产品。

超融合架构以融合部署方式在单个节点内提供了虚拟化和分布式块存储,除了继承虚拟化的优势以外,还通过分布式块存储带来如下好处

1.软件定义的架构基于 x86 服务器,配合融合部署模式,大大降低运维难度,同时减少了机架空间;

2.副本和自动恢复技术解决了硬件单点故障问题并进一步降低故障带来的人工运维成本和风险;

3.分布式的架构带来良好的可扩展性和并发性能,用户可真正做到按需投资并获得远高于传统架构的存储性能。

另一方面,新一代基于虚拟化的持续数据保护产品通过 VM 的复制(同步/异步)保证备份虚拟机里的配置和生产集群虚拟机一致,并带来了如下优势

1.自动化回滚;

2.分钟级故障切换;

3.可在几分钟内完成回滚;

4.可进行无中断灾难恢复测试。

以下是 SmartX 超融合和 Zerto CDP 容灾产品的架构图示意

国内某基金公司基于超融合+虚拟机CDP技术建设同城灾备机房实践

一、前期需求要点:

1.生产集群数据存储在一台中端存储,设备使用近 3 年,存储系统存在单点故障,需要解决存储单点故障问题;

2.考虑建设基于数据中心故障级别容灾中心,但预算有限,希望性价比最高的解决方案;

3.由于 IT 部门人员有限,因此希望数据中心的容灾切换足够简单,可以实现一键式切换演练;

4.现阶段 Oracle RAC 还部署在 IBM 小型机上,设备陈旧,考虑设备风险问题及运维复杂问题,希望尽快淘汰 IBM 小机;

5.生产和灾备中心基础架构性能方面须支撑核心数据库系统的日常业务压力,且需要拥有同等业务处理能力;

6.灾备机房计划租用 IDC 机房,空间有限,希望设备越少越好,同时要保证后续扩展便捷。

二、方案建议:

1.结合本次机房改造+灾备中心建设需求,推荐采用两套 SmartX 超融合集群+ CDP 灾备软件 (第三方软件) ,建设数据中心故障级别容灾中心;

2.通过 P2V 、 V2V 方法将小型机上 Oracle 数据库及核心生产应用迁移到超融合平台,淘汰老旧设备,通过超融合冗余技术(副本技术、机架感知技术等)解决集群硬件单点故障;

3.硬件均为标准 x86 服务器及以太网交换机;

4.通过超融合架构, 构建统一的存储池,提升整体系统性能,提升扩展能力,降低难度;

5.通过 CDP 灾备软件实现秒级的 RPO 和分钟级的切换。

三、方案成效

基于上述方案建设思路,方案实现后的架构和效果如下:

1.核心业务全支撑。完成两个数据中心的建设,全部生产系统均迁移至超融合平台,包括 O32 系统、估值系统、TA 系统、直销系统、各类 Oracle 数据库 (投资、TA、估值、风控、数据中心)、行情、报盘等;

2.多套机制保障业务连续性和数据可靠性。核心生产数据由 1 份数据增加到存放 3 份,即生产集群数据 + 灾备集群数据 + 利旧服务器搭建的 Oracle 服务器集群数据。其中,Oracle 服务器集群使用数据库 DG 功能进行复制,生产集群和灾备集群都采用双副本技术进一步保障;

3.统一为 x86 架构软件数据中心。生产集群由小型机 + x86 服务器 + 集中存储变为分布式 x86 服务器加软件构建的双超融合集群,并通过超融合管理界面,轻松管理生产、灾备集群,大幅降低运维工作量;

4.实现持续容灾保护。打通生产集群及灾备集群网络二层架构,通过 CDP 工具实现 RPO 秒级、RTO 分钟级容灾能力,两个集群上虚拟机互相备份,一键切换,极大的降低灾切演练复杂度;

5.首次投入成本大幅节省,未来实现真正的按需投资。两个集群均可水平扩展,按需投资,基础资源投入可满足 1-2 年需求即可。不使用专业硬件,首次采购成本下降明显;

6.机柜空间缩减 83% , IDC 租赁费用大幅降低。 IDC 使用超融合高密一体机,将此前生产基础架构所有硬件设备使用的 12 个机柜缩减到 2 个机柜,降低了 IDC 租赁费用;

7. 网络架构大幅简化。以太网+ SAN 网络的复杂网络架构转变为简单的以太网络架构;

升级之前

升级之后

8.性能大幅提升。超融合极大提升了存储 IO 性能,通过测试验证投资管理平台订单处理效率提升明显,其中委托下单含成交回报可达 130笔/s ; TA 系统完成跑批执行时间相比此前缩短超过 5 倍。

总结

通过超融合基础架构以及基于虚拟化的 CDP 容灾技术构建的新一代 IT 基础架构,较为快速的完成了数据中心级容灾方案的建设,符合 “稳态+敏态” IT 建设规划,同时简化基础架构运维工作,极大的提升了运维效率,降低了采购成本,使得信息技术部门可将更多的精力投入到公司业务发展层面上,希望以上方案和实践可以为业内带来有价值的参考。

原文地址:https://www.cnblogs.com/smartx/p/11909891.html

时间: 2024-11-05 18:53:34

超融合基础架构与同城灾备建设实践的相关文章

基于WinSrv2016(TP)构建的“超融合基础架构”

最近发现一个很热门的话题,国内的很多厂商也搞出了自己的"超融合基础架构服务器",那么什么是"超融合基础架构"呢? 超融合基础架构(Hyper-Converged Infrastructure,或简称"HCI")也被称为超融合架构,是指在同一套单元设备(x86服务器)中不仅仅具备计算.网络.存储和服务器虚拟化等资源和技术,而且还包括缓存加速.重复数据删除.在线数据压缩.备份软件.快照技术等元素,而多节点可以通过网络聚合起来,实现模块化的无缝横向扩展

Windows Server 2016 新功能HCI(超融合基础架构) By S2D

超融合基础架构(Hyper-Converged Infrastructure,或简称"HCI")也被称为超融合架构,是指在同一套单元设备(x86服务器)中不仅仅具备计算.网络.存储和服务器虚拟化等资源和技术,而且还包括缓存加速.重复数据删除.在线数据压缩.备份软件.快照技术等元素,而多节点可以通过网络聚合起来,实现模块化的无缝横向扩展(scale-out),形成统一的资源池.超融合架构(Hyperconvergence Infrastructure, HCI)将虚拟化计算和存储整合到同

什么叫超融合基础架构?

什么是超融合? "超融合"这个概念,可以简单理解为:将虚拟计算平台和存储融合到一起,将每台服务器里面自带的硬盘组成存储池,以虚拟化的形式提供数据中心所需要的计算.网络.安全以及存储等IT基础架构.在这里,也讲解一下超融合相对于传统虚拟化方案的优势. 横向与纵向的扩展性 顾名思义,横向扩展就是当发现存储和计算资源不够用了,按需添加服务器即可.比如,当用户的共享存储写满了,用户不得不花大价钱去购买一个新的存储机柜,然而此时存储机柜的资源利用率是很低的.而使用超融合方案的用户,他们只需要投入

基于WinSvr2016(TP)构建的“超融合技术架构”进阶篇

之前我有给大家介绍过<基于WinSrv2016(TP)构建的"超融合基础架构">,架构如下: 那大家还记得微软从Windows Server 2012推出的SOFS(横向扩展文件服务器)吗?忘了的话可以参考徐老师的博文<构建横向扩展文件服务器>,架构如下: 那么我今天想把2个东西合为一体,那么我接下来要做的就是超融合架构里再增加SOFS层上构建虚拟机,这样可以达到什么样的效果呢?最后我再告诉大家.那架构如下: 那基于之前的环境,我来构建SOFS吧: 选择SOFS

VMware vSAN超融合虚拟化架构与NetApp FAS2620存储服务器虚拟化架构对比

一.VMware vSAN超融合虚拟化架构设计 选择VSAN HCL(兼容列表)上的服务器 均衡配置1.建议集群内主机相似的硬件配置,如磁盘类型和数量.CPU.内存等VSAN支持某些主机不提供存储但仍能使用VSAN存储池,不过,不建议这么做 2.强烈建议至少4台主机因为3个节点下,如果坏一节点,VSAN无法重建Rebuild组件,也不能给新的虚机(如默认FTT为1)提供空间:另外,在3节点下,VSAN不能在维护期间从节点迁移所有数据 主机设计1.提供10%的CPU负载用于VSAN使用 2.最小配

超融合平台如何服务银行私有云建设?

金融体系尤其是银行,将扩大云平台的部署建设规模,这已成为业内共识.中国信息通信研究院在2018年3月特别出版了<中小银行上云白皮书>,提到: 中小企业融资需求和新农村建设需要的不断增强,中小银行纷纷成立,为地方经济建设提供了强有力的金融支持.与此同时,中小银行自身信息化建设能力面临很大挑战,在资金和人员有限的情况下,在风险必须可控的前提下,又快又好地建设银行业务全系统和基础设施成为中小银行发展亟需解决的掣肘. 云计算作为信息技术创新服务模式的集中体现,已经成为支撑各行业发展的关键信息基础设施,

浅析灾备建设三种模式

各个大型企业都有必要建立异地的灾难备份系统,同时需要重点考虑建设成本,寻求一种用的着,用的起的灾备系统建设模式.根据目前灾备行业发展现状,可以选择以下几种方式建设灾备系统: (1)自建灾备中心模式 ① 一次性投资巨大 灾难备份中心的资金投入涉及建筑工程.机房配套工程.IT系统投入.通信网络设备投入,这笔投入是为小概率的事件准备的,平时都处于闲置状态,导致总体投入成本(TCO)和投资回报率(ROI)不对称,灾备中心资源利用率低,也不能对期货经纪公司的信息化建设产生直接的推动作用. ② 运营成本高

灾备建设的两个指标RTO和RPO

数据备份最重要的目的就是"恢复数据".当系统出现故障损毁时,可以通过数据备份来恢复,最大限度降低损失. ? ? ? ? 但是,系统需要进行什么程度的备份,这就需要根据实际情况来制定.这里,有两个指标可以参考: RTO:Recovery Time Objective RPO:Recovery Point Objective RTO,指的是你可以容忍的系统服务中断时间,或者说系统服务中断后,用来恢复系统服务的最大时间.如果你想要RTO时间为0,那么你就要有充裕的资金来支撑系统建设,至少需要

超融合架构真的完美吗?

最早大概是由NUTANIX知道"超融合"概念,原本以为这又是厂商的噱头和炒作,谁知不然,超融合这两年发展如火如荼.2015年被公认为超融合元年,在软件定义存储SDS的推动下,超融合架构正在引领一场巨大的变革,成为软件定义数据中心SDDC的未来技术发展趋势. 超融合架构的优势和客户价值这个已经勿容置疑,各个厂商和媒体已经成功地帮客户洗脑了,和客户交流不提超融合都俨然被认为落伍,这里不用也不想再赘述.从辩证角度看,任何事物都不可能是完美的,超融合是不是也存在一些问题或局限性呢?超融合有适用