【两地三中心】两地三中心--灾备解决方案

两地三中心,两地是指同城、异地,三中心是指生产中心、同城容灾中心、异地容灾中心。结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,同城双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点。异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。

备端在线的两地三中心灾备解决方案

浪擎设计的备端在线两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。本地机房的容灾主要是用于防范生产服务器发生的故障,异地灾备中心用于防范大规模区域性灾难。本地机房的容灾由于其与生产中心处于同一个机房,可通过局域网进行连接,因此数据复制和应用切换比较容易实现,可实现生产与灾备服务器之间数据的实时复制和应用的快速切换。异地灾备中心由于其与生产中心不在同一机房,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,应用系统的切换也需要一定的时间,因此异地灾备中心可以实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。

1. “双活”+异地容错的技术方案

1.1 备端在线两地三中心灾备方案网络设计

本地容灾是指在本地机房建立容灾系统,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,本地双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点;异地灾备中心是指在异地建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。针对两地三中心灾备建设的需求,我们结合我们自主研发的软件的优势,设计了典型的建设方案。本地机房安装我们镜像系统,主备端同时在线,真正实现“双活”,是可见,可验证,可靠的容灾;异地机房安装实时备份,既能实现数据的实时复制,确保数据不丢失,又能任意时间点手动恢复,实现容错,而且无需主备硬件配置一致,还能降低成本。网络拓扑和部署如下:


两地三中心数据备份容灾架构图

2.2 备端在线容灾系统设计

在生产服务器上部署A镜像系统代理软件,在容灾服务器上安装A镜像系统服务器端软件,设置A镜像代理的检测路径为主存储路径,设置A镜像服务器路径为备用存储路径。通过Web管理界面配置镜像对象、全量和增量策略等。

1)当生产服务器处于正常工作状态时,把生产服务器的浪擎代理软件连接至服务器。当代理检测到主存储数据变化后,将捕获变化的数据实时的复制到备用存储上,实现了实时的复制。具体部署如下图:


两地三中心数据备份容灾架构图

2)当生产服务器故障,或者存储故障导致生产系统无法正常提供业务支持时,本地容灾服务器可直接接替生产服务器工作保障业务系统的持续运行;当本地机房发生灾难时,异地机房的容灾服务器可直接接替生产服务器工作保障业务系统的持续运行。具体部署如下图:


两地三中心数据备份容灾架构图

3)当生产系统恢复工作后,浪擎软件会继续其生产服务器的复制工作,并且在这之前会通过回切工具保障主备系统数据一致,具体部署如下图:


两地三中心数据备份容灾架构图

2.3 异地容错的容灾系统设计

如果本地机房发生故障,将异地容灾服务器中备份的数据进行手动恢复,可以直接恢复到原生产服务器(也可恢复到新服务器)。备份存储系统保存了应用系统任意时刻的数据,恢复时可恢复到任意时间点,实现容错,具体部署如下图:


两地三中心数据备份容灾架构图

通过以上4点保证了备用存储上的数据和主存储上的数据完全一致。避免了主存储的单点故障。
管理端可部署在备用服务器上或系统管理员主机上。
与一般的cluster不同,浪擎灾备系统不采用共享存储模式,首先避免了硬件方面的巨量投资;其次避免了由于共享存储硬件或者连接共享存储硬件链路的故障引起的业务系统中断,避免了单点故障.

2.4 备端在线的两地三中心容灾优势

1)  备端在线的容灾优势:

●  所见即所得的容灾,备用系统直接处于在线运行的状态,是直接可见、可验证的。不像其他容灾系统,一定要恢复后才能知道备用系统的好坏;

●  应用级的复制技术,即镜像系统复制的数据是数据库事务,是属于应用层的,从而可以保证数据库数据的完整性;

●  实施无需停顿业务系统,适合7X24小时连续运行的业务系统;

●  不需要主备系统硬件保证一致性,极大的降低系统改造及投入的硬件成本,只需备份存储空间大一点就行;

●  对网络带宽消耗非常小,不需专用的光纤传输网络,采用实时增量复制技术大大减少了资源的开销,对业务系统性能影响很小;

●  一旦主系统发生故障,由于备用系统的数据库直接处于运行状态,无需数据恢复阶段,仅需恢复业务系统即可,所以整个备用系统替换主系统的过程非常快;

●  采用实时增量复制技术,将数据复制到备用系统上,当主系统发生故障时,备用系统丢失数量极小,由于数据量小使得备份窗口趋于零,对主系统的性能影响很小;

●  应用方式多样化,支持多对一、一对多等镜像方式,为后期提供扩展平台;

●  基于WEB的统一管理平台,负责对服务器、数据库等进行配置,设置镜像策略,并监控复制链运行情况,方便管理。WEB监控界面可监控全网的备份任务及运行状态。每条监控记录就是一条完整的复制链路,包含镜像代理、镜像服务器、运行状态。


镜像系统监控

Web可监控全网所有镜像代理、镜像服务器的工作状态以及所有复制任务。复制任务监控信息包括:

编号:根据任务复制的顺序来排序的。

类型:模块类型,有文件,SQL SERVER和ORACLE三种。

服务器:镜像服务器所在服务器IP。

目标数据库:镜像服务器端备份数据库的名称。

执行内容:具体复制的内容,数据库监控的是SQL语句,文件监控的是复制的文件名。

开始时间:任务开始执行的时间。

结束时间:任务执行结束的时间。

状态:任务执行完成后的状态,如果复制成功显示为成功,失败显示的是失败。

2) 实时备份

浪擎服务器备份系统的客户端模块实时捕获数据变化,并进行实时增量传输,不间断的保护客户端数据,保障生产服务器的业务数据不丢失。并且可以恢复到任意时间点和任意版本,无时无刻保护业务系统的数据安全。


增量处理示意图

3) 任意时间点还原

实时备份,保留所有的变化的数据块,可以根据用户的需求,恢复到任意的时间点的版本。增量和差异版本的实时复制、传输技术,以及全量加增量合成存储技术实现了数据完整性和任意时间点还原的功能。

4) 裸机还原

通常情况下,裸机要想进行信息处理需要进行硬盘分区和格式化、安装操作系统、安装驱动程序、安装应用程序等繁琐的步骤,需要花费大量的时间才能构造一个可用的系统环境。但是浪擎服务器备份系统可以轻松地将备份好的系统恢复至裸机上,实现一步到位。可以快速的恢复业务系统的运行环境,极大的降低业务系统的最大恢复时间(RTO)指标。达到高性能的容灾。

5) 容灾与容错相结合

采用CDP技术,系统能根据数据库事务日志的变化分析出数据库完整性点,在复制此数据到备用服务器的同时还将保存历史记录,保证系统可以以I/O数据块为单位恢复至任意时间点,并且每个数据版本都满足数据库级的一致性,即每个版本等都是正确可用的,而不需要尝试回退I/O。从而真正防止因数据库误操作对企事业单位带来的损失。

6) 异机还原

支持异机还原,避免单机故障导致的数据无法还原、使用的风险。

即时在不同硬件上,也可以恢复出故障的系统。

克隆与部署操作系统,不受硬件限制。

在物理计算机之间以及物理计算机与虚拟机之间进行迁移。

7) 对系统影响小

安装过程无需停机,采用定时全量和实时增量的技术,对网络和系统资源占用极低,不会影响生产系统的运行。

所有的操作在用户端完成,用户通过访问一个WEB浏览器来设定备份计划和策略,浪擎服务器备份系统将变化的数据从生产服务器捕获到,并传输到备份服务里,从而减少了对生产服务器的负担。

全量加增量合成存储备份技术,保证系统只需做一次全量备份即可,大大降轻系统负担。

8) 基于WEB的作业、管理、监控平台

支持Web-Manage平台,即所有的作业操作都可以在Web平台上完成。

支持远程WEB进行备份策略设置、作业监控、存储配置、空间管理等,无需进行现场维护。

通过设置备份计划与存储管理策略,让系统自动运行,极大地减少系统维护和管理工作量。

支持基于WEB的查询备份对象、图表的存储空间显示、备份策略管理、计划管理。

支持基于WEB的备份作业监控,可显示从触发、排队、启动、传输、存储整个过程。


浪擎镜像系统界面


镜像系统界面

时间: 2024-08-06 09:03:40

【两地三中心】两地三中心--灾备解决方案的相关文章

福州微软孵化器Azure 云灾备解决方案介绍

2016年10月28日下午,给福州微软孵化器企业介绍Azure云灾备解决方案.向入孵企业介绍了:云时代下重新思考如何通过公有云实现全面可靠的存储.备份及容灾解决方案 向在场的企业介绍了 1.现有容灾策略及挑战 2.小规模数据容灾 3.企业级数据存储及容灾 4.将 Azure 作为可扩展的容灾中心,驱动业务连续性 5.将 Azure 作为容灾引擎,驱动跨数据中心业务连续性

vitess元数据跨机房灾备解决方案

测试使用vitess的时候发现vitess元数据的实现有多种方案,etcd, etcd2, zk,zk2, 由于刚开始测试的时候使用的是基于k8s集群+etcd的,以下就分步说明灾备实现方案: 1. 前置条件 元数据实现方式必须选择etcd2, 即在启动的时候需要增加参数 -topo_implementation etcd2 #元数据实现方案, 此处一定需要选择etcd2, 如果选择etcd的话无法使用etcd API3提供的 etcdctl make-mirror进行数据同步 -topo_gl

微软云灾备解决方案线下交流

2016年4月15日,与福建微软合作伙伴进行交流,在交流会上向大家介绍了:云时代下重新思考如何通过公有云实现全面可靠的存储.备份及容灾解决方案 向大家介绍了一下内容 1.现有容灾策略及挑战 2.小规模数据容灾 3.企业级数据存储及容灾 4.将 Azure 作为可扩展的容灾中心,驱动业务连续性 5.将 Azure 作为容灾引擎,驱动跨数据中心业务连续性

DT时代下 数据库灾备的探索与实践

摘要: 随着DT时代的到来,企业对数据的依赖程度与日俱增,数据保护早已成为企业的一门必修课.只有拥有先知先觉的防范意识和充分的技术准备,才能"覆巢之下,亦有完卵" 170余场主题峰会和分论坛完美呈现,上千位分享嘉宾.数万名创新创业导师齐聚一堂,刚刚结束的2018杭州云栖大会让云栖小镇又一次成为探索数字世界的中心. 随着DT时代的到来,企业对数据的依赖程度与日俱增,数据保护早已成为企业的一门必修课.只有拥有先知先觉的防范意识和充分的技术准备,才能"覆巢之下,亦有完卵"

云灾备基础知识

一.灾备保护的什么? 对于各行各业而言,用户数据.系统数据均是企业最核心.最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏.只有完善的灾备方案,才能最终保障数据安全.业务连续性.随着互联网市场的蓬勃发展,及用户对数据重视程度的日益提高,据智研数据中心统计数据,灾备行业的市场规模已达百亿规模,且预计会逐年持续增长. 二.什么是灾备? 灾备是容灾和备份的简称.灾备方案=容灾方案+备份方案. 容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,互相之间可以进行健

数据级灾备

(IDC彭帅) 一.灾备保护的什么?对于各行各业而言,用户数据.系统数据均是企业最核心.最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏.只有完善的灾备方案,才能最终保障数据安全.业务连续性. 随着互联网市场的蓬勃发展,及用户对数据重视程度的日益提高,据智研数据中心统计数据,灾备行业的市场规模已达百亿规模,且预计会逐年持续增长. 二.什么是灾备?灾备是容灾和备份的简称.灾备方案=容灾方案+备份方案. · 容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,

灾备演练

12月20日: 灾备演练前告知灾难管理小组及相关业务部门提前做好准备工作. 12月21日: 一.[容灾演习-第一阶段开始] 1.7点钟灾难发生(模拟南汇生产机房火灾,导致服务器.网络设备受损严重.各业务均不可访问). 2.7时32分完成灾难确认及灾难评估,同步上报灾难管理小组决策是否进行灾备切换. 3.7时50分灾难管理小组组长决策进行灾备切换,按既定流程,确定于8:00准时开始切换核心营运系统到无锡灾备中心,预计10:00恢复核心系统及周边系统. 4.7时50分内部门户发布灾备演练维护通知,计

灾备模式的基本体系架构

灾备模式主要有“同城灾备”.“异地灾备”以及“同城一异地灾备”三种主要方式.同城灾备,是指灾备中心与生产中心处于同一城市内,可同时采用同步备份与 异步备份技术.其具有最低的投资成本,最快的灾难恢复速度,极高的数据保障,但无法应对区域性的灾难风险.异地灾备,是指灾备中心与生产中心在不同的城 市,一般只能实现异步备份.其投资成本较高,灾难恢复速度与数据保障能力略低,但可应付广泛的灾难风险.同城一异地灾备则是两者的结合,投资成本最高,但 同时具有前两者优点.同城一异地模式也分两种实现方式,一种是首先建

Oracle数据库备份工具——UCache企业级灾备云

UCache企业级灾备云以WEB平台的方式,向企业提供面向云端.虚拟和物理环境下的数据.平台.应用备份/恢复的云服务平台.向企业提供面向云端.虚拟和物理环境下的数据.平台.应用备份/恢复的云服务平台的数据级和应用级的备份与恢复.UCache企业级灾备云除了可以当作Oracle数据库备份工具,其实他的适用范围还不止这些,还包括:一.作为支持各种版本操作系统的数据备份/恢复的工具:1.Windows2000版本PC电脑端操作系统的数据实时.定时自动备份/恢复工具2.WindowsXP版本PC电脑端操