云灾备基础知识

一、灾备保护的什么?

对于各行各业而言,用户数据、系统数据均是企业最核心、最重要的财富,但以下种种原因,都可能给数据带来不可逆转的损坏。只有完善的灾备方案,才能最终保障数据安全、业务连续性。随着互联网市场的蓬勃发展,及用户对数据重视程度的日益提高,据智研数据中心统计数据,灾备行业的市场规模已达百亿规模,且预计会逐年持续增长。

二、什么是灾备?

灾备是容灾和备份的简称。灾备方案=容灾方案+备份方案。

  • 容灾的定义:指在相隔较远的两地(同城或者异地)建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一处系统因意外(天灾、人祸)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。侧重数据同步和系统持续可用。

  • 备份的定义:指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份或者多份拷贝,以增强数据的安全。侧重数据的备份和保存。
三、灾备的两个关键技术指标

RTO:RecoveryTime Object,恢复时间目标。指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。
RTO是反映业务恢复及时性的指标,体现了企业能容忍的IT系统最长恢复时间。设目标RTO值设定的越小,代表对容灾系统的恢复能力要求越强,但企业投资也越高。

RPO:Recovery Point Object,恢复点目标。指灾难发生后,容灾系统进行数据恢复,恢复得来的数据所对应的时间点称为RPO。
RPO是反映数据丢失量的指标,体现了企业能容忍的最大数据丢失量的指标。目标RPO值设定的越小,代表企业允许的数据丢失越少,企业损失越小。

设计灾备方案的核心是:帮助客户平衡RTO/RPO的需求和客户经济能力,找到最佳的实现技术和手段,适合的才是最好的。

四、备份的分类

分类方式
分类

按照备份内容
操作系统备份、数据备份

按照备份数据量
全量备份、增量备份、差异备份

按照备份形式
(主要针对数据库)
物理备份、逻辑备份

按照备份时数据库是否启动
(主要针对数据库)
冷备份、热备份

按照备份介质
磁带备份、磁盘备份

为了大家更轻松的理解这些分类,下面我详细解释下冷备、热备,增量备份和差异备份的差异:

分类
优点
缺点

冷备
将数据以隔离的方式来保存,
备份数据不受原数据的影响;
解决了硬件故障、人为误操作。
数据恢复慢

热备(又称冗余)
搭建冗余的环境,数据完全一致;
恢复速度快,瞬间恢复。
只能解决硬件故障,
不能解决人为误操作

分类
定义

全量备份
备份所有数据

增量备份
针对上一次备份所作的增量备份(上一次的备份可以是全备,可以是增备)

差异备份
针对上一次的全备份所做的增量备份

五、云产品的灾备特性

以下讲解以阿里云为例,其他云平台会有些许不同,大家可自行查阅官方文档。

ECS备份

备份类型
灾备级别

云磁盘三副本数据备份
解决底层硬件级别的故障,防范单点故障

快照/镜像
解决误操作,网络攻击等人为故障引起的数据损坏

SLB容灾(高可用)

SLB负载均衡
灾备分类
灾备级别

单可用区+单可用区SLB
是集群级别的灾备,防范了单点故障;
不具备机房级别的灾备能力和跨地域(城市)级别的容灾能力。

多可用区ECS+主备可用区SLB(是单个实例)
集群级别的灾备+机房级别的灾备,防范了单个机房断电等意外灾难;
不具备跨地域(城市)级别的灾备能力

多区域+跨地域多SLB实例+智能解析
结合云解析(全球负载均衡版),实现多线路智能解析和跨地域容灾。

RDS容灾(高可用)

RDS数据库
灾备分类
灾备级别

高可用版+单可用区
集群级别的灾备,防范了单点故障

高可用版+多可用区
集群级别的灾备+机房级别的灾备,防范了单个机房断电、火灾等意外灾难

高可用版+灾备实例
集群级别的容灾+机房级别的容灾+跨地域(城市)级别的容灾

数据库(含RDS)备份

数据库备份分类
备份方式
优缺点

传统冷备
本地备份:将备份集拷贝到本机其他盘、其他机器;
异地容灾:用户在其他地区自行搭建备份机房。
本地备份:无法抵御地震、台风等自然灾害;
异地备份:前期投入很大

阿里云DBS冷备
同城:DBS地域和备份源数据库相同;
异地:DBS地域和备份源数据库不同
可按量付费成本低;可将本地IDC数据库、其他云数据库、ECS自建数据库和RDS数据库备份到OSS;异地备份更简单

六、几种常见的灾备架构

1、用云搭建异地容灾中心

本地物理机房为主数据中心,仅将数据备份到云端。

2、基于公共云的同城灾备

将全部系统迁移上云,并部署在同一个地域的两个不同可用区中,实现系统的同城灾备。

3、基于公共云的异地灾备

将全部系统迁移上云,并部署在两个不同的地域中,实现跨地域灾备。

4、结合公共云同城灾备和异地灾备
如:两地三中心,

七、分析几起严重的数据丢失事故

炉石传说故障
2017年1月18日,由网易代理的暴雪旗下卡牌类游戏《炉石传说》遭遇了重大故障,从1月17日凌晨1点开始开始维护,直到1月18日下午18点才完成。
而更为可怕的是,《炉石传说》的数据并没有恢复,备份数据库也出现了故障,因此这款游戏的玩家被迫回档到1月14日15点20分。

案例分析:高可用没做好,导致实际RTO很长;
数据备份方案设计不完善,应充分考虑同机房不同机器+异地备份等方式,避免备库一起损坏。

Gitlab数据库被删除
2017年2月1日,GitLab 一位身处荷兰的疲惫系统管理员在进行数据库复制过程中不小心在一台错误的服务器上删除了一个目录,他删除了一个包含 300GB 实时产品数据的文件夹,在取消 rm -rf 删除命令后该文件夹只剩下 4.5GB 数据。并且最近的数据还是在6小时前备份的。
GitLab.com号称有五重备份机制:常规备份(24小时做一次)、自动同步、LVM快照(24小时做一次)、Azure备份(只对 NFS 启用,对数据库无效)、S3备份。这次事故发生时,所有备份全部无效!

案例分析:备份方案设计多么重要!周期性的灾难恢复演练(验证备份的有效性)多么重要!

腾讯云盘故障,致用户数据完全丢失
腾讯称该故障缘起于因磁盘静默错误导致的单副本数据错误,再加上腾讯运维人员在数据迁移过程中的两次不规范的操作,导致云盘的三副本安全机制失效,并最终导致数据完整性受损。

案例分析:单一的数据备份方式可能造成不可逆转的损失;多种备份方式结合使用,可最大概率的降低风险。

原文地址:https://www.cnblogs.com/zywu-king/p/10651698.html

时间: 2024-10-10 06:06:46

云灾备基础知识的相关文章

UCache云灾备免费使用

(IDC彭帅) 云灾备将灾备看作是一种服务,由客户付费使用灾备服务提供商提供灾备的服务模式.采用这种模式,客户可以利用服务提供商的优势技术资源.丰富的灾备项目经验和成熟的运维管理流程,快速实现用户的灾备目标,降低客户的运维成本和工作强度,同时也降低灾备系统的总体拥有成本. UCache云灾备免费使用100G(实际700G)--帮助企业用户实时高效低成本的增加业务容灾能力,一切为企业快速发展兜底!(数据压缩.重删比例:可达到7:1,实际700G的数据(意思是经过加密切块压缩,及并行重删备份后实际在

福州微软孵化器Azure 云灾备解决方案介绍

2016年10月28日下午,给福州微软孵化器企业介绍Azure云灾备解决方案.向入孵企业介绍了:云时代下重新思考如何通过公有云实现全面可靠的存储.备份及容灾解决方案 向在场的企业介绍了 1.现有容灾策略及挑战 2.小规模数据容灾 3.企业级数据存储及容灾 4.将 Azure 作为可扩展的容灾中心,驱动业务连续性 5.将 Azure 作为容灾引擎,驱动跨数据中心业务连续性

【总结】利用AWS实现高可用性和云灾备

下载地址:下载完整MP4视频 1. 邱洋的总结 企业用云可以从灾备云开始 为了让应用具备高可用和灾备能力,云平台自身针对基础设施以及云服务都应提供灾备与HA机制,例如: 云平台自身:云的分布式存储.虚拟机HA.控制器容灾.SDN网络容灾.虚拟机数据保护 云提供具备灾备的云服务 – EC2(虚拟机可以漂移).EC2实例恢复 – AMI(虚拟机模板备份) – EBS(数据2+份拷贝).EBS快照/恢复 – S3(数据2+份拷贝) – ELB(负载均衡到多数个EC2实例) – RDS(读写分离.主主部

混合云存储跨云灾备方案之跨云复制

摘要: 混合云容灾实现了跨云/多云场景中的应用和整机的灾备和恢复.支持整机和主流的企业应用,如各版本的Oracle(Oracle RAC近期即将支持)和SQL Server等.先进的压缩重删服务节约了备份时的网络带宽和空间占用,云灾备库的按需分配和弹性无限扩展,灾备ECS可关机不付费等多个特性,从多个维度将用户成本降到最低. 前面两篇文章介绍了基于阿里云备份的跨云备份和云存储网关的跨云复制,两者主要是解决文件粒度的备份与恢复问题.如果用户需要保护一个云上的数据库应用,而不仅仅是数据库的数据文件:

混合云存储跨云灾备方案之跨云备份

摘要: 阿里云混合云存储团队的云存储网关,混合云备份和混合云容灾产品能够给用户提供完备的容灾方案,从而解决客户本地IDC到阿里云的混合云灾备场景和其他云厂商平台到阿里云的跨云灾备/多云灾备场景所遇到的问题.通过两次备份和一次恢复来演示混合云备份是如何备份用户云主机上的文件,备份增量数据和恢复用户数据的. 公有云市场现状,问题及趋势 从全球公有云市场来看,亚马逊AWS一枝独秀,占据了接近40%的市场份额.2017年全年,AWS营收为43.3亿美元,销售额为174.6亿美元.而在中国公有云市场,阿里

异地容灾备份-免费云灾备

数据备份 1.同城容灾 同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行.同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步复制,保证高度的数据完整性和数据零丢失.同城灾难备份一般用于防范火灾.建筑物破坏.供电故障.计算机系统及人为破坏引起的灾难. 2.异地容灾 异地容灾主备中心之间的距离较远(>200KM),因此一般采用异步镜像,会有少量的数据丢失.异地灾

什么是企业级云灾备

随着企业数字化转型的快速发展,数据己经成为企业发展道路上的第一资产.而灾备也成为企业应对灾难发生时的最后一根稻草.那么如何利用科学的技术和方法,帮助企业来建立自己的容灾备份机制呢? UCACHE灾备云给出了企业级云灾备解决方案.以在线云服务的方式提供用户Web控制台,备份本地数据至云端和云端数据恢复至本地的数据保护服务,为用户的数据搬迁提供技术保障.什么是合格的企业级云灾备?UCACHE企业级云灾备又有什么优势?UCACHE灾备云五大优势点.UCACHE企业级云灾备的五大优势:一.数据容灾备份的

数据库备份/恢复-企业级云灾备

使用UCACHE灾备云进行Oracle实时复制数据.搬迁数据功能来设计Oracle数据库备份/恢复解决方案,支持定时备份.实时备份,增量备份,同时可开展异地灾备,是Oracle数据库灾备/恢复的完美解决方案. Oracle数据库系统是美国 Oracle 公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,目前最流行的客户 服务器 (CLIENT/ 或 B/S 体系结构的数据库之一 ,Oracle 数据库本身提供了对数据库物理文件进行冷备份和在线备份两种方式.在线备份类型包括:完全备份.差异

企业级云灾备,备份与恢复等级

企业现在的数据保护真的可把控吗? 物理环境.虚拟化和云环境混合架构是否让您在越来越复杂的IT架构中,系统自动化,我们不得不放弃数据的主动控制权,不得不在数据的使用安全问题,数据保护方面做出妥协和让步?真的不存在软件逻辑漏洞吗?如果您能轻松拥有和国家重保单位一样级别的灾备能力,您会感兴趣吗?是否愿意在保证现在架构不变的情况下,来增加企业异地容灾能力,来确保万无一失呢?UCACHE灾备云是一种能帮您轻松实现服务器灾难备份的云服务产品,能满足您要求的所有应用场景,满足公有云.虚拟环境.物理环境以及私有