业务连续性对中小企业一样必要

对于大多数企业来说,业务连续性似乎成为了一个奢侈的目标。那么如果我们无法建立容灾中心,传统的备份就不能实现业务连续性目标了吗?

  业务连续性是我们今天所广泛探讨的话题,一般而言,业务连续性的实现对大型企业来说相对较为容易。因为这些企业有自己的IT员工和丰厚的资金保证,可以花费数以百万计的美金来建立备用的数据中心,把所有信息在远程的灾备中心进行异地保存,同时还应用了许多其他灾难恢复技术。

  以911事件为例,有多家金融服务机构就位于世贸大厦中或者周边地区,著名的双子大厦倒塌后,这些金融服务机构却没有丢失任何一笔交易数据,并在灾难之后数小时内就完全恢复运营。这是为什么呢?因为这些机构在远程的数据中心有运行着OpenVMS操作系统的昂贵服务器,随时可以进行业务切换。只要系统瘫痪了,强大的网络就可以转换到备份的站点上。

  然而并不是所有的企业都有如此庞大的财力和人力来构建标准的容灾中心,同样是处于911事件中的另外一家律师事务所,采用常规的磁带备份方式来备份业务数据和客户资料。911事件发生后,他们的资料随着大厦一同化为灰烬,以至于该事务所的业务在相当长一段时间内不能恢复正常。

  由于容灾中心的运转过程太过复杂,维护它有效运营的成本也太过沉重,对于大多数企业来说,业务连续性似乎成为了一个奢侈的目标。那么如果我们无法建立容灾中心,传统的备份就不能实现业务连续性目标了吗?

  徒劳无功的备份与恢复

  如果数据无法恢复,那么备份就是浪费时间和金钱。然而根据业务分析公司 Enterprise Strategy Group调研数据分析,全球大约有40%的数据恢复失败了,失败的原因并不在于备份软件或者磁带上,而是由于备份任务本身的复杂性决定的。

  如果我们研究备份的过程和原理,我们会发现,整个备份操作将贯穿应用程序、服务器、存储设备和网络层,且备份本身是一个很容易受到影响的过程,除非在整个备份的过程中,一切都正常运转,否则很有可能这次备份将成为一次失败的操作。一旦备份失败,我们也很难找到失败的根源,因为有些备份解决方案供应商估计他们花了90%以上的时间在与软件无关的问题之上。

  备份的目的就在于:要完全精确地保证正确的数据在正确的时点得到恢复。为了达到备份的目的,备份的时候:

  1. 所有访问业务数据库的应用程序和服务都必须停止。

  2. 要找到最后一次完全备份的数据,装载恢复。

  3. 然后所有的相关的增量备份拷贝也要找到,按照正确的顺序装载恢复。

  4. 最后,必须正确使用数据库日志(假设日志可用)。

  要实现上述的这些步骤,Windows文件系统和文件必须在一个合适的时间得到保存,这一般是部署一个开放式文件管理器的必要条件。备份软件要做的就是读取很多的文件系统元数据,来判断哪些文件有所变化,然后就把整个文件系统以及/或者数据库进行拷贝,或者仅仅对有变化的一部分文件进行拷贝。

  这个过程取决于系统的大小,可能会花上数个小时,且整个备份过程占用了大量的运算资源和带宽,对应用程序的运营影响极大,为尽量避免对业务程序的影响,大部分公司选择做备份不超过一天一次,一般会选择在业务运营量最小的午夜至第二天凌晨的时段内进行。

  RPO和RTO是我们在衡量备份和业务连续性的时候,经常会用到的两个概念。恢复点目标(RPO)是在发生灾祸的情况下公司可接受的数据丢失量的衡量标准。受到目前备份和恢复技术上的限制,很多企业设定的RPO是24小时——在预定的增量备份过程发生之间。换言之,即使企业通过备份系统完全恢复数据,也损失了24小时的业务数据量。

  恢复时间目标(RTO)是指灾难发生后,业务恢复运营所用的时间,一般的企业从数小时到数天都是比较实际的RTO。然而这也是由于目前备份技术和操作上的限制造成的,而不是业务需求。

  真正的业务连续运营要求完全为零的RPO和RTO,虽然我们不可能完全达到,但至少可以无限接近。

  改善传统备份的性能

  面对这种痛苦的,混乱的备份过程和缓慢的不可靠的恢复,有些客户在寻找替代的技术,比如快照(snapshot)或者克隆(clone)。这些技术,虽然一定程度上减少了混乱,也提高了恢复效率,但只能解决部分问题,而且增加了操作成本和复杂度。

  克隆(clone)可以在某一时间点提供一份额外的数据视图,依赖于执行的同步性,这将是一个最近的或最接近的视图。举例来说,一个应用程序错误导致了主数据集的损失,也会导致从数据集的损失,结果就是损失了两次。

  快照(snapshot)可以帮助保护用户丢失的数据,但不能从硬件或站点错误中恢复数据。快照可以返回一个数天前特定时间的文件系统。然而,快照不提供政策管理和备份软件解决方案的可用性,因此它们在管理大规模的数据和较早的数据上效率极低。很多快照技术和私有硬件系统密不可分,因此限制了它们的应用。

  备份保护间隔一般是24小时;快照保护间隔一般是1至3小时;克隆无法保护由病毒或黑客造成的损失,且克隆的数据也是有问题的,只有最后一个版本可用,不能恢复过去的数据。

  最重要的是,决定实施快照以及/或者克隆的公司仍然需要他们的备份系统来保护他们的数据。这就留给这些公司,特别那些中层的公司,两个同样不痛不痒的选择:忍受备份的痛苦和不可靠性,或者接受成本、复杂度和技能需求的增加,来支持备份和新技术的日常操作。

  连续性数据保护(CDP)是近来兴起的可实施的,占用系统资源较小的,且价钱合理能够负担的一种解决方案,可在尽可能最短的时间内来恢复最大量的数据丢失和损坏。

原文地址:http://blog.51cto.com/zhaoshilei/2070143

时间: 2024-10-09 12:56:58

业务连续性对中小企业一样必要的相关文章

业务连续性实战

1.统计和收集netapp存储fas3240/2240上的服务器分布情况和使用容量. 2.确定迁移顺序,按照操作系统类别windows2003/2008进行p2v准备. 3.在6台新刀片上部署vmwarevsphere esxi server 5.5环境,将第二步骤收集的原有系统进行p2v迁移,迁移环境需要较好的ip链路和ip地址资源.链路要求:要求刀片服务供应商准备双向拷贝要求达到1000M网络速率,这样可以将服务器本地磁盘,操作系统,数据库安装配置环境等全部镜像到虚拟机中,形成完整可靠的虚拟

有关业务连续性的意外死亡

曾经看过一部话剧<一个无政府主义者的意外死亡>,讲的是一个意大利警局的故事,警察局长及警员将一个在押的无政府主义分子刑讯致死.局长找来一个疯子编排无政府主义分子的死亡过程,以期掩盖其死亡真相.如今,讨论行业/企业业务连续性,不知为什么想到了这部话剧,但不同的是,警察局要做的是掩盖真相,而我想做的是查找真相. 从意外说起 为了应对数据中心意外宕机,我们采取了很多措施,从数据中心机房供电.制冷;到服务器计算.存储和网络全部采用冗余的设计,其目的就是防止意外宕机事件. 对于行业/企业而言,因为意外宕

数据中心业务中断原因分析及业务连续性解决方案

云计算.虚拟化技术广泛运用的今天,为业务进行和维护带来方便的同时,数据中心也面临各种风险.云祺根据全球业务中断事件,以及真实案例总结出,常见的导致数据中心业务中断的三大原因. 一 硬件故障 包括服务器/存储宕机.Raid系统停止工作.内存虚拟驱动器受损等原因. 某云服务商因硬件故障导致服务器不可用数据丢失,联系服务器提供商和多家专业数据恢复公司紧急恢复后,仍多次恢复失败,最后确认数据无法恢复. 随着硬件系统发展的成熟度,针对硬件冗余方案较完善,比如双机热备.存储双活.虚拟化方式等,因硬件故障发生

存储双活保业务永续

2014年,一个最显著的变化是,双活数据中心跨越了概念炒作的阶段,被很多企业用户所接受.HDS提出了一种新的双活模式--GAD(Global-Active Device),基于存储实现双活,为业务连续性提供了坚实保障. 今天,保证7×24小时的业务连续性和数据随时随地可访问,已经不再是大型企业客户的"专利",而是普通企业用户和个人消费者最基本的诉求.与此相适应,从单纯的数据备份到数据容灾,从主-备模式的容灾方案到"双活"数据中心,为保证业务的连续性,IT厂商.用户采

Oracle RAC环境下的应用连续性

传统企业比如银行业和电信业的数据库大多采用oracle rac+dataguard的高可用架构,在rac项目实施过程中,由于业务连续性的苛刻要求,高可用的实施和测试工作显得尤为重要. oracle在新版本12cR2的rac官方文档里单独列了一章叫Ensuring application Continuity,重视程度可见一斑.在以前的oracle10g以及11g的版本中,client为实现RAC failover(故障转移)特性,各类应用app以及db需要作各种配置调整工作,随着oracle的1

详解ICT及其业务领域范围

1.什么是ICT? 那么什么是ICT?ICT即信息通信技术,这种表述更能全面准确地反映支撑信息社会发展的通信方式,同时也反映了电信在信息时代自身职能和使命的演进.ICT指标体系包括核心指标体系和影响力指标体系,其中ICT核心指标体系列表包括ICT基础设施指标,家庭和个人ICT接入.使用指标,企业ICT接入和使用指标这三个部分.核心指标体系已经成型,而ICT影响力指标仍处于研究过程中.从一些发达国家和政府组织进行的有关企业ICT调查工作收集的信息内容看,目前企业ICT的接入与使用着眼点分为以下四个

24、【华为HCIE-Storage】--Hyper Snapshot(块业务)

------------------------------------重要说明------------------------------------ 以下部分内容来网络,部分自华为存储官方教材 具体教材内容请移步华为存储官网进行教材下载 网络引用内容无法找到原创,如有侵权请通知 ------------------------------------重要说明------------------------------------ 随着计算机技术的发展,数据备份的重要性也逐渐凸显.在最初的数据

30、【华为HCIE-Storage】--Hyper Metro(双活【块业务】)

------------------------------------重要说明------------------------------------ 以下部分内容来网络,部分自华为存储官方教材 具体教材内容请移步华为存储官网进行教材下载 网络引用内容无法找到原创,如有侵权请通知 ------------------------------------重要说明------------------------------------ HyperMetro特性为用户提供了灵活且强大的数据容灾功能,

谐云客户案例 | 华数传媒互联网电视业务的IT变革之路

  "与华数的合作,对于容器技术能力是一次充分的考验.华数的很多业务具有鲜明的互联网特色,华数的云上.云下多数据中心架构需要云平台底座能够支撑亿级流量的高并发,保证华数业务7x24小时稳定流畅地运行." --谐云科技架构师魏欢说. 谐云科技加快华数传媒IT变革的步伐 华数传媒与移动咪咕合作开展的互联网电视业务已经好几年了,但咪咕魔百盒业务现有的平台无论从技术架构还是产品演进方面都难以满足移动运营商对于视频业务发展的需求及日益增长的竞争压力.对于华数传媒团队互联网技术部的严格标准性,不仅