数据中心业务中断原因分析及业务连续性解决方案

云计算、虚拟化技术广泛运用的今天,为业务进行和维护带来方便的同时,数据中心也面临各种风险。云祺根据全球业务中断事件,以及真实案例总结出,常见的导致数据中心业务中断的三大原因。

一 硬件故障

包括服务器/存储宕机、Raid系统停止工作、内存虚拟驱动器受损等原因。

某云服务商因硬件故障导致服务器不可用数据丢失,联系服务器提供商和多家专业数据恢复公司紧急恢复后,仍多次恢复失败,最后确认数据无法恢复。

随着硬件系统发展的成熟度,针对硬件冗余方案较完善,比如双机热备、存储双活、虚拟化方式等,因硬件故障发生业务中断的事件概率不断下降。

二 逻辑错误

逻辑错误又包括了软件原因和人为原因。软件原因有应用系统出现错误、文件系统崩溃、数据库逻辑故障、病毒等。人为原因有数据误删除、虚拟设备被删除、恶意操作等。

某银行电脑脱机致网络瘫痪,业务中断三小时;某公司被勒索病毒,巨额勒索金额下,不得不“牺牲”业务数据;某云服务商遭员工恶意删除数据库,影响百万用户,预计赔付1.5亿元...

逻辑错误是导致数据丢失、业务中断事件发生的重要原因。

三 自然灾害

比如发生灾害、地震、暴雨等意外与自然灾害。

亚马逊位于弗吉尼亚的US-East-1数据中心因为一场风暴导致业务瘫痪,由于数据中心停止运行,亚马逊的云服务Amazon Web Services也因此一度中断服务;某学校机房在一场连续暴雨中意外进水,数据中心直接被毁...

此类事件发生概率小,但具有无法预测性,且一旦发生则是无法挽救。

总结以往业务中断的安全事件就能发现,一旦数据中心因各种原因造成业务中断的情况发生,将严重影响企业业务的正常运营,不仅使用户体验差,影响企业品牌声誉,甚至可能导致直接经济利益损失。无论是独受其害还是波及他人,企业的业务中断和数据丢失带来的损失都是不可估量的。

所以如何保证数据中心的业务连续运营是数据中心管理者们首先要考虑的重要问题。那么如何才能有效保证数据中心的业务连续性?云祺科技建议:

一 建立专业的容灾备份系统

信息系统属于企业重要的信息基础设施,对于信息系统安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。云祺科技为重要业务系统提供虚拟机、数据库、文件的定时备份、实时备份、异地备份、恢复等容灾备份解决方案,保障用户业务系统高可用。

二 定期灾难恢复演练

从用户终端到服务器、存储器、甚至包括机房环境,需要做定期灾难恢复演练。灾备预案、预案演练、预案维护,风险和灾难规避评估、确定整体恢复策略,通过这些活动可以将数据中心业务中断的风险有效降低。
云祺容灾备份解决方案在生产环境中构建一个隔离的、可验证的灾难恢复演练区域,在不影响现有生产环境的前提下,用户可将多个已备份的级联关键业务虚拟机配置到同一个灾难演练预案中,通过可视化的配置和操作即可快速的执行整个灾难演练计划,从而确保了灾难发生时,能够正确的恢复关键业务,同时实现备份数据的完整性、一致性、可用性验证。

建立专业、可靠的灾备系统和业务连续性体系不仅仅是规范企业自身的IT建设,更是用户除了产品质量需求以外,对企业服务质量又一重要诉求。

原文地址:https://blog.51cto.com/10989517/2480063

时间: 2024-10-09 12:56:57

数据中心业务中断原因分析及业务连续性解决方案的相关文章

Entity Framework 数据并发访问错误原因分析与系统架构优化

本文主要记录近两天针对项目发生的数据访问问题的分析研究过程与系统架构优化,我喜欢说通俗的白话,高手轻拍 1. 发现问题 系统新模块上线后,使用频率较高,故在实际使用和后期的问题重现测试中,产生了一下系列的数据访问错误 错误是比较常见的错误 2. 分析问题 系统的架构为前端.业务层与数据层三层架构,采用Entity Framework 3.5作为数据处理技术,采用shared context per request模式,参照的是codeplex上的一个示例.示例地址(此文通俗易懂,代码结构也很清晰

XSS、CSRF、SQL注入原因分析,危害,解决方案

一.xss 名词解释:xss指的是攻击者利用用户提交的数据没有就行过滤和转义处理的缺点,进而添加一些代码到web界面中去.利用了系统对用户的信任 危害:盗取各种账号,网站挂马,非法转账等. 造成原因:过于信任客户端提交的数据. 解决办法:对客户端提交过来的数据进行过滤,转义,正则校验. 举例: 有个表单域:<input type=“text” name=“content” value=“这里是用户填写的留言”> 1.假若用户填写数据为:<script>alert('dog!')&l

双活数据中心架构分析及优缺点

什么是双活数据中心 ? 首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的.一个真正的双活方案是应该涵盖基础设施.中间件.应用程序各个层次的. 双数据中心同时对外提供业务生产服务的双活模式,两个数据中心是对等的.不分主从.并可同时部署业务,可极大的提高资源的利用率和系统的工作效率.性能,让客户从容灾系统的**中获得最大的价值. a.两个生产中心部署相同的业务系统,结合网络层.主机层或应用的负载均衡技术

软件定义存储在大型数据中心的应用分析

历史经验一再表明,由技术进步推动的变革往往以超乎人们想象的速度和烈度发生.SDS软件定义存储作为新兴的技术,即使穷尽你所有想象,也难以预测其发展的速度有多快,影响的程度有多深远.面对新的变革和潮流,在追逐变化的同时,还需冷静思考可能带来的问题.SDS在数据中心的应用一定能提高性能和降低成本,并可控风险么?SDS会隐藏什么样的问题? 问题一.不能充分利用现有的基础架构 数据中心是非常繁忙的,IT部门要同时接受从多个不同的应用系统发来的需求和数据任务并及时响应和处理.另外,IT专业人员的日常工作还需

数据中心如何有效应对酷暑的考验?

2015年是全球有史以来最热的一年,然而不幸的是,根据美国国家航空航天局(NASA)和美国国家海洋和大气管理局(NOAA)气候研究院预测,地球表面的平均温度将在2016年再次创下新高.不仅如此,2016年夏天将成为有史以来最为酷热的一个夏天.这标志着全球平均气温将首次连续三年屡创新高! 夏天对大部分人来说是美好的,我们可以尽情享受各种惬意的户外活动,比如高尔夫.网球.骑自行车远足.户外烧烤,或晒晒日光浴让自己拥有更为健康的肤色.但对于数据中心的管理人员而言,夏天的到来意味着温度的急剧攀升和随之而

揭穿数据中心基础设施管理(DCIM)的神秘面纱

物联网出现很久之前,电脑还不够个人化,手机.冰箱和汽车也不够智能的年代,你是否记得电视上曾经反复播放着某品牌机油滤清器的广告? 高档的机油滤清器的价格比普通品牌高出将近一倍,这对于用户来说无疑十分昂贵.因而这种高档品牌的产品首次进入市场时曾经遭遇用户非常严重的抵触情绪.然而,随着它的卓越技术逐渐提高了汽车的性能,同时有效减小故障发生的几率以及避免了昂贵的检修费用.于是毫无疑问,相较于更换汽车引擎,人们还是更倾向于更换机油滤清器. 于是该产品逐渐获得了用户的青睐,并最终占据了市场的统治地位. 这个

运维好数据中心的四大法宝

对于数据中心,运维工作的重要性不言而喻,在数据中心生命周期中运维管理是历时时间最长的一个阶段.数据中心运维的工作主要是对数据中心各项管理对象进行系统的计划.组织.协调与控制,是信息系统服务有关各项管理工作的总称,具体包括对机房环境基础设施部分的维护,系统与数据维护,管理工具的使用,人员的管理等方面.投资巨大的数据中心,为了能够尽快得到收益,就需要在运维的工作上多下工夫,切勿进入"一流设备.二流设计.三流运维"的不良运营之中,高品质数据中心运维的工作至关重要.那么如何才能提升数据中心的运

双活数据中心 是什么

出于灾备(Disaster Recovery)的目的,一般都会建设2个(或多个)数据中心.一个是主数据中心用于承担用户的业务,一个是备份数据中心用于备份主数据中心的数据.配置.业务等. 主备数据中心之间一般有三种备份方式. 的情况下,只有主数据中心承担用户的业务,此时备数据中心对主数据中心进行实时的备份,当主数据中心挂掉以后,备数据中心可以自动接管主数据中心的业务,用户的业务不会中断,所以也感觉不到数据中心的切换. 的情况下,也是只有主数据中心承担业务,但是备用数据中心不会对主数据中心进行实时备

数据中心基础设施管理(DCIM)解决方案能为管理者带来什么?

忙到无法节省时间 数据中心的管理效率可以通过浪费的时间和金钱来衡量.在最近的一项调查中,分别来自美国和英国的200位数据中心管理者表示,运用数据中心基础设施管理(DCIM)解决方案这类工具可以使他们的工作"更容易.更快捷.更节省成本". 如果应用DCIM解决方案真的能节省时间并有效降低运营费用,那为什么调查发现仍有43%的数据中心管理者还在依靠人工方法替代DCIM呢?到底是什么原因阻碍了DCIM的应用呢? 没有时间或预算实施DCIM 英特尔委托Redshift调研机构深入探寻当下数据中