SQL Server 2012笔记分享-52:可用性指标

在电信和可靠性理论中,可用性是指:

系统,子系统,或者设备在开始一项任务时处在指定的可操作或可提交状态的程度,这项任务什么时候被用到是未知的,例如,是随机的。简单的说,可用性就是一个系统处在可工作状态的时间的比例。这通常被描述为任务可行率。数学上来讲,相当于1减去不可用性。

在一个给定的时间间隔内,对于一个功能个体来讲,总的可用时间所占的比例。

例如,一个一周里(168小时)有100小时可用的单元的可用性为100/168。可用性的值通常用小数来表示(如0.9998)。在高可用性的应用中,使用一个被称为几个九的度量,对应小数点后9的个数。在这个系统中,“五个九”相当于0.99999(或者99.999%)的可用性。

例子

如果我们使用的设备的MTBF(平均故障间隔)为81.5年,MDT(平均修复时间)为1小时:

MTBF in hours = 81.5*365*24=713940

Availability= MTBF/(MTBF+MDT) = 713940/713941 =99.999859%

Unavailability = 0.000141%

每年每设备的当机时间以小时计为: U=0.01235 小时每年。

==============================================================

ISO9241/11中的定义是:一个产品可以被特定的用户在特定的境况中,有效、高效并且满意得达成特定目标的程度(The extent to which a product can be used by specified users to achieve specified goals with effectiveness, efficiency and satisfaction in a specified context of use.)。

GB/T3187-97对可用性的定义:在要求的外部资源得到保证的前提下,产品在规定的条件下和规定的时刻或时间区间内处于可执行规定功能状态的能力。它是产品可靠性、维修性和维修保障性的综合反映。

==============================================================

下面是一个可用性的图例,在不同的可用性标准下,每年允许的宕机时间,每月允许的宕机时间和每周允许的宕机时间。

==============================================================

延展知识

RPO(Recovery Point Object)

指一个过去的时间点,当灾难或紧急事件发生时,数据可以恢复到的时间点。例如每天23:00进行数据备份,那么如果今天发生了宕机事件,数据可以恢复到的时间点(RPO)就是昨天的23:00。

(对比RTO,恢复时间目标,是指宕机发生后多长时间要恢复运行。)

短时间的RPO能够更少地丢失数据。例如,一个五分钟的RPO表明必须在五分钟内恢复数据,而一个一小时的RPO表明这种数据恢复的弱点在于,在这一个小时内,要备份的数据可能已经丢失了。相反地,一个零分钟的RPO表明没有数据可以丢失,因为您的数据及时地备份、复制或记录下来,从而阻止任何数据的丢失。RPO要考虑的另外一个层面是数据的保护要完整和全面到什么程度。例如:您的RPO如果每隔8小时备份一次的话,意味着这8个小时内数据可能会丢失。完全和全面的数据保护注重的是您的数据是否100%的被保护起来或者说只有部分的文件和数据被保护起来。再举一例,打开的文件可能不能被完全的备份,除非内存里面的缓存中的数据存储到了磁盘里。另外还要考虑的因素是您所要备份的文件是否是某个特殊的目录或文件共享中的某种特定文件,以及数据是否完全备份下来了。小的RPO意味着要付出更多的费用以及更少的数据丢失量,我们必须在这之间作一个权衡。

简单来说:就是故障发生时,允许的最大数据丢失。

RTO:(RecoveryTime Object)是指灾难发生后,从IT系统宕机导致业务停顿之刻开始,到IT系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。

简单来说:就是故障发生时允许的最大宕机时间,通常表示为数字,例如9s。

目标越高,成本越高。

=================================================================

The Myth of the 9’s of Availability

It is common for organizations to state that they provide a number of 9’s of availability when referring to their environments. The truth is often much different than what is advertised and even then, it is often meant for only operating hours or not counting planned downtime, which may not be clearly documented in the SLA. Committing to only business hours and unplanned outages is acceptable as long as it is supported by what is documented in the SLA.

Note: Microsoft recommends that the 9’s of availability are based on agreed upon hours of operation, which should be clearly stated in the SLA.

The table on the slide above outlines the 9’s of availability and what actually means to have that level of uptime. Based on the table above, if an organization claims to have 3 – 9’s of availability and they are a 24/7 operation, they can only have 8.76 hours of downtime per year.

Additional resources

The table above provides only a brief idea of availability impact and understanding high availability for operations. For more information, refer to the following Microsoft Operations Framework (MOF) resources:

Microsoft Operations Framework – SLA Review –

http://www.microsoft.com/technet/solutionaccelerators/cits/mo/mof/omr/sla.mspx

High Availability and the Microsoft Operations Framework –

http://technet.microsoft.com/en-us/library/aa560207.aspx

=================================================================

SQL Server 2012笔记分享-52:可用性指标,布布扣,bubuko.com

时间: 2024-11-06 21:33:47

SQL Server 2012笔记分享-52:可用性指标的相关文章

SQL Server 2012笔记分享-55:高可用知识总结

------------------------------------------------------------------------------------------------------------- 故障转移群集 虽然群集的共享存储是单点的,但是从存储层面来看,是配置了存储的冗余的,所以也一定程度上实现了冗余. 在群集模式下,一个SQL群集实例只在一个节点上是活跃的,即同一时刻每个SQL群集实例的服务只在群集中的一个节点上是处于运行的状态 ,所以如果有多个数据库,想把数据库放

SQL Server 2012笔记分享-7:高可用性功能的增强

(一)数据库镜像 1.支持压缩传输 2.支持自动页修复(msdb..suspect_pages) (二)数据库群集     1.支持多子网 SQL Server 多子网故障转移群集是一种配置,其中每个故障转移群集节点都连接到其他子网或其他子网组.这些子网可以处于同一位置中,也可以位于地理上分散的站点. 跨地理上分散的站点进行群集有时称为拉伸群集. 因为没有所有节点都可以访问的共享存储,所以在多个子网上的数据存储之间应该复制数据. 对于数据复制,有多个可用数据的副本. 因此,多子网故障转移群集除了

SQL Server 2012笔记分享-54:数据库文件管理1

(一)添加文件 可以在线执行,不影响数据库使用 ,如图. 添加完成后,如图所示. 也可以通过脚本的形式来添加,如图. (二)删除文件 可以在线执行,不影响数据库使用 . 只有当文件中的实际使用空间为空时才能被成功执行 . (三)移动文件到不同的磁盘路径下 必须先将数据库脱机,将导致数据库暂时不可用 详情参考:http://msdn.microsoft.com/zh-cn/library/ms345483.aspx 若要将移动数据或日志文件作为计划的重定位的一部分,请执行下列步骤: 1. 运行以下

SQL Server 2012笔记分享-46:如何快速学习T-SQL语句

对于初学者来说,T-SQL语句的编写一直是个难题,初学者还是习惯使用图形界面来做相关的SQL方面的维护工作.但是在一个稍微复杂大型的SQL场景中,如果我们能够快速的掌握和理解SQL语句的编写和使用,那么会使我们的运维工作达到事半功倍的效果. 其实对于SQL server 2012来说,本身就提供了很多途径来帮助初学者获取日常管理任务的对应T-SQL脚本.下面我们来举几个快速获取T-SQL脚本的例子. ================================================

SQL Server 2012笔记分享-38:了解系统数据库

master 数据库 记录 SQL Server 实例的所有系统级信息. master 数据库记录 SQL Server 系统的所有系统级信息.这包括实例范围的元数据(例如登录帐户).端点.链接服务器和系统配置设置.此外,master 数据库还记录了所有其他数据库的存在.数据库文件的位置以及 SQL Server 的初始化信息.因此,如果 master 数据库不可用,则 SQL Server 无法启动.在 SQL Server 中,系统对象不再存储在 master 数据库中,而是存储在 Reso

SQL Server 2012笔记分享-32:性能计数器监控SQL

需求 要求使用windows自带的性能监视器监控SQL的如下对象,并将结果保存便于日后分析. 性能对象:SQL Server databases,计数器:log file(s) size 和 datafile(s) size 性能对象:SQL Server:buffer manager,计数器:page reads/sec 性能对象:SQL Server:memory manager,计数器:total server memory(KB) ============================

SQL Server 2012笔记分享-33:SQL Server profiler跟踪

需求 使用SQL server profiler跟踪当前实例的所有常见活动,并将结果保存到文件中. ================================================================ 开始程序中选择SQL server profiler,如图. 选择文件--新建跟踪,如图. 连接到当前的SQL server实例,如图. 在跟踪属性里面配置跟踪名称.保存到的文件地址.保存到SQL报表.启用跟踪停止时间等,如图. 下图是一个跟踪启动后实时的跟踪情况,如图

SQL Server 2012笔记分享-1:SQL Server版本的演变

SQL是英文Structured Query Language的缩写,意思为结构化查询语言.SQL语言的主要功能就是同各种数据库建立联系,进行沟通.按照ANSI(美国国家标准协会)的规定,SQL被作为关系型数据库管理系统的标准语言.SQL语句可以用来执行各种各样的操作,例如更新数据库中的数据,从数据库中提取数据等.目前,绝大多数流行的关系型数据库管理系统,如Oracle, Sybase, Microsoft SQL Server, Access等都采用了SQL语言标准. SQL server版本

SQL Server 2012笔记分享-2:主要服务器组件

SQL server 2012主要包括如下的五大组件 SQL Server数据库引擎 SQL Server 数据库引擎包括数据库引擎(用于存储.处理和保护数据的核心服务).复制.全文搜索.用于管理关系数据和 XML 数据的工具以及 Data Quality Services (DQS) 服务器. 分析服务 Analysis Services 包括用于创建和管理联机分析处理 (OLAP) 以及数据挖掘应用程序的工具. 报表服务 Reporting Services 包括用于创建.管理和部署表格报表