IT运维管理体系:
IT管理中的PPT(people人;process流程;technology技术);
标准化(是否有紧急故障处理流程)、工具化;
备份解决方案;灾备解决方案;
监控解决方案;上线(回滚)流程;
测试流程;
紧急故障处理流程;
DB恢复流程;
各种故障演练;
服务service:
service是向客户customer提供价值value的一种手段,使客户不用承担特定的成本cost和风险risk就可获得所期望expected的结果outcomes;
老板(价值)、员工(手段);
service management服务管理:
service management是一套特定的组织能力,以服务的形式为客户提供价值;
serviceprovider-->resource-->capabilities-->transform-->valuableservice(goods or service)-->customer-->core competence
ITIL,information technology infrastructure library,IT基础架构库,英国商务办公室从20世纪80年代开始开发的一套IT管理方法,已成为事实上的行业标准,并以其为中心在全球形成了完整的产业,任何单位和个人都可免费使用的“公共框架”,实际上是一系列由所谓best practice最佳实践形成的图书;
ITIL不是硬件&软件,是一个可直接使用的标准,已于2005年12月15日被ISO接受为国际标准ISO20000;
ITIL发展历程(ITIL自发布以来,一直被业界认为是IT服务管理领域事实上的管理标准,直到2000年11月BSI英国标准协会正式发布了以ITIL为核心的国家标准BSI5000,2005年5月,ISO国际标准组织以快速通道的方式批准通过了ISO20000的标准决议,并于12月15日正式发布了ISO20000标准;
ITIL的目标:
将IT管理工作标准化、模式化,减少人为误操作带来的隐患;
通过服务目录,服务报告,告诉业务部门,我们可以做什么,做了什么;
通过系列流程,知识库减轻对英雄式工程师的依赖,把经验积累下来;
通过对流程的管控,减少成本,降低风险,提供客户满意度;
ISO20000针对企业,ITIL针对个人:
ITIL |
ISO20000 |
提供最佳实践指导 |
提供衡量ITSM的指标 |
没有固定的能力衡量指标 |
全球统一 |
对人员进行认证 |
对机构进行认证 |
咨询机构提供他们眼中的ITSM成熟度成果 |
关注于服务提供的独立认证,从IT服务管理体系的角度出发 |
IT service CMM(capability maturity model能力成熟度模型):
initial初始级-->repeatable可重复级-->defined定义级-->managed管理级-->optimizing优化级;
initial(被动响应,没有文档记录,几乎没有过程是经过定义的;各项目经验无法重用,依赖个人的努力和英雄主义);
repeatable(建立了基本的服务管理过程;所有项目有默认的规则,但未文档化、系统化;产品和服务无清晰的目标和策略);
defined(已将IT服务过程文档化、标准化,并综合成标准服务过程;根据客户需求调整服务产品和服务战略;适当的工具和信息报告);
managed(受监督、测量的IT服务体系;根据业务战略调整服务体系);
optimizing(持续改进的IT服务体系;IT与业务指标建立关系;IT与业务协作改进流程);
注:年故障次数、平均故障恢复时间;
ITIL V3:
ITIL V3核心模块:
流程建设(RACI模型):
RACI(responsible谁负责;accountable谁批准;consulted咨询谁;informed通知谁);
角色:服务所有者、流程所有者;
流程:效率、成本、质量、风险、稳定性、可持续性、用户体验;
项目及运营(项目管理、运营管理):
项目(临时性;有开始、结束;PMBok);
运营(持续性);
service strategy:
从组织能力和战略资产两个角度出发,为组织进行服务战略方面的决策和战略设计,提供了一套结构化方法;
我们的业务是什么?
我们的客户是谁?
客户重视什么?
谁依赖我们的服务?
他们怎样使用我们的服务?
服务为什么对他们有价值?
service strategy 4P:
perspective观念(面向其目标客户的业务定位或服务提供方式);
position定位(描述了采纳和中立场的决策);
plan计划(描述了将蓝图转化为现实的手段);
pattern模式(描述了一系列的稳定的决策和行动);
价值的组成部分:
能力 |
资源 |
||
1 |
管理 |
财务成本 |
9 |
2 |
组织 |
基础架构 |
8 |
3 |
流程 |
应用 |
7 |
4 |
知识 |
信息 |
6 |
5 |
人员 |
人员 |
5 |
service desigh:
对服务及服务管理流程设计和开发指导;
服务目录管理;
服务级别管理(
SLA,service level agreement服务级别协议,如99.9%,service provider与公司签的协议;
OLA,operational level agreement运维级别协议,公司内部,运维部门与公司签的协议);
容量管理(
商业容量管理(吞吐量);
服务容量管理(响应时间);
资源容量管理(cpu);
注:《web容量规划》);
可用性管理(
正常运行时间;
宕机时间);
IT服务持续性管理(
灾备;
恢复计划;
影响评估);
信息安全管理(CIA,confidentiality integrality availability);
service transition:
为如何将新的或变更的服务转换到运营过程中,并就相关能力的开发和改进提供了深入的指导;
变更管理(有关IT管理事件);
服务资产与配置管理(CMDB来源于此,自动化的核心);
service operation:
在IT服务发布上线之后,日常运行维护的阶段;
流程和职能:
为有效和高效的完成服务支持和服务提供,为客户和服务提供者的利益提供指导方针;
流程(事件管理、权限管理、故障管理、操作管理、问题管理、请求实现);
职能(服务台、技术管理、IT运营管理、应用管理);
RACI图 |
人员 |
||||
活动 |
张三 |
李四 |
王五 |
赵六 |
钱七 |
需求定义 |
A |
R |
I |
I |
I |
系统设计 |
I |
A |
R |
C |
C |
系统开发 |
I |
A |
R |
C |
C |
测试 |
A |
I |
I |
R |
I |
故障的管理目标:
尽可能的恢复到正常的服务运营,将故障对业务运营的负面影响减小到最低,并确保达到最好的服务质量和可用性水平;
综合考虑两方面:urgency紧急度、impact影响度;
impact |
||||
urgency |
高 |
中 |
低 |
|
高 |
1 |
2 |
3 |
|
中 |
2 |
3 |
4 |
|
低 |
3 |
4 |
5 |
优先级 |
描述 |
解决时间 |
1 |
critical |
1h |
2 |
high |
8h |
3 |
medium |
24h |
4 |
low |
48h |
5 |
planning |
planned |
故障管理流程输入:
故障请求提交;
故障单记录模板;
故障单填写模板;
故障分类规则;
故障优先级确定规则;
故障升级规则;
故障处理时间规则;
故障关闭规则;
故障管理流程输出:
故障历史记录;
故障分类汇总统计表;
故障处理用户满意度;
事故管理的指标有:
一线支持解决的事故百分比;
无升级的平均呼叫时长;
分配错误的事故百分比;
在目标时间之内,按照优先级解决的事故百分比;
二线支持平均响应时间;
事故平均解决时间;
重新分配的事故百分比;
归类错误的事故百分比;
绕过一线支持的呼叫百分比;
客户满意度;
服务请求呼叫百分比;
一次解决正确的事故百分比(一次正确解决率);
主动解决的事故百分比;
事件管理流程图:
故障管理流程图:
问题管理的目标:
预防问题的产生及由此引发的故障,消除重复出现的故障,并对不能预防的故障尽量降低其对业务的影响;
问题管理对业务的价值:
提供IT服务的可用性;
提高业务和IT人员的生产效率;
减少无效的规避措施或修补措施的开支;
减少在救火或解决重复故障方面的成本;
有助于知识的积累
故障管理 VS 问题管理
比较维度 |
故障管理 |
问题管理 |
根本目标 |
尽快恢复业务,降低对业务的影响 |
查明根源,彻底解决 |
手段 |
应急措施或替代方案 |
永久性解决方案 |
关注的焦点 |
速度 |
质量(彻底性) |
花费时间 |
短 |
长 |
优先级划分 |
根据impact和urgency确定,侧重urgency |
根据imapct和urgency确定,侧重于impact |
是否面向用户 |
面向用户 |
不面向用户 |
分类代码 |
二者可共享相同的分类代码 |
问题管理输入:
故障历史记录;
问题识别和确认规则;
问题记录单模板;
IT基础架构、IT服务监控数据和报表;
IT服务绩效与SLA差距分析报告;
问题管理输出:
问题根本原因;
替代解决方案;
永久性解决方案;
变更请求(RFCs);
问题分类汇总报表;
考察期内问题的总数量;
SLA时间内解决问题数量和百分比;
超出目标解决时间的问题数量和百分比;
未解决问题数量的累计数和趋势;
解决问题平均花费成本;
重大问题总数量;
已知错误知识库中已知错误的数目;
已知错误知识库准确率;
主动问题排查率;
通过已知错误解决的事故数量;
问题管理提出的RFC数量;
服务台作为IT服务支持团队的一线支持,其首要目标是为用户和IT组织之间建立沟通的纽带,确保用户的故障请求和服务请求能以最快的速度得到满足,并确保用户满意;
本地服务台:
中央服务台:
虚拟服务台:
continual service improvement:
PDCA(戴明环):
plan;
do;
check;
action;
七步改进流程:
服务度量:
检验以前的决定是否正确;
指导行为云满足设定的目标;
由实际的证据去证明行为的正确性;
在适当的点进行干预和执行改进行为;
服务报表:
问题请求量报表;
变更请求量报表;
日常内部审计请求量报表;
SLA质量报表;
===============================================================================
ITSM,IT servicemanagement,IT服务管理(ITSM)是一套帮助企业对IT系统的规划、研发、实施和运营进行有效管理的方法,是一套方法论,ITSM起源于ITIL(IT Infrastructure Library,IT基础架构标准库),ITIL是CCTA(英国国家电脑局)于1980年开发的一套IT服务管理标准库,它把英国在IT管理方面的方法归纳起来,变成规范,为企业的IT部门提供一套从计划、研发、实施到运维的标准方法
IT service CMM(capability maturity model)
six sigma,六西格玛是一种改善企业质量流程管理的技术,以“零缺陷”的完美商业追求,带动质量成本的大幅度降低,最终实现财务成效的提升与企业竞争力的突破;是一种管理策略,它是由摩托罗拉提出的,这种策略主要强调制定极高的目标、收集数据以及分析结果,通过这些来减少产品和服务的缺陷;六西格玛背后的原理就是如果你检测到你的项目中有多少缺陷,你就可以找出如何系统地减少缺陷,使你的项目尽量完美的方法;一个企业要想达到六西格玛标准,那么它的出错率不能超过百万分之3.4;
六西格玛包括两个过程:六西格玛DMAIC和六西格玛DMADV,它们是整个过程中两个主要的步骤;六西格玛DMAIC是对当前低于六西格玛规格的项目进行定义、度量、分析、改善以及控制的过程,六西格玛 DMADV则是对试图达到六西格玛(6 Sigma)质量的新产品或项目进行定义、度量、分析、设计和验证的过程,所有的六西格玛项目是由六西格玛绿带或六西格玛黑带执行的,然后由摩托罗拉创建的六西格玛黑带大师监督;
六西格玛(Six Sigma)拥护者声称这种策略可以使50%的项目受益,它可以使营运成本降低、周转时间得到改善、材料浪费减少、对顾客需求有更好地理解、顾客满意度增加以及产品和服务的可靠性增强,然而要想达到六西格玛标准需要付出很多,并且可能需要几年的时间才能实现,德州仪器、亚特兰大科学公司、通用电气和联合信号公司是实施六西格玛管理的几个典型例子
PMBOK是Project ManagementBody Of Knowledge的缩写,即项目管理知识体系,是美国项目管理协会(PMI)对项目管理所需的知识、技能和工具进行的概括性描述;
美国项目管理学会的PMI资格认证之所以能在如此广的行业和地域范围内被迅速认可,首先是项目管理本身的重要性和实用性决定的,其次很大程度上是得益于该项认证体系本身的科学性;PMI早在七十年代末就率先提出了项目管理的知识体系(Project Management Body of Knowledge,简称为PMBoK),因为一本书不可能把项目管理知识体系的全部内容囊括进来,所以PMI制作的书称为项目管理知识体系指南,即PMBOK Guide,利用该指南,可以查找项目管理相关的其它知识内容;该知识体系指南构成PMP考试的基础,它的第一版是由PMI组织了200多名世界各国项目管理专家历经四年才完成,可谓集世界项目管理界精英之大成,避免了一家之言的片面性,而更为科学的是每隔数年,来自于世界各地的项目管理精英会重新审查更新PMBOK 的内容,使它始终保持最权威的地位;
对PMBOK指南的相关解读,可咨询PMI授权的R.E.P(注册教育机构,是英文 Registered Education Provider 的缩写)
ITIL,informationtechnology infrastructure library,重点,IT service交付的持续质量改进与评估;
ITILv3包括(4职能,17流程processes):
service strategy服务战略(SLP,servicelevel package);
service design服务设计(SDP,servicedesign package);
service transition服务转移(SKMS,serviceknowledge management system);
service operation服务运维;
continual service improvement(CSI)持续服务改进;
complementary publications;
web support services;
knowledge skills;
speciality topics;
templates;
executive introduction;
study aids;
qualifications;
governance methods;
standards alignment;
case studies;
quick wins;
scalability;
update service;
4职能、17流程:
service strategy(processes:demandmanagement、financial management);
service design(processes:servicecatalog management目录、service level management、availabilitymanagement可用性、information security management、supplier management供应商、capacitymanagement容量、IT service continuity management;concepts概念:configurationmanagement system、knowledge management、definitive media library最终媒体库、service knowledgemanagement);
service transition(processes:changemanagement变更管理、release and deployment management发布和布署、service assetand configuration management服务资产和配置管理);
service operation(processes:eventmanagement事项、incident management故障、request fulfillment请求的履行、problem management、access management;functions:service desk服务台、technical management技术管理、IT operations management、applicationmanagement);
continual service improvement;
ITIL v3资格证书(四个级别):
ITIL foundation(基础认证,相当于ITILv2基础级别,评估对知识的掌握与理解);
ITIL intermediate(中级认证,lifecyclemodule & capability module生命周期模块与能力模型模块,评估对这两个模块的理解和应用,取代ITIL v2的practitioner从业者级别);
ITIL expert(专家认证,评估应用和分析,相当于ITILv2经理级别service management);
ITIL master(大师级别,最高级别,代表行内最资深的造诣,具备全面的IT服务管理最高水平);
CEO(chief executiveofficer);
COO(chief operatingofficer);
CFO(chief financialofficer);
CTO(chief technologyofficer);
CIO(chief informationofficer);
CMO(chief markingofficer);
CSO(chief solutiomofficer);
CPO(chief procurementofficer);
CGO(chief government officer);
CKO(chief knowledgeofficer);
CEO:首席执行官,首席执行官为一种高级职务名称。在经济组织机构中,首席执行官(Chief Executive Officer,缩写CEO)是在一个企业中负责日常事务的最高行政官员,又称作行政总裁、总经理或最高执行长。
COO即首席运营官(英语:ChiefOperating Officer,英文缩写:COO,又常称为运营官、营运总监)是公司团体里负责监督管理每日活动的高阶官员。COO是企业组织中最高层的成员之一,监测每日的公司运作,并直接报告给首席执行官。在某些公司中COO会同时兼任总裁,但通常COO还是以兼任常务或资深副总裁的情况居多。
CFO:首席财务官——CFO(ChiefFinancial Officer)是企业治理结构发展到一个新阶段的必然产物。没有首席财务官的治理结构不是现代意义上完善的治理结构。从这一层面上看,中国构造治理结构也应设立CFO之类的职位。当然,从本质上讲,CFO在现代治理结构中的真正含义,不是其名称的改变、官位的授予,而是其职责权限的取得,在管理中作用的真正发挥。
CTO:(首席技术官(ChiefTechnologyOfficer)): CTO(首席技术官)英文ChiefTechnology Officer,即企业内负责技术的最高负责人。这个名称在1980年代从美国开始时兴。起于做很多研究的大公司,如General Electric,AT&T,ALCOA,主要责任是将科学研究成果成为盈利产品。
CIO:首席信息官(又称CIO,是ChiefInformation Officer的缩写)中文意思是首席信息官或信息主管,是负责一个公司信息技术和系统所有领域的高级官员。他们通过指导对信息技术的利用来支持公司的目标。他们具备技术和业务过程两方面的知识,具有多功能的概念,常常是将组织的技术调配战略与业务战略紧密结合在一起的最佳人选。CIO原指政府管理部门中的首席信息官,随着信息系统由后方办公室的辅助工具发展到直接参与企业的有力手段,CIO在企业中应运而生,成为举足轻重的人物。美国企业的首席信息经理相当于副总经理直接对最高决策者负责。
首席信息官是一个比较新的职位,目前只有在一些全球500强的大企业才设立职位,如Coca Cola, DSM 等。但是随着商业领域多极化的竞争与发展,越来越多的企业开始将Innovation这一概念作为企业的持续发展的动力和竞争优势,CIO将成为未来企业最为重要的职位领导人之一。
首席营销官(CMO,Chief Marketing Officer)是指企业中负责市场运营工作的高级管理人员,又称作市场部经理、营销总监。主要负责在企业中对营销思想进行定位;把握市场机会,制定市场营销战略和实施计划,完成企业的营销目标;协调企业内外部关系,对企业市场营销战略计划的执行进行监督和控制;负责企业营销组织建设与激励工作。
CSO(Chief SolutionOfficer 首席问题官):是企业里负责挖掘问题、协调缓解问题和解决问题的高级管理人员。