Fault管理与自动化

Fault管理和自动化,咋一看上去,是两个不想干的事情。但是,却是息息相关。
Fault管理有很多工作需要做,很重要的是Release管理,风险管理,进度管理,流程管理。整体是比较繁琐的,而管理的重心是沟通与流程,与各种各样的人沟通。而Fault管理中除了与人沟通之外以及相关流程的制定、监控之外,其他大部分的时间是花在绩效信息汇报、Release信息填写、Fault的相关的流程上操作。而往往这些事情中很多步骤是重复的,可以自动化的。如果自动化后,可以将省下的effort让Fault Manager更好地从事沟通管理、流程分析与优化、质量管理上来。
我自己的经验是:发各种各样的绩效信息占用我10%的时间,而其他Fault管理中以及标准化的流程相关的事情则是将近30%左右的时间。而很多流程相关的事情像填写Correction的版本相关信息、测试人员测试通知、Bug超时计算与通知等其他很多步骤是重复、机械化的,完全可以自动化。
那如何识别哪些可以自动化的工作呢?以及如何自动化呢?
首先是需要进行相关的工作流程进行分析,看哪些工作室**重复性高、创造性以及情感性低**。而这些工作往往就是可以流程化、标准化的。而其中很大一部分工作就可以自动化,让机器帮助我们执行重复化的工作。
我们FCO Team有很大一部分的工作是把带有Correction的release信息填写到Fault管理系统中,然后让对应的测试部门开始测试。而这个基本上是重复性高、完全流程化以及创造性和情感性极低的工作。而我们在这里投入了很多的时间。
那我们在识别完了可以自动化的工作后,我们接下来就需要进行规划自动化。其实就是将相关可以自动化的工作列出来,然后一个个进行设计和分析。像我上面所说的工作,就是需要机器帮助我们实现下面的标准化步骤:
1. 获取相关Correction的对应的版本信息
2. 找到Correction对应的Fault管理系统页面
3. 更新相关版本信息
4. 通知测试人员
而其他工作也是类似。同时在规划过程中,我们需要评估这自动化的cost和benefit的比率。如果太大,那么就需要放弃。毕竟自动化的目的是让自动化带来更高的收益,同时实现成本要不高才行。
当需求已经澄清后,范围已经确定。接下来就是自动化的实现了。其实这个才是最耗时间的地方。在软件测试中,很多测试工作已经自动化了,而且给企业带来的收益很大。而我们的自动化过程也是参考了很多软件自动化测试方面的经验。而测试自动化很多用到是脚本语言以及很多的自动化框架。这个我们在参考过程中收益良多。
向上面我列出来的一个例子。我们就使用了网页测试自动化的一个Python框架Mechanize。通过借鉴开源工具的,我们自动化的成本大大降低,同时带来的Benefit的是看的见的。现在我们FCO Team三个人,基本上不用为了版本信息的更新而烦恼。同时我们还将Bug超时时间提醒进行自动化,大大减少FCO和工程师的时间。让FCO和工程师能及时地处理问题同时不让问题堆积起来。
自动化一些工作之后,Fault管理的大部分工作则是集中在协调、沟通、风险管理以及进度管理上。由于是在做核心的事情,这使得我们的生产力大大提高。
时间: 2024-07-29 22:09:58

Fault管理与自动化的相关文章

关于Python Fault 管理半自动化心得[一]

最近从码农变成了苦逼的 FC 所谓的FC是Fault Coordinator的简称,是负责协调处理Fault相关的角色.FC的所负责的杂事特别多,很多情况是完全重复的机械化劳动. 在做FC的一个职责是为每个 Fault 添加不同分支的改动表格给开发人员,这样保证所有 Fault 影响到的分支都有相关改动. 在公司龟速的网络下,每个分支的创建是相当的折磨人,而且在Fault特别多的情况下,这个工作量巨大,基本上一下午的时间就没有了.同时每个Fault需要FC来帮忙建立一个Jira Issue来让开

Release Management 发行管理及自动化部署(繁体中文视频)

Release Management 發行管理及自動化佈署 https://channel9.msdn.com/Series/Release-Management-And-Auto-Deployment 视频可能没法直接看,不过可以下载mp4 只做优秀知识的搬运工

Windows Server 2012的服务管理自动化 -启动类型设置,手动启动还是自动启动

Windows Server 2012的服务管理自动化 标签:Windows 服务器 IDC机房 Windows Server 2012 一.场景描述: 运行着关键业务的windows服务器或托管在IDC机房,或宿主在自家公司的机房(DC),无论哪一种服务器管理方式,都会面临这样的情境:当运行的关键业务的服务停掉后,即使离数据中心很近,也无法及时处理,更何况出差在外或是旅行当中呢?! 基于以上,那,有没有一种方式可以自动化的管理服务呢,当服务当掉后,可以自动的无人工参于的情况下第一时间侦测到服务

第三十天-ssh key企业批量分发自动化管理案例

本文实现一个应用ssh key 批量分发案例 目录 一.ssh key 原理及案例原理简图 1.ssh key 简介 2.rsa和dsa区别 3.ssh-copy-id的特殊应用 4.ssh-copy-id的原理 5.案例简图 二.操作步骤 三.具体实现步骤 服务端A: 客户端B: 客户端C: 四.ssh 批量分发与管理方案小结 五.企业级生产场景批量管理,自动化管理方案 一.ssh key 原理及案例原理简图 1.ssh key 简介 特别提示:在整个方案实现中,公钥(public key)和

使用Powershell实现数据库自动化运维

使用Powershell实现数据库自动化运维 目前市场上针对SQLServer的图书,好的原创图书屈指可数,翻译的图书较多,但只限于专门针对SQL Server数据库本身的开发.管理和商业智能. 而针对PowerShell的图书,可以说大多为MSDN里的学习笔记,主要针对Windows操作系统的管理. 微软在大的布局和技术动向来看,力推云平台.而平台化的基础是自动化.高可用.那么细化到最基础的技术着眼点,微软正在大力开发其所有服务器端产品对 PowerShell的支持.针对SQL Server来

Maven实现多个项目关联自动化构建(maven-invoker-plugin插件的使用)

以下内容引用自https://ayayui.gitbooks.io/tutorialspoint-maven/content/book/maven_build_automation.html: 注意:由于时间问题,原文的方法已经无法使用,在此我更新了最新的方法去实现.同时也是官方原版的方法:https://www.tutorialspoint.com/maven/maven_build_automation.htm. 一.场景 设想一个团队正在开发一个项目bus-core-api, 并且有其他两

POM(project Object Model) Maven包管理依赖 pom.xml文件

什么是POM POM全称为“Project Object Model”,意思是工程对象模型.Maven工程使用pom.xml来指定工程配置信息,和其他文本信息.该配置文件以xml为格式,使用xml语法表明信息. 快速预览 一个pom.xml文件主要包括以下元素信息: pom.xml 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39

Objective-C内存管理总结

iPhone系统中的Objective-C的内存管理机制是比较灵活的,即可以拿来像C/C++一样用,也可以加个AutoreleasePool让它升级为半自动化的内存管理语言.当然,也不能拿JAVA虚拟机中的全自动化GC来比? 一,引用计数是实例对象的内存回收唯一参考引用计数(retainCount)是Objective-C管理对象引用的唯一依据.调用实例的release方法后,此属性减一,减到为零时对象的dealloc方法被自动调用,进行内存回收操作,也就是说我们永不该手动调用对象的deallo

开放式管理基础结构 OMI

Windows 长久以来在 CIM 实施领域一直傲立桥头,而这一切都是从 WMI(Windows 管理基础结构)开始的.分布式管理任务组 (DMTF) 通用信息模型 (CIM) 是一种开放式标准,用于定义如何通过一组通用对象来表示接受管理的元素,并使用关联定义它们之间的关系.WMI 最初在 Windows NT 4.0 中引入并与操作系统捆绑安装,其中实施了早期版本的标准和架构.WMI 使用 DCOM 进行远程管理,因为当时尚未制订标准协议.在 Windows Server 2012 中,我们在