事故报告的目地:
事故是工程师成长的基石,每次出现问题都要及时总结和分析,这样才能避免更多的错误产生。引用中医界的一个经典:“上医治未病”最早源自于《黄帝内经》所说:“上工治未病,不治已病,此之谓也”。“治”,为治理管理的意思。“治未病”即采取相应的措施,防止疾病的发生发展。其在中医中的主要思想是:未病先防和既病防变。” 中医界公认治“未病”是医术最高明的医生。而我们作为工程师能够做到这点才是最牛的,不是有问题了,你上线解决了就ok 了,尽量要深挖背后的原因,把相关问题掐死在萌芽状态,真正的高手都是化问题于无形间。根本不给问题机会!个人觉得这个是我们需要努力的方向。
故障简述:( 对事故进行简短描述)
故障影响:(故障影响的范围及具体业务)
故障修复: (已时间点为单位说明事故的修复进度,举个栗子)
16:40 xxxx
17:10 xxxx
故障总结:(具体原因的分析)
故障后续:(如何避免以后产生类似事件,如果无法避免的产生了,workround是啥?)
原文地址:http://blog.51cto.com/seekerwolf/2113898
时间: 2024-10-17 01:34:21