那天突然有人问我:问题解决和事件解决的区别。
今天刚好出了点问题,在解决完后,我突然对这二者有了更深入的体会。
举个例子:
如果由于网络中断,导致服务不可用,那么这就是一个事件,我们可以编号为 2017-09-03号事件,那针对这一次的事件,我们可能通过重启设备,排查具体端口映射,或者更换新设备等方式解决,那么,在这次的事件中,我们解决问题的过程,即可以称为是一次事件解决过程。
那接着我们进一步思考一下,在工作中,如果这类问题频繁发生怎么办?
--这就引出了问题解决方案。
仍以上例说明:
这次的事件,是由于网络设备的单点故障,导致了服务不可用的情况,解决的方法是更换新设备;那为了避免以后再出现这种情况,我是不是可以再部署一套环境,做一个高可用的方案呢?当然,考虑到成本问题,很多公司并不愿做大动作。那我是不是可以退而求其次,事先准备好一台低端设备,但是配置跟原设备一样,这样,一旦出现未知故障,我们迅速的使用新设备直接替换呢?这样其实就是一个简陋的热备方案了。
以后当有人再向你报告A出现问题了,而你此刻还在床上睡懒觉的时候,还需要屁颠屁颠的跑去现场吗? 不, 你只需要告诉他,“那你切换到B方案吧”。通常,这能帮你解决90%的 “他们” 描述的奇怪问题。 他们指那些不知道如何进入控制界面,如果进入某路径,不懂命令行的普通人。
以上就是我对问题解决与事件解决的一点思考,随笔记录以备日后回顾。
时间: 2024-10-02 02:03:02