关于问题解决与事件解决的思考

  那天突然有人问我:问题解决和事件解决的区别。

  今天刚好出了点问题,在解决完后,我突然对这二者有了更深入的体会。

  举个例子:

    如果由于网络中断,导致服务不可用,那么这就是一个事件,我们可以编号为 2017-09-03号事件,那针对这一次的事件,我们可能通过重启设备,排查具体端口映射,或者更换新设备等方式解决,那么,在这次的事件中,我们解决问题的过程,即可以称为是一次事件解决过程。  

  那接着我们进一步思考一下,在工作中,如果这类问题频繁发生怎么办?

  --这就引出了问题解决方案。

  仍以上例说明:

    这次的事件,是由于网络设备的单点故障,导致了服务不可用的情况,解决的方法是更换新设备;那为了避免以后再出现这种情况,我是不是可以再部署一套环境,做一个高可用的方案呢?当然,考虑到成本问题,很多公司并不愿做大动作。那我是不是可以退而求其次,事先准备好一台低端设备,但是配置跟原设备一样,这样,一旦出现未知故障,我们迅速的使用新设备直接替换呢?这样其实就是一个简陋的热备方案了。

    以后当有人再向你报告A出现问题了,而你此刻还在床上睡懒觉的时候,还需要屁颠屁颠的跑去现场吗? 不, 你只需要告诉他,“那你切换到B方案吧”。通常,这能帮你解决90%的 “他们” 描述的奇怪问题。 他们指那些不知道如何进入控制界面,如果进入某路径,不懂命令行的普通人。

    以上就是我对问题解决与事件解决的一点思考,随笔记录以备日后回顾。

时间: 2024-10-02 02:03:02

关于问题解决与事件解决的思考的相关文章

一次部署HTTPS的相关事件引发的思考

前言: 上周五快要下班的时候,突然收到通知客户希望了解一下部署HTTPS的流程,这种事情谁听了都会有几分诧异的.因为这件事虽然和工作有一定的相关度,但平时不会走这个方向,实际上也较少接触.此外,客户手下应该不缺人,做运维和开发的肯定比我更懂这个,但情况却和我想的不一样. 正文: 客户有需求,就应该尽量满足!因此,尽管之前对Apache.Tomcat的一些配置不熟,也未有过自己部署HTTPS的经验[当然失败的尝试还是有的],便趁着周末了解了一下相关的东西,在本地搭建了环境.实践表明,当你对一个东西

两个叠在一起的fragment,上层fragment响应下层fragment的按钮点击事件解决方法

添加onViewCreated的Touch事件监听, 以解决叠在一起的fragment上层响应下层的按钮点击事件解决方法 @Override public void onViewCreated(View view, Bundle savedInstanceState) { view.setOnTouchListener(new OnTouchListener() { @Override public boolean onTouch(View v, MotionEvent event) { ret

2014年5月27日中国大陆封锁Google事件解决的方法

2014年5月27日中国大陆封锁Google事件指自2014年5月27日后,Google公司的各项服务遭到疑似来自防火长城的恶意干扰,导致中国大陆地区的用户无法正常使用其服务的事件.自当天起,来自中国大陆的用户发现Google旗下的各个分站以及Google的其它服务(Google Play.Gmail.Google Docs等)均无法正常訪问与使用,甚至无法登陆Google账户.谷歌中国旗下的谷歌地图.谷歌翻译依然能够使用,但部分地区仍有连接被重置.连接超时等情况 最新谷歌镜像git网址:htt

等待事件之日志等待事件解决办法

我坚持每天看3套RAC的AWR,总结了一下. 查找日志等待事件的SQL: 9i:select * from v$event_name where name like '%log%';(大概14个左右) 10g: select name,wait_class from v$event_name where name like '%log%';(大概35个左右) 11g: select name,wait_class from v$event_name where name like '%log%'

2014年5月27日中国大陆封锁Google事件解决办法

2014年5月27日中国大陆封锁Google事件指自2014年5月27日后,Google公司的各项服务遭到疑似来自防火长城的恶意干扰,导致中国大陆地区的用户无法正常使用其服务的事件.自当天起,来自中国大陆的用户发现Google旗下的各个分站以及Google的其他服务(Google Play.Gmail.Google Docs等)均无法正常访问与使用,甚至无法登陆Google账户.谷歌中国旗下的谷歌地图.谷歌翻译依旧可以使用,但部分地区仍有连接被重置.连接超时等情况 最新谷歌镜像git网址:htt

JS过渡结束监听事件及使用自定义事件解决兼容问题的方法

1.JS过渡结束监听事件 2.自定义事件解决兼容问题 原文地址:https://www.cnblogs.com/liu-web-bew/p/9345478.html

自定义事件解决重复请求BUG

现在,组件化开发还是比较流行的,毕竟其优点相当突出.最近在开发一个组件的时候,遇到了一个很有意思的BUG... BUG的背景 最近在开发一个组件,好不容易开发好了转测试.然后,测试给我提了一个这样的bug,orz... 因为是一个组件,最大的好处就是可以随处复用,随处使用,然而,当一个页面用了多个组件,只有最后一个生效的时候,这个组件就没有什么意义了... BUG原因查找 这个组件的初始数据来源的接口是固定的,也就是说,页面内的所有这个组件在初始化的时候都会发出同样的请求,这里的请求是jsonp

Sql Server之旅——终点站 nolock引发的三级事件的一些思考

曾今有件事情让我记忆犹新,那年刚来携程不久,马上就被安排写一个接口,供企鹅公司调用他们员工的差旅信息,然后我就三下五除二的给写好 了,上线之后,大概过了一个月...DBA那边报告数据库出现大量锁超时,并且及时根据sql的来源将email发到了我们部门,指出sql读取时间过长, 并且缺少nolock,影响了大量机票订单入库,然后我就拿着sql去生产环境跑了下,22s...花擦...项目上线时间太久,版本已经不存在了,无法 回滚...原本准备撤下接口...看了下撤下接口跟加上nolock时间相差不多

等待事件之日志等待事件解决的方法

我坚持每天看3套RAC的AWR,总结了一下. 查找日志等待事件的SQL: 9i:select * from v$event_name where name like '%log%';(大概14个左右) 10g: select name,wait_class from v$event_name where name like '%log%';(大概35个左右) 11g: select name,wait_class from v$event_name where name like '%log%'