【项目管理】现网故障处理

PS:笔者是产品经理,因为工作须要兼岗项目经理,所以本文站在项目经理的角度来讨论怎样解决这个问题。

1. 工作案例

这段时间多个项目并行,每一个项目也有多个版本号须要管理。节奏非常快。

上周公布一个优化性能的版本号之后,本周一收到了非常多外网用户的反馈:“打开***游戏之后。居然弹出了网页广告,差点把机器卡死了”。

经过跟外团(外部測试团队)进行沟通,得知是游戏版本号更新后导致的。

2. 现网故障

现网故障是指直接或者间接影响到用户正常使用产品。

比如:QQ无法登陆、百度首页打不开、支付宝无法付款等等。故障处理须要划分优先级,必须优先处理重大故障。

在产品工作中,以上的情况会非常easy发生。当你在构思新版本号的时候,现网版本号随时可能出现问题以及用户投诉。原因各种各样的奇葩。不是本次讨论范围。暂且省略。

3. 统一团队工作优先级(项目经理必备)

项目节奏快,每一个人的时间都是很宝贵。一旦出现不论什么的问题都会直接影响到项目延期,所以大部分的童鞋都仅仅关注着自己当前的工作:开发版本号。依照规定时间完毕开发。

这样会直接导致他们忽略了现网问题。

比如:

1)后天要进行提測了,这些现网问题迟点再搞吧

2)仅仅影响了一些用户,不急啦

3)麻痹的,现网出问题,白天处理问题,晚上这下又得加班搞需求了

因此站在团队的效益角度看,统一大家工作优先级是个很重要的事情。下面列举了我们团队在工作中的优先级,优先级由上至下逐步降级。

1)处理现网故障

2)处理用户投诉

3)响应在公布版本号

4)响应在測试版本号

5)紧急开发任务

6)处理阻碍他人工作的任务

7)处理须要他人配合的工作。如申请机器,外组配合等

8)预研技术风险,如提早调试外部接口

9)正常计划中的开发任务

4. 通用处理方案

1)第一时间知会项目经理。项目经理是统筹团队的重要人物。最熟悉整个团队的运作。

2)现网故障确定处理优先级。必须合理的区分优先级,重要的现网故障须要即时处理,小问题能够延后。

假设事无大小都进行处理,会直接影响到当前正在开发的版本号进度。

3)确定第一负责人。项目经理须要运筹帷幄,不可能每一个问题都亲力亲为的跟进,须要授权给其它童鞋进行处理。这里说到的第一负责人能够是产品、技术或者測试童鞋,项目经理直接跟负责人对接。让负责人去推动故障处理方案。假设负责人存在困难。则项目经理协助解决。

4)跟进处理方案。方案确定后,须要RTX、开会或邮件等各种方式知会相关人员。而且监督大家按方案走。

5)处理完成后及时知会相关人员。

5. 我的解决方式

1)直接找到相应的开发负责人,而且明白这是当前优先级最高的工作。

2)定位问题。技术GG发现是自己的代码有bug。測试也没发现。结果公布了。

3)安抚技术GG和他leader。我认识非常多产品经理他们遇到这样的情况的时候都不同而语:又被研发坑了,搞出这些bug。假设他搞不定就找他leader投诉。作为一个团队,大家坐同一条船。赶快把问题解决吧。此时此刻。技术GG非常紧张,他leader也知道此事。

我说了一句话:“你先想想怎么解决问题,其它事情我来处理”。

PS:请善用EQ和同理心。有兴趣的童鞋能够看下之前的文章:【产品干货】感情沟通之美

http://blog.csdn.net/minidrupal/article/details/38614459

4)有损服务,即时屏蔽该功能。

因为是优化导致的,所以暂时屏蔽了优化后的功能,等待修复bug后再开放。

5)当面知会PM。

6)邮件知会相关童鞋和leader。

PS:怎样写好这封邮件也是有一定的技巧,兴许讨论

推荐文章:

《用户说卡。怎么办》

http://blog.csdn.net/minidrupal/article/details/24544573

《Scrum -- 晨会那些事》

http://blog.csdn.net/minidrupal/article/details/25547577

《产品经理的日常工作》

http://blog.csdn.net/minidrupal/article/details/26092691

《高速验证产品价值 -- MVP(最小可行产品)》

http://blog.csdn.net/minidrupal/article/details/26986885

《怎样进行产品定位(上)》

http://blog.csdn.net/minidrupal/article/details/29386543

《用户研究那些事》

http://blog.csdn.net/minidrupal/article/details/35841945

《合理构建产品形态(一)——谁是目标用户》

http://blog.csdn.net/minidrupal/article/details/37767955

Author: Andy

Introduction: Webproject师、项目经理、产品经理

Sign: 做人假设没有梦想。跟咸鱼有什么差别

时间: 2024-10-19 22:33:27

【项目管理】现网故障处理的相关文章

路由基础(三)静态现网用法

一.静态路由用法简介 静态路由的用法使用 1)静态路由优先级方式进行选路,静态路由搭配动态路由进行选路. 2)静态路由搭配SLA检测链路. 3)静态路由打通内外网. 4)静态路由发布路由. 静态路由在现网中看视简单,但是使用却很灵活,可以结合以上几种方式进行使用. 1.1静态路由优先级选路(动态路由结合) 在一个小型的网络中使用静态路由很常见,当网络慢慢变大,变复杂之后静态路由很多时候需要进行选路.常用静态优先级(管理性距离)选路方式. 网络分为两条线路,一条主用线路,一条备用线路进行. 主用线

使用准现网的数据,使用本地的样式脚本,本地调试准现网页面(PC适用)

原理: 本地逻辑,重新渲染 步骤: 1.安装插件:Tampermonkey 度盘:https://pan.baidu.com/s/1bpBVVT9 2.设置: 点击插件-->仪表盘 添加脚本 将此文本文档中的脚本复制到脚本编辑框处,并Ctrl+S保存 点击设置,对脚本进行设置 加载位置与仅顶层页面运行设置如下图 3.调试: 打开你要调试的准现网页面, 如:http://wap.cmread.com/nap/t/search.jsp?vt=3&kw=1 console处会看到 若你要调试当前页

AP注册不上线(现网中存在其它厂商的控制器)

AP注册不上线(现网中存在其它厂商的控制器)在网络中存在两台控制器MSG360(192.168.0.223)和TP-LINK AC(192.168.0.253)AP是华三的WAP712C 1.排错思路:1)DHCP是在MSG360上,首先在AP查看是否能获取地址AP可以获取地址此处配置没有记录 2)在AP上查看capwap debug信息从AP的debug信息可以看出,虽然MSG360(192.168.0.223)有发送discovery response过来,但是AP还是选择了TP-LINK

校园毒跑道频现 网售问题产品该找谁?

从去年至今,北京.苏州.无锡.南京.常州等多地学生家长反映,孩子上学后集中出现了流鼻血.头晕.起红疹等症状,他们怀疑与学校的塑胶跑道气味呛人有关,北京实验二小白云路分校甚至因为此类问题而全面停课.校园"毒跑道"事件的频繁发生,已经成为家长.学生的心头大患.而与此同时,塑胶操场.塑胶跑道等产品在电商平台卖的风风火火. 而由此带来的,是这些网售产品一旦出现问题,维权难度将十分高.电商平台的维权规则,被卖家玩得炉火纯青,消费者很难在出事之后维护自己的合法权益.医药费等无从追起,更别说对卖家进

RIP动态路由协议配置实验(现网常用协议,不懂你就out了)

动态路由 动态路由与静态路由是一个相对的概念,与静态路由的最大的区别就是动态路由不需要手工添加路由,路由之间能够自己互相学习,并且能够根据链路和节点的变化适时地进行自动调整. 动态路由原理: 1.路由器之间适时的交换路由信息(通常为每隔30s进行一次交换)2.路由器根据某种路由算法(不同的动态路由协议算法不同)把收集到的路由信息加工成路由表,供路由器在转发IP报文时查阅. 目前现网上常见的动态路由协议: 1.RIP协议(本篇所演示的协议)RIP协议是最先得到广泛使用的协议,该协议是一种基于跳数大

命名冲突引发的现网故障

一.前言 今天要介绍的命名冲突并不是系统内部的命名冲突,而是系统与浏览器插件之间的命名冲突. 二.现象描述: 通过查看运维同事上传到工单中的图片可得出这样的结论:用户页面无法加载JS.CSS,但是HTML可以成功解析. 三.故障分析过程,试图重现故障: (1).由于HTML可以成功解析,排除网络原因. (2).查资源服务器的ngnix访问日志,只有页面请求却没有JS.CSS的请求.猜测页面在请求加载静态资源的过程中出了问题. (3).可是邮箱加载静态资源都是使用统一的方法:loadScript.

网络工程师成长日记323-富平县统计局内网故障处理一日回忆录

这是网络工程师成长日记的第323篇连载文章,记录网络工程师行业的点点滴滴,结交IT行业有缘之人 13号,在和同学们喝完数斤太白酒后,我不禁疲态大发,就在这时,老大一通电话把我打醒--去富平县做项目.乖乖,这可是第一回去做项目啊于是我不辞艰辛,不蔽风雨,连夜带齐书本赶回家中挑灯夜读--怕去富平以后知识掌握不牢,给人砸锅去了. 但是只看一晚上怎么够,于是大清早天一亮,便怀揣着一颗忐忑不安的心来到公司.不想老大又宣讲了一下要求和细节,瞬时内心更是怕得不得了,当时就有点想装死不去了的感觉但最终糊里糊涂,

查找现网环境中最耗费CPU的Java线程,并定位堆栈信息

参考:JVM性能调优监控工具jps.jstack.jmap.jhat.jstat.hprof使用详解 下面通过一个实例找出某个Java进程中最耗费CPU的Java线程并定位堆栈信息,用到的命令有ps.top.printf.jstack.grep. 第一步 先找出Java进程ID,我部署在服务器上的Java应用名称为mrf-center [email protected]:/# ps -ef | grep mrf-center | grep -v grep root 21711 1 1 14:47

20140613故障处理纪要

背景:约100万月活跃用户,APP版本BUG(至少4万用户死循环访问,堪比DDOS),修复历时7天7夜. 世界杯前夕,服务器拒绝访问,线程挂死,导致大量请求拒绝访问,少量能访问,但访问时间缓慢导致超时,相当于服务崩溃. 通过监听端口有效的访问连接数,最高可达1000并发. netstat -an | grep ESTABLISHED | wc -l 访问量已经是无法控制,只能从应用入手,强制更新有bug的APP版本,把有BUG的版本的所有接口全部拒绝访问,以免影响其他版本的访问,但效果甚微. 我