运维经理的翻身经

你能想象一个拥有数千名员工,且大部分都使用IT设备的集团公司,它的IT运维有多复杂吗?让我们来看看小A的故事。

  小A是这样一家公司的IT运维经理,负责全公司分散在国内几大重点城市的数千台桌面终端、网络、服务器、机房,以及应用软件等的日常维护和IT资产管理。工作要求定期提供运维报告,保障最终用户的满意度达到SLA,为业务发展提供高效稳定IT支持。

  小A的团队共有10名工程师,北京总部5人,上海3人,广州、成都各1人,平均每人负责超过200名员工的IT请求。

   这样的人员配备虽不能说过少,但每个人的工作量也已经满负荷了。以北京为例,5个人处理近1000名员工的各种IT维护请求,这些问题小到Excel中 方程的使用,大到ERP系统故障,另外还有整个公司的网络、服务器、机房巡检及日常维护。小A发现,大多数情况下,IT工程师们都奔忙于客户现场,很少在 工位上,但各自工位上电话声总是此起彼伏,几乎从未间断。要是遇上公司断网、大面积病毒、需要统一升级软件时,就更难逃加班加点了。而其他各地的运维主管 所反应的情况也大抵如此。上任几个月后,小A逐渐意识到他本人及团队都处于灰头土脸的“挨踢”境地,有如下表现:

一、投诉量多,运维管理能力受质疑

  团队成员忙归忙,但小A或CIO接到的投诉却不断。经常有关键业务部门员工甚至领导层投诉找不到运维人员,问题得不到及时处理,严重耽误工作。有的则是投诉运维人员的态度问题。

二、报告费时,占用大量管理精力

  为了定期找出频发故障的规律,给出相应改进和解决方案,小A每月需要至少花一周做问题统计分析报告。就是日常运维服务质量报告也得耗掉2-3天。每月光制作报告就差不多占用了小A一半时间!实在难有时间去发掘、收集更多业务需求。

三、团队难带,运维质量不稳定

   大多数时候,运维人员都在进行着简单重复的工作,且很难得到最终用户的肯定,小A曾听他们私下用“碌碌无为”、“穷忙族”形容自己,人心涣散,团队人员 流动率较大。往往是某人好不容易成为熟练工了,却因为看不到职业前景或感觉不受重视而提出辞职。这些中坚力量的离职,会造成客户满意度和运维质量相当长一 段时间内出现波动。

四、资产不清,决策无依据审计难应付

   由于缺乏系统的资产管理,小A很难准确了解公司到底有多少IT资产,公司是否需要购置新机也缺少数据支撑。小A也深刻记得,在年底审计时全团队奋战了多 少个日夜才做完全公司IT资产清查。然而来年又会因为设备报废,或员工离职而发生很多变化,小A还是无法做到实时掌握准确数据。而更要命的是,随着公司业 务发展,分支、员工变多,IT运维支持变得愈加吃力。

  为了不再“挨踢”,小A曾一度苦寻“翻身”秘诀,也曾认真思考过这样一个问题:造成如此局面的原因,到底是人手不够,还是工作方法有待改善?所有问题的关键在于缺少标准化和流程化。引入ITIL思想,建立真正意义上的服务台将能带小A走出困境。

  众所周知,多数上规模的公司都用ITIL来进行IT运维管理,其中服务台又是ITIL的核心管理职能。那么服务台能怎样帮助小A?王勇针对小A的问题一一做了分析。

“唯一联系点”协调派工增加满意度

 

   用户投诉问题,实质是客户满意度问题。若是将所有IT问题统一汇总到服务台,对于绝大多数(80%以上)问题,服务台可直接解决;服务台解决不了的,再 按照提前与业务部门商定好服务水平协议(SLA)、问题处理优先级,统一分配运维力量,运维人员就不会错过需要及时处理的重大问题。服务台的意义不仅是靠 提供单一联系点(SPOC)来规范各种IT请求,而且还能让运维有理可依,有据可查,从而减少客户投诉,提高客户满意度。

服务台自动化管理工具大幅提高工作效率

 

  第二个报告制作和第四个资产管理问题,主要是缺少自动化工具辅助,通过运用服务台管理工具能部分提高工作效率,减少相应工作耗时。而若是借助专业外包公司的管理经验,更能大大节省运维经理们的管理精力,提升管理质量。

组建运维梯队,合理搭配运维资源

   第三个人员管理问题,根源在于运维工作分配不合理,业绩无法考核。若将运维人员分成一、二、三线支持,不同运维人员各司其职,能使有限的运维力量得到合 理利用,整体工作效率将明显提升;同时也方便对各自的工作业绩进行评估。再据此制定相应奖惩措施,或针对不同岗位提供不同服务技能培训,亦能提高员工工作 积极性。

 最后,王勇总结到:“服务台制度,能帮助企业IT部门提高一线解决率、客户满意度以及管理效率,从而可节省出更多力量用到新增运维需求上,更好支持业务发展。”

   事实上,经过一番摸索,小A锁定的“翻身术”也正是改善工作方法。小A参考ITIL标准,初步建立了统一IT服务台,几个月之后,小A确实感觉到工作轻 松了不少,投诉和团队抱怨也都在减少,有时还会接到业务部门零星表扬。小A终于有了些许“咸鱼翻身”的感觉。为了真正实现扬眉吐气,尝到甜头的小A还在思 考进一步改进的可能。目前他正在考虑是否将具体工作外包,一来可彻底远离人员管理的麻烦,二来外包公司更加专业成本也更低。但外包也有隐患,小A还在仔细 衡量其中的利弊。(转帖)

运维经理的翻身经

时间: 2024-10-11 17:33:13

运维经理的翻身经的相关文章

运维经理的运维经验总结

1. 域名 从买域名开始,要买多个域名,50个甚至100个.分为主域名和推广域名(给推广链接用的).要从godaddy上买域名,因为这里的域名稳定,不会出现被攻击等事情.同时还要买域名保护,这样互联网用户ping这个域名就解析不到真实的服务器地址.同时域名解析的操作不要在godaddy上进行,要把解析的操作放在cloudflare上或者dnspod上进行操作,也可以放到zndns上(这个dns可以做到一个域名解析多个IP地址,根据就近原则,把最快的IP地址解析给用户.)也可以自己搭建dns服务器

从零起步做到Linux运维经理,你必须管好的23个细节

不想成为将军的士兵,不是好士兵-拿破仑 如何成为运维经理?成为运维经理需要什么样的能力?我想很多运维工程师都会有这样的思考和问题. 如何成为运维经理.一般来说,运维经理大概有两种出身,一种是从底层最基础的维护做起,通过出色的维护工作,让公司领导对这个人非常认可,同时对Linux运维工作也比较重视,逐步走向Manager的岗位.第二种是业务管理出身或者有IT技术背景,具备了一定经验直接进入IT管理层的人员. 那么做为一个Linux运维经理,你需要哪些技能武器.管理哪些细节,具备什么样的能力? 运维

看不起自己可以,请不要看不起运维职位!

看不起自己可以,请不要看不起运维职位!伙伴们,赞同的就请转发,让我们这个行业,变得更好吧. 本文不针对任何人,而是以过来人的经历,希望挽救下运维行业人员的心态! 作为曾经的运维人员一份子,老男孩觉得,有不少运维人员自己作为一个运维人员,同时,确不停的说运维职位很差,这真的是一件很悲催的事情,是一种无望,解决不了任何问题,同时还可能真的传染给不懂事的其他同行. 其实呢,不是运维这个职位不行,不受重视,只是大部分的运维人员还是处于一个非常低级的阶段,并且深信不疑的认为自己已经比较牛逼了.要屌破天了.

运维人员写项目方案及推进项目的基本流程思路

1.提出公司问题现状,进行整理 2.写出大体解决方案,进行上级授权(运维经理.CTO)在与各个部门领导打通关系,表示支持 3.申请成功后,制定具体执行方案 具体执行方案 1.采集信息 2.制定具体执行方案 3.根据制定方案细化,操作步骤 4.制定测试方案 5.制定预判出现问题,回退解决方案 6.制定方案执行后维护文档,以及规范

运维规范

个人总结,也有各前辈的经验,希望可以帮助到各位网友,谢谢.我会不断更新总结!!! 规范: 1.所有运维人员离开工位必须锁屏,一次没有处罚给大家买饮料,二次没有部门通报,三次没有全公司通报. 2.rm命令选项写最后,即rm 路径 -rf. 3.端口统一,如nginx只启用80端口.各服务resin端口统一(如上传8080,下载8081等). 4.开启防火墙,打上规则.只开22和8080端口,提高安全. 我坚信  最小的权限+最少的服务=最大的安全. 5.脚本统一路径存放/root/scripts下

运维85条军规

1) 承载能力优先 ——随后再进行优化 —— 不遵守这条规则必定带来故障停机时间.不要在故障停机时间的压力下进行优化——要先集中精力提高承载能力. 2) 以Postgres为例,一定要确保你的每一个网络都能匹配得上你的WAL文件.Slony复制.快照技术以及基于磁盘的DB版本化(快照的衍生品) 3) 不要把问题‘优化’到你的架构之中.为了解决问题而新加进来的一些东西往往后来都会变成运维沉重的负担. 要确保在运维工程化中开发出来的工具交接完整.过后再回头进行进一步的开发往往不灵.更重要的是,变更请

运维人员如何学好shell脚本编程

核心:练-->想-->再练-->再想! 运维人员如何学好shell脚本编程老男孩linux早期毕业的学生谈如何学好shell编程技巧该生毕业后一年任职一家近千人公司的运维经理.目前就职小米科技1.基本语法,敲n+1遍.为什么不是n遍那,因为n遍是你刚开始为了编程而努力的几天,  1是说你以后要每天都要写写想想,至少是要看看.2.各种基本语法,if多种判断都要会,这样做不是为了什么都要学而是为了看懂别人的  代码. 这个要写一段时间,各种都用.3.解决上边说的问题,各种语法都要学的问题,现

企业运维分类

企业运维,至少包括如下几个大方面:1,桌面运维(以windows为主,工资偏低,桌面运维经理可以达到8K到10K,很多人在公司里干的就是安装windows系统,windows里的QQ坏了重装下,砸个水晶头诸如此类)2,通讯运维(电话)(不推荐)3,网络运维,包括,路由,交换,防火墙,(以前网络工程师干的活,现在是大学生干的活,有些公司甚至不给工资,让大学生实习,中间实现如果辞职了,学校不给毕业证,真是校企联合哈.)4,中间件/应用运维 (中间件运维算是比较小众的,也还是可以的,工资也蛮高)5,数

大型运维知识体系与Python高效自动化运维免费沙龙活动

2015-10-17(周六 下午13:30)大型运维架构运维知识体系讲座 2015-10-18(周日下午13:30)Python运维自动化讲座 以上内容全免费,回馈网友!极其难得的饕餮盛宴! ================================ 大型电商平台架构演变及大型运维知识体系免费讲座 2015-10-17(周六 下午13:30) 主题1:大型电商平台架构演变及大型运维体系知识讲解 内容简介: 通过一个电商网站的架构演变来阐述一个相对完整的<大型运维架构知识体系>.该运维体系