怎么做好企业IT运维工作

维的工作层次来分,又分为硬件运维、桌面运维、系统运维、数据库运维和应用运维。他们运维的设备,小的从个人电脑,大的到数以亿计的高精尖计算设备(比如 大型机 )。

根据公司 IT 系统规模的不同,运维团队小至1 人,大至数百人。每晚通宵达旦,为 IT 系统保驾护航。

有句行话“累成狗,起的比鸡早,睡得比猪晚”。就这样还是种种抱怨和不满。我对运维总结成了两句话:“技术只是手段,业务才是王道”。

运维的好坏评定标准其实就是你给公司及业务带来了哪些价值及哪些影响。通过这些方法让运维变得更灵敏、让运维人员更好的理解用户的需求。

但是万变不离其宗的道理是,这些行为都是围绕着不同的业务需求而展开,为了满足不同阶段业务的发展而设计。做好企业 IT 系统的运维,体现运维的真正价值给公

司。

一、运维方法:

技术层面:

随着信息技术的发展以及企业业务的不断扩张,运维人员所面临的系统架构越发的复杂,关联度越发紧密。对运维人员的要求也会越来越高,打造个个都是高手,对业务系统了如指掌。

1、需要运维人员快速转变观念,学会通过主动运维的方式应对复杂多变的 IT 问题,保证业务系统的稳定。

2、更多的站在客户的层面思考问题,解决问题。

3、使用集成的运维平台,在业务系统没有感知的情况下实现了业务的变更、升级。

运维文档层面:

一个好的系统或者项目,必定有很多的文档进行支撑。

1、系统建设前期,一定要做好系统的需求文档、设计文档、实施文档。在系统建设中要依据前期的文档进行实施和设计,并生成系统相关的问题总结文档和更新实施文档。

2、系统建设完成后,要基于系统的业务能力和使用对象编写操作手册和运维手册等。

3、业务在交付一定要文档同行。否则系统上线后问题层出不穷,导致运维人员手忙脚乱,不知道从何下手处理,往往会让运维人员绕很多的弯路,错失良机。

4、文档归类保存:文档也分好多种,比如配置文档、实施文档、设计文档、系统规范性文档、项目管理文档等等。做到一式两份,运维部门一份,档案室一份。

5、要求运维人员一定要具备相应的文档编写能力和整理能力。同时一定要严格按照之前的文档进行实施,有问题要学会及时沟通,并把修正后的问题更新到文档中。

6、建立知识库:把运维过程中出现的问题及解决办法和思路,另外最重要的是运维事件的总结,记录在案。

运维流程层面:

1、建立运维流程。要求运维人员一定要基于一个既定的规则来干活。

2、通过流程确定事件责任。业务人员专注点与运维人员的专注点不同,责任也不同。

3、使用ITIL 了(即 IT 基础架构库(Information Technology Infrastructure Library,ITIL,信息技术基础架构库)。ITIL 为企业的 IT 服务管理实践提供了一个客观、严谨、可量化的标准和规

二、运维人员技术:

正所谓工欲善其事,必先利其器。很多的企业都在强化以用户服务为中心,专业技术为驱动的理念,可见拥有过硬的技术是多么的重要。

1、 运维人员必须掌握的技能:

运维对技术的要求是很高的,首先运维人员要对自己所负责的系统有较深的理解,全程参与系统的设计、实施与运维。一定要具备相关领域的技术积累,有较丰富的设计或者排错经验

同时运维人员具备以下软实力:如沟通能力、合作心态和文档编写能力。

2、运维人员一定要对现在的主流技术有一定的涉猎(云计算、边缘计算、大数据、AIOps、人工智能、深度学习等等),要与时俱进。

3、经常参与线上或者线下的相关讨论和交流学习。了解目前流行的 IT 技术,并学习它,思考如何将其用于企业的业务中,为企业创造价值,提升运维效率。所以具备主流技术的捕捉能力,也是运维人员的必修课之一。

三、运维现场监控层面:

监控的目的就是防患于未然。通过监控,运维人员能够及时了解到企业网络的运行状态。

一旦出现安全隐患,可以及时预警或者是以其他方式通知运维人员,让运维监控人员有时间处理和解决,避免影响业务系统的正常使用,将一切问题的根源扼杀在摇篮当中。现在的监控工具可以在监控指标触发时,自动修复一些故障,但是它最多帮你做些简单的自动化任务,更高阶的自动化任务需要运维人员具备较深的脚本和系统知识。

四、运维备份层面:

备份是一种保障机制,一般用不到,用到就是大事。备份可以说是运维人员的最后招数,用好这可以起死回生,用不好就会死无葬身之地。公司将重资产都交给运维来做,是对运维的信任,运维人员自然要对这些资产和数据负责,现在备份软件很多,国产的、国外的,所以选择一款适合自己业务需要的备份软件同时制定好备份策略,不同的数据需要不同的策略设定。

四、总结

运维是一件细致的工作,不允许一丝马虎。运维人员一定要富有勇于创新的精神和对工作的激情,有了这些东西,我相信,你一定是个非常优秀的运维人员。”同时一个运维人员技术可以不是那么精深,做事可以不是那么敏捷,但是一定要有一颗较强的责任心,否则一切归零。

转载至https://me.csdn.net/j6UL6lQ4vA97XlM

原文地址:https://www.cnblogs.com/niewd/p/12310906.html

时间: 2024-08-07 15:22:42

怎么做好企业IT运维工作的相关文章

IT运维工作

在"高效运维"公众号中读到<运维自我提升:怎样做好企业IT运维工作>这篇文章,比较赞同,消化一下并记录下来,与大家交流.一.运维工作按工作层次划分:1.硬件运维2.桌面运维(helpdesk)3.系统运维(sa-system admin)4.数据库运维(dba)5.应用运维6.网络运维7.运维开发(devops)8.系统稳定性运维(sre)9.··· ··· 二.运维工作好坏的评价标准运维工作给公司及业务带来的价值与影响,一切行为要围绕业务展开三.运维工作中的工作方法1.技

互联网模式的企业如何运维IT系统(二)

从上面例子可以看出互联网企业的运维特点: 1.IT运维与IT运营不可分,是以创意或服务为导向,以运营为基础的运维: 2.需要团队或复合型人才: 3.强调资源有限原则下的优化与维护: 4.强调准备与预案: 5.强调快速诊断与解决问题: 6.分清层级,强调必要时候的重点保障. 互联网企业多数不像传统企业那样IT需求.软件开发.IT运维可以是三波人,互联网企业更像集团化作战,希望是一个完整的方式,从创意策划.到开发.运营和运维一条龙服务,当然也可以有第三方服务,但统一指挥,他的运维工作还是在"科学化.

企业Linux运维几百个重点面试题汇总(持续更新)

目录: 第一部分:合格linux运维十五个必会原理知识(老男孩教育出品) http://user.qzone.qq.com/49000448/blog/1426386594 第二部分:合格linux运维必会MySQL 实战面试题近百个(老男孩教育出品)http://user.qzone.qq.com/49000448/blog/1427333863 第三部分:企业优秀运维人员20道必会iptables面试题 数十个(老男孩教育出品)http://oldboy.blog.51cto.com/256

关于Linux主流框架运维工作剖析

LINUX是开源的,这也是最主要的原因,想学Windows,Unix对不起,没有源代码.也正是因为这样,LINUX才能够像雪球一样越滚越大,发展到现在这种规模.今天将为大家带来关于Linux主流框架运维工作剖析,大家一定要认真阅读哦~ 随着IT运维的不断发展,尤其的Linux的飞速发展,越来越多的企业开始使用Linux操作系统平台,例如CentOS.RedHat.Ubuntu.Fedora等等,成千上亿个网站涌现在当今互联网,互联网已经成为必不可少的工具,那今天我们跟大家一起来分享讨论目前用的最

Linux运维工作经验小叙

个人认为一个运维人员最应该的一天工作时间安排: 40%,处理紧急重要的事情:60%,开展重要不紧急的工作.紧急重要很容易理解,其实就是救活类工作.重要不紧急的工作,才是最能体现运维价值的工作. 监控系统,这是一个大话题.除了被动地监控各类服务的正常工作与否,还有主动开发协助系统分析的系统,并对整个系统的未来有规划性的开发工具型系统.提高自己和团队内所有人的工作效率的一些工具,尤其是可以快速解决那些中断的工具. 学习,这个是最重要的.运维涉及到的知识面非常广,不断学习才能顺利快速解决工作中出现的种

浅谈SDN架构下的运维工作

导读 目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命.运维人员只能埋头查找系统运行的日志,耗时耗力,老眼昏花不说,有时候忙了半天还一无所获,作为运维工程师的你,有木有遇到过类似苦逼的经历? 目前国内的网络运维还处于初级阶段,工作人员每天就像救火一样,天天疲于奔命."什么破网络怎么又断了","我去,服务器宕机啊","这个网速慢的跟乌龟爬的一样",这些埋怨声每天都在运维人员耳边回荡.运维人员只能埋头查找系统运行的日志,耗时耗

云环境下运维工作面对的诸多新挑战

随着公有云(尤其是公有云IaaS)的普及,整个云上运维和传统IDC中的运维还是呈现出比较明显的不同点,我们可以从下面几个角度来理解这种不同点. 1.应用运维成为云上用户的运维重心. 一般来说,很多企业的运维部门主要工作包括基础运维(针对企业IT基础设施的运维).应用运维(针对企业具体业务的运维),较大的运维部门可能还有单独的运维开发,负责为公司运维部门开发运维工具和平台.当用户决定上云(尤其是IaaS公有云),就表示用户已经把基础运维以及相关的工具平台开发工作交付给云供应商,而把应用运维作为整个

Ping32实现终端运维工作有效进行

企业或多或少都会出现电脑故障,员工在工作时电脑出现问题,导致员工不能正常工作:员工正在写文档,电脑突然出现问题,导致文档丢失,严重影响到了文档的交付,可能会影响到项目的进展.当然,企业出现电脑故障.网络故障等影响员工工作的问题,会有专门的运维人员来到员工工位进行运维工作,解决所出现的问题.一个员工电脑出现问题还好说,运维来到一会儿就完成了,但如果有多个员工都出现了问题,而且问题不一样,各个员工又不在一个区域,运维人员维修起来就显得格外麻烦了,运维人员需要来回的跑,浪费时间精力,人力物力,还不一定

五年屌丝运维工作shell精华

屌丝运维常用shell列出你最常用的10条shellhistory | awk '{a[$2]++}END{for(i in a){print a[i] " " i}}' | sort -rn | headhistory | awk '{a[$4]++}END{for(i in a){print a[$i] " " i}}' | sort -rn | head grep -v "#" .bash_history |awk '{++a[$1]}EN