运维五大点
做到以下五点,你一定是一名成功的运维。
第一点: 态度
态度是对工作的认真度、责任度、努力程度等。
这是运维第一要素,也是做任何事情的第一要素,没有好的态度,是绝对不可能做好一件事情的。
运维对系统稳定性负责,是天经地义的事情。因为运维直接能触碰到影响公司业务的系统,如果业务停了,或者当掉了,那公司的命脉就断了。
所以,态度就表现在,要对系统的健康状况负责,比如有告警了第一时间处理,要给自己的系统做好监控,定期巡检等等。
第二点: 运维意识
a. 备份意识:
做任何操作或者对系统有影响的修改之前都要备份,以免造成不可逆的损害。
b. 留退路的意识:
例如修改系统密码时,记得一定要开两个窗口,以免修改不成功之后还可以用另外一个窗口修改回来。
c. 监控意识:
例如要想办法对手中负责的系统进行监控,这就涉及到,如何去正确评价这个系统的健康状况?稳定性?性能?等等。
d. 安全意识:
例如尽量把数据库放到内网环境中,通过跳板机登录系统,设置复杂密码,定期更新密码,定期做容灾演练、定期检查是否有最新漏洞发布更新包等等。
e. 可追溯意识:
也就是说,你要保证所有自己的操作都能被记录下来,包括执行的操作是什么?有哪些影响,中间返回的结果是什么等等。这块前期你可以将你用来执行命令的SecuCRT的窗口的缓冲设置大一些,例如2w行,另外,对于一些高风险的操作,做完之后,可以做一个滚动截屏,保留操作结果,等等。
f.偷懒意识:
这个不是让你真的去偷懒,而是说,当你多次碰到一类问题时,就要想一想有没有什么办法去不让自己重复劳动,比如每天都要备份数据库,那么是不是每次都要你上去敲一堆命令,然后等着呢?
显然这不行,万一你哪天生病了呢?
所以正确的做法是:你要思考,我每天做的这个事情,是否有办法写成一个脚本,然后挂到crontab上定点执行,这样不就“偷懒”了么?
然后,你要对你偷懒的事情不断进行优化,看看有没有漏洞例如,第二天去看看,昨天的任务有没有执行成功,如果没成功,是哪里出问题了。等等
第三点: 学习能力
当你碰到一个新问题,你要学会使用搜索引擎来解决。
比如当你在学习的时候碰到一个新词:Squid,你就要问自己几个问题:
a. What 这是什么?
b. How怎么用?
c. Why,为什么用它,能解决啥问题?
对于自己特别感兴趣的,可以多实践实践,例如你得知Nginx可以配置反向代理,你就可以尝试看看怎么去配置;你看到一个网络属于:ARP,你就用同样的方法去学习一下,这就是学习能力。
第四点: 总结能力
当你碰到一个难题或者碰到新的东西,经过学习,记得总结起来。人不是神,不可能什么事情都记得清清楚楚。
当你每次解决问题之后把它总结起来,既加深了你的印象,也便于以后查找,这就是总结能力。
第五点: 基础技能
技能是用来衡量你个人含金量的一个重要的可量化指标(虽然我往往认为第1条其实胜过所有剩下的能力)。
例如Linux 常用命令、常用的系统配置、常用软件安装部署、常见的业务原理(例如CDN、DNS、云主机)了解等等。