很多工作的网友对运维工作的定位,背黑锅的,“黑锅侠”!
企业运维工作中50%以上的故障都是因内部人员管理失误造成的,“某程”就是个典型例子。
如果规范工作中的一举一动,就会不断的犯错,最后导致所有的功劳都变成徒劳。
那么老男孩老师在10多年的运维工作中是如何高效运维,不让运维成为黑锅侠的呢?
今天给大家分享一些简单但可以有效的防止误删数据的小技巧:
1、修改或删除数据前请务必备份,最好有异机备份,修改配置等先提交版本管理系统在发布到线上。
2、运维新手删除应使用mv命令替代rm命令,无用的文件不要着急删除,而是移动到回收站/tmp里观察一段时间。
可以通过设置别名等手段屏蔽rm,这样一旦直接用到rm命令就是意识到(当然真想用有手段可以越过别名)。
3、如果非要删除数据,还可用find结合rm替代单纯的rm,包括设定定时任务等动作执行清理。
4、如果非要使用rm删除,请尽量先切换目录在删目录下的数据,能不用通配符就不用通配符。
例如:
1 2 |
|
5、如果非要使用rm删除并且要采用通配符,请按下面方法:
1 2 |
|
6、应禁止使用类似rm -fr /oldboy/*命令删除
a.这个命令中,目标路径中的任意斜线前后如果多了空格可能会带来灾难。
1 2 3 4 |
|
7、如果必须要rm -fr /oldboy/*命令删除,最后的避免错误方法就是要用tab键去补全,不要手敲任何字符,防止误删
8、如果删除的不是目录,就不要用rm -fr,采用最下化的方法rm -f即可,甚至重要的少量文件,可以不用-f,以获得确认删除提示信息。
9、额外补充,慎用rsync --delete
总结:
a.删除数据后,多数情况是可以恢复的,但会影响业务,
b.例如:需要停机恢复,且数据丢了,较长时间用户访问不了对应数据了
c.恢复工具诸如ext3grep等。
d.事情发生前未雨绸缪永远比发生了在解决好得多。
e.养成规范、专业科学的运维习惯、运维流程是避免当黑锅侠的关键!。