逃离系统故障的十个心得

系统故障,对于 DBA或是运维人员来说,都是心中永远的痛。而避免故障的原则却是殊途同归,现列如下,与君共勉。

一、变更要能回滚、先在同样的环境测试过

佛说:每次创伤、都是一次成熟、这便是运维人员的真实写照。从某种意义上讲、运维是一门经验的学科、是一门试错的学科。没有做过的东西、总是会给你不期而遇的痛击,请保护现场,让变更有回头的机会。

二、对破坏性的操作谨慎小心

什么是破坏性的操作?

比如:对 Oracle 而言:truncate table_name、delete table_name、drop table_name,这些语句执行起来轻松简单也惬意极了、但记住!即便数据可被回滚、代价也是非常大!

对 Linux 而言:rm -r 所有当前及其子目录的所有数据都将被删除。经历过这种故障的人、大多会给 rm 上个别名

alias rm=‘rm -i‘

同理、cp 和 mv 也可以有同样的选项:

alias cp=‘cp -i‘
alias mv=‘mv -i‘

三、设置好命令提示

在操作之前、先理清你所在的是主库、备库?当前目录?哪个 schema?session?时间?

比如:

对 Oracle 来讲:

[plain] view plaincopy
idle> set sqlprompt ‘[email protected]>>‘
[email protected]>>

当然、你也可以在 glogin.sql 里面设置。

  • 对于 Linux 而言、bash 环境的提醒可设置 PS1 来知道当前目录、登陆用户名和主机信息等;
  • 对 PS1 更多理解、请见:man PS1

四、备份并验证备份的有效性

人非圣贤、岂能无过?是机器总有计划内或计划外崩溃的一天。怎么办?备份!!!备份的学问很大、按照不同的维度可以分:冷备和热备;实时和非实时;物理和逻辑。OLTP 7*24 在线业务、DB 就需要有实时热备。这样就可以了吗?

如果开发人员的一个不带任何条件的 delete 误删所有数据,此时你除了实时、还需要有非实时的备份、把 DB 从逻辑错误中恢复出来。

备份有了、可以高忱无忧了吗?不行!尚须验证备份的有效性。一个总有那么几次、备份无法保证 100% 恢复,简单的验证就是找个空库恢复出来。

五、对生产环境永保敬畏之心

会计人员在从业之前、都有个职业操守的训练。同理、这也应该是运维人员进入行业首先需要具备的素养。

比如:

  • 于 Oracle 而言、你可以跑一个 RDA 巡检 DB 的健康状况;
  • 于 Linux 而言、是否有 password aging、隔离外网等。

六、交接和休假最容易出故障、变更请谨慎

  • 接手别人的工作要一而再,再而三的确认变更方案。请教人并不见得就是能力不行的表现;
  • 休假前最好各种可以做好的事情,最好能够准备一份文档,指明在什么情况下怎么做和联系哪些人;
  • 在别人放假的时候接手工作,“能拖则拖”,实在需要执行:必须不厌其烦的跟原运维者确认各个操作细节。

七、搭建报警、及时获取出错信息;搭建性能监控、预测趋势

运维人员赖于生存的工具就是报警和监控。

  • 报警可以让你及时知道系统出现了什么异常、以便及时跟进、把故障扼杀于摇篮;
  • 监控可以让你了解系统的历史性能信息、以历为鉴、可以知兴替嘛、早做优化。

报警和优化是衣宽带水的好兄弟、相铺相成、互相促进。

八、自动却换需谨慎

比如:Oracle 存储级的HA方案:Data Guard,主库提交了一笔订单,结果发生了 switchover,这笔订单没有同步到备库,那么卖家损失了一个销售单、对客户、对公司都是损失。

九、仔细一点,偏执一点,检查,检查,再检查

有这么一个人:

① 他在做一个变更的时候,会先提前一两周发送邮件并电话手机通知相关人

② 在测试机上写好脚本,召集大家 review 操作步骤和脚本

③ 测试完成以后拷贝到生产环境

④ 登录对应机器,“打开,关闭,打开,关闭”该脚本

⑤ 跟相关人员再次确认执行的操作,顺序,时间点,可能的影响和回滚是否都准备好了

⑥ 执行前还要退出这个机器,然后再登录进去,“打开,关闭”脚本

⑦ 最后才在后台运行脚本,同时在另外一个窗口登录着,随时ps和查看结果输出

期间姿势端正,呼吸急促而均匀,眼神凝重。操作的人不觉得累,倒是一边学习的人很累。

十、简单即是美

这有点禅的意境、和 GNU/Linux 的思想不谋而合。

我们总是面临各种诱惑:新的系统架构,新的更智能的命令和工具,最新的硬件平台,功能更全的HA软件...你可以在线下安装,测试,怎么做都行。但是如果想要在生产环境下使用起来、请三思!!

  • 能够使用系统内置命令的话,就不用考虑其他要专门下载安装的软件了
  • 脚本本身就能完成的功能,就没有必要专门找一个功能丰富的软件来做
  • Linux本身自带的字符界面比那些复杂的图形界面要简洁方便

......

最后祝大家运维工作一帆风顺,多福多寿,不出故障。

轉自51cto:http://os.51cto.com/art/201304/387504.htm

时间: 2024-12-26 21:37:29

逃离系统故障的十个心得的相关文章

学习心得:《十个利用矩阵乘法解决的经典题目》from Matrix67

本文来自:http://www.matrix67.com/blog/archives/tag/poj大牛的博文学习学习 节选如下部分:矩阵乘法的两个重要性质:一,矩阵乘法不满足交换律:二,矩阵乘法满足结合律经典题目1 给定n个点,m个操作,构造O(m+n)的算法输出m个操作后各点的位置.操作有平移.缩放.翻转和旋转    这 里的操作是对所有点同时进行的.其中翻转是以坐标轴为对称轴进行翻转(两种情况),旋转则以原点为中心.如果对每个点分别进行模拟,那么m个操作总共耗时 O(mn).利用矩阵乘法可

参加老男孩linux培训心得

参加老男孩linux培训心得 时间如白驹过隙,已经不知不觉来到老男孩培训已经三个月了.在这三个月中我渐渐得到了成长,专业技术成长,以及为人处事之道与思想的提高. 我一共就总结以下了三点     一.思想 在我刚来老男孩的时候,老师天天上课前讲一段思想,我当时不太明白,不赶紧上课,讲这干啥呢?而且老师早一点讲完,又可以招下一批学生了,老讲思想,这不是自断财路么?随着时间的流逝,渐渐的我悟懂了点.人在那里都可以学技术,但是学会了技术没有思想,一旦来了新事物,就会接受的很慢.尤其在互联网这个圈子里,软

十二年IT职业生涯心得--致我们终将逝去的青春(连载)

章节001最近老婆带儿子回娘家住一段时间,一个人无聊的很,回到家安静的屋子让人很不适应.正好赶上世界杯,到家就把电视开开弄点动静出来,周末赛事熬了几个通宵.也趁着这"自由"的时间给自己写写总结! 话说long long ago专科毕业后雄心勃勃地去了当时业内号称的电脑公司工作,觉得凭自己的能力在电脑城能做出点名堂,而这一做就三年多.做的最多的就是接货送货(各种CRT显示器,各种主板,显卡,机箱,电源),拧螺丝,组装(给网吧装电脑的话一装就百来台,RJ45水晶头熟练到几乎闭着眼都能做),

windows类书的学习心得(转载)

原文网址:http://www.blogjava.net/sound/archive/2008/08/21/40499.html 现在的计算机图书发展的可真快,很久没去书店,昨日去了一下,真是感叹万千,很多陌生的出版社,很多陌生的作者,很多陌生的译者,书名也是越来越夸张,什么××天精通××,精通××编程, ××宝典等等,书的印刷质量真的很好,纸张的质量也是今非昔比啊,但书的内容好象却是越来越让人失望,也许是我老了,我的思想我的观念已脱离现实社会,也许是外面的世界变化得太快,我编程数月,出去一走,

此文记录了我从研二下学期到研三上学期的找工历程,包括百度、腾讯、网易、移动、电信、华为、中兴、IBM八家企业的面试总结和心得--转

感谢电子通讯工程的研究生学长为大家整理了这么全面的求职总结,希望进入通信公司和互联网公司做非技术类岗位的学弟学妹们千万不要错过哦~ ---------------------------原文分割线-------------------------- 此文记录了我从研二下学期到研三上学期的找工历程,包括百度.腾讯.网易.移动.电信.华为.中兴.IBM八家企业的面试总结和心得,希望能够帮助到正在找工的朋友和师弟师妹们,并纪念找工这段怀揣着希望和梦想,伴随着紧张和压力,同时令我受益匪浅的日子. (本文

庄辰超:回顾去哪儿的这些年,最让我骄傲的是收获了这9点管理心得

我前两次的创业 1994 年到 1998 年,我在北大无线电系念书,这是一个纯粹搞科学的专业,但我当时就很喜欢自己写点程序. 我的第一次创业是在大学期间,在大四的时候和同学一起做过一个简单的搜索引擎爬虫软件,获得了 IDG 资本 5 万美金的投资,之后我们开始在北京和上海卖这个软件.当时 Chinabyte 刚进到中国来,没法做一个传统的媒体,同时由于内容的监管只能做 IT 内容,因此我们软件的第一个 copy 就卖给了 Chinabyte,给他们做搜索引擎. 这是我第一次接触互联网.然而当时在

移植ffmpeg到VC环境心得

所有想学习ffmpeg的网友有福了,大名鼎鼎的ffmpeg,移植到Windows的VC6版本全部开源,编译环境为VC6+SP5+VCPP5.别忘记了顶贴哦. 移植ffmpeg到windows,主要的修改是ffmpeg中VC6不支持C99语法,简单移植步骤如下: 1:首先装好Linux.VMware和SDL,配置好smb,在Linux下编译通过,验证能正确的Run. 2:把Linux下相应目录的所有文件通过smb拖到Windows,以后的修改移植都在Windows下进行. 3:对照所有同名的.c文

十多年的经验与心得

技术人生的职场众生相 - 十多年的经验与心得 2017-07-16 09:03 by 灵感之源, 11157 阅读, 48 评论, 收藏, 编辑 前言 我是个码农,在职场干了多年,在超过10个公司服务过,遇到过各种怪现状,拍案惊奇葩,不吐不快,太想写篇文章吐槽一下. 这篇文章汇集了我10多年来的工作中遇到的各种经历,总结的心得,分别讨论了团队与协作(同事/领导/客户的交流).技术与质量(学习.技术选择.质量).职业与事业(现实.追求.老油条.职业道德.典故.事业/经验).找工作(猎头/中介.应聘

智能推荐系统开发:十个关键注意点

亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”.智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息.为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的研究与应用中,很多优秀的方法被提出,很多技术难题被攻克.在今天的互联网应用中,越来越多“聪明”的推荐系统被开发出来,并被广大用户信赖和使用. 智能推荐系统充分运用了机器学习.数据挖掘.搜索