大家应该都有这样的情况,就是软件开发时都是全力以赴的把软件开发出来,一旦软件上线运行起来我们就能松口气,从而放松了对服务器及数据的管理。往往这个时候,服务器的一个小故障都能让我们忙上好一阵。经历过类似的经历后,越发觉得服务器的管理的重要性,对于像我们这样没有专职人员来管理服务器的现状,如何能够更有效的进行数据管理,保证企业 信息系统的平稳运行不出现大的问题,在此探讨一下,算不上专业的服务器管理,只是身处这样的企业环境的实际情况罢了。
1、服务器搭建配置
一般情况是谁开发的软件谁来干这个活,开发的人把服务器搭建完了,软件也安装上能运行了,后续的维护工作很可能就会出现没人管的情况,或者是没有人来约束这个管理,不出问题的话可能几个月也没人想起来这个服务器的事情。
因此,为了让这个工作能有序平稳的进行,服务器搭建之初就应该编写详细的安装配置文档,形成档案并分发给相关的管理人员。确定日常管理人员,明确其日常工作内容,比如数据库的备份,常见问题的解决方法等等。
2、灾备计划
熟话说“有备则无患”。只有时时想着数据的重要性,做到及时备份才能够真正的做到有备无患。并且这个计划要根据实际软件的业务应用情况,设置合理的备份间隔并定期对备份数据进行检查验证,保证备份的数据是有效可用的。
另外,对于备份的文件要做到配置信息存档可查,出现问题及进行恢复等操作进行相关的测试并进行及时记录。
3、RAID X
对于服务器来说,我们最常用的就是RAID 5这种数据备份形式,这样备份的好处就是3块硬盘坏了一块不影响服务器的正常运行,换上一块同样的硬盘进行替换坏的即可。但是这样的好处经过几次验证还是很难保证系统的完全正常。比如机器买的时间很长,很难配上相同型号、容量的硬盘,这也就没法进行替换,或者是系统出现崩溃,原来的老服务器安装系统都是问题。所以说现在问我要不要做RAID我也有很多的疑虑,如果使用系统的用户不是特别多,可以尝试应用RAID 0+SWAP盘的形式,两块盘互相做备份,并通过软件定时将数据备份到SWAP盘上,并且如果raid盘出现问题也可以自动进行接替。RAID5也可同理来操作,就是买服务器时不要只买3个盘,这样给自己留的可操作余地太小了。
4、备用机
说到备用机这个是够奢侈的,当然这个机器不是说完全就在那等着备用闲着,平常也可以跑些小的应用,关键时刻可以顶上。最近就有出现一个服务器不能开机的情况,幸好有个同型号的服务器,就把故障机器的硬盘都拿下来(做了RAID5),放到好的机器上,从RAID配置里导入配置,OK,进入系统可以正常读取硬盘中的数据,数据才是硬道理啊,原来RAID信息同时写在RAID卡里和硬盘里,当硬盘放入新机器时由于RAID卡都是相同型号的故可以争取读出硬盘的RAID配置信息,才不至于有不好的结果。硬件坏了可以修,数据丢了就是大事了。所以有台这样的备用机(最好是同型号的)是给自己多留一个选择。
5、日常管理记录
平常的服务器管理最好有良好的管理记录,以便关键时刻可以查找相关的信息,这个就需要管理员养成好的工作习惯,最好这个文档保持一定的公开性,以便其他人在必要时可以获取相关信息。