2015年2月13日服务器无法访问事故记录以及经验总结



计划2015年每天写一篇文章

提问请移步

http://weibo.com/p/1001603810113986105909

如果您不想看完整过程的话,那么直接看经验总结,转发留存吧!

事故主要问题

手工修改过IP设置,因此使用图形界面修改将导致出错,后果就是路由表错误

机房相关经验

  • 需要关注机房的允许维护的时间,特别是公众假期
  • 需要准备好详尽的交通路线,例如这个机房出租车司机可能更熟悉原来的名称:松下电视机厂
  • 需要关注机房的门禁管理,身份证是一定要带的,之前的机房还有需要提前自制工卡的情况
  • 需要关注机房的内部门禁管理,如果需要打电话才能出分区的,就需要在分区中测试手机信号的电量
  • 机房管理方式不同,这个机房禁止在服务器上贴IP标签,因此需要自己贴标签或者其他明显标志
  • 机房的键盘和显示器正常,鼠标是坏的,如果需要进入Linux图形界面,或者Windows的话,养成自带鼠标的习惯
  • 相关资料最好提前下载到笔记本电脑或平板电脑随身带过去,以便于现场查询,机房现场上网并不方便。

详细过程

服务器最近迁机房,然后访问很不稳定,排除了机房的网络原因后,判断是服务器故障,因此需要去机房现场维护。

本人是一名全栈工程师Full Stack Developer,技能包括:服务器运维,后端软件开发,前端软件开发,产品设计。最近写产品设计的文章比较多,这里说明一下,免得让很多好友以为我改行了。

事故的现象是:ping不通,ssh失败,网站无法访问。因为之前遇到过类似的情况,所以基本上判断是路由表出错。插一句:当我开始做产品设计的时候,很多产品设计师都说产品设计工作的血泪经历,这时候,我只能说,那你是没见到运维工作有多惨!产品设计再惨也是没上线之前,而运维事故都是上线之后,所有的人都停下手里的工作等着你解决问题,所以每一个经验上的判断差不多都是这样的血泪经历换来的。

接下来说说机房,之前的机房在河北,提供KVM支持,KVM是Keyboard Video Mouse的缩写,也就是可以通过网络虚拟连接键盘、鼠标、显示器。现在的机房在北京,东北五环,没有提供这些支持,交通也方便。如果把服务器放在外地,就一定要问清是否方便的提供KVM,有的机房不提供,维护一次的交通费用就超过了两地机房费用的差额了,所以不要为了省几百元就放在外地,特别是生产主力服务器,一旦事故,跑过去就要半天,带来的损失比一年的费用都搞,得不偿失,而且外地交通不便,去了可能当天就需要住在那边了,而且有些机房的附近还没有方便的生活配套措施。之前工作中距离最近的时候是从西二旗的写字楼到西二旗的机房。不过现在机房越建越大,这种在写字楼或者写字楼小区中的机房越来越少了,所以距离是选择机房的主要因素之一。

去机房前需要问清楚允许维护的时间,例如现在处于春节假期,从今天起(2月14日)就禁止现场维护了,因此昨天下午是节前最后的维护期限,否则又需要等到春节后了。

即使在北京,也需要注意交通,虽然人工维护不需要带设备,但是机房的位置一般交通不是特别方便,例如这个机房在酒仙桥附近,我就按照地址打车去,结果司机没有听过这个园区,后来走进了才知道这个地方是以前的松下电视机厂,老司机只知道这个地名。当然了新司机可能既不知道新的名字,也不知道原来的松下电视机厂。机房所在园区很大,需要车开进去。

每个机房的门禁管理方式不同,应提前问好,这个机房只查验登记过的身份证,之前有机房既要查验身份证,也需要查验工卡,临时维护就需要提前准备好自制工卡。

每个机房的内部管理不同,这个机房的分区门进出都需要工作人员带领,长时间维护就需要问好出门的联系方式并测试手机的信号,否则关在机房里面出不来就真的麻烦了。之前也有机房只有进门需要带领,可以自己出。

进了分区后,找到服务器也要看机房的管理措施。之前的管理都是在服务器上贴IP标签,这个机房禁止贴,因此上服务器时应准备好足够明显的标识,特别是可能不同的人员维护的情况。

然后向机房管理员索取外设,因为是linux命令行所以只需要键盘显示器即可,因为大部分维护都是这种情况,所以这两个设备应该都是好的。如果需要进入linux图形界面,或者是windows的话,可能会遇到鼠标坏的情况,这时就需要向机房索取鼠标,当然最好自带一个鼠标。

然后登录顺利,这就放心了,开始检查,相关的资料最好自带笔记本电脑或者平板电脑,都离线保存好,这样在现场查询方便,因为虽然机房有方便的网络接入,但是不一定自带设备能方便接入,因为至少需要有空闲iP吧,所以不要习惯上的想上网查资料。如果一定需要上网,可能就需要手机了,手机信号不一定好,而且手机做热点时,电脑可能会当成wifi什么流量都跑。

因为和之前的情况类似,直接定位为路由表出错,查询ip配置发现是手工配置后,再次使用图形化的配置界面导致的出错,修改后重新启动网络服务恢复正常,重新启动电脑恢复正常。

最后打电话通知机房管理员带领出门。

计划2015年每天写一篇文章

提问请移步

http://weibo.com/p/1001603810113986105909

时间: 2024-10-26 10:55:23

2015年2月13日服务器无法访问事故记录以及经验总结的相关文章

李宁-2015年7月13日-个人文档

姓名 李宁 日期 2015年7月13日 主要工作及心得 由于我负责服务器端的编写工作,而各部分的客户端的操作都要与服务器端通信,所以在今天的调试中,我贯穿于各部分模块的调试和检测,主要负责在出现问题时查找问题所属是客户端还是服务器端,针对服务器端出现的问题进行查找和修改. 上午我们的工作重心在于服务器端连接数据库,由于连接数据库是我们的项目中的一个核心部分,如果无法连接数据库,所有工作将无法继续展开,在此项目之前,我们接触Java连接数据库只在网页程序中接触过,并没有接触过普通的Java项目连接

2015年7月13日 项目开发记录

日期 2015年7月13日 星期 星期一 位置 中蓝公寓蓝芳园D507 主要工作 1)         解决服务器端连接数据库的问题(寻找驱动.驱动放置的位置及相关问题) 2)         代码合并及调试 操作员代码部分调试 提供者代码部分调试 经理代码部分调试 遇到的问题 1)         服务器端无法连接上数据库 2)         调试过程中遇到各种问题,例如 3)         JAVA中的日期类和数据库中的日期类转化问题 4)         字符串和日期的转化 解决方法

2015年9月13日和15日【shell、sed&awk 的使用(一)】-JY1506402-19+liuhui880818

目录: 一.shell程序的运行原理 二.shell常用技巧 1.命令历史 2.命令别名 3.命令引用 4.文件名通配 5.常用快捷键 6.补全功能 7.输入输出重定向和管道 8.与用户交互命令 9.脚本的规范建立与执行 10.bash常用选项 11.命令状态结果 持续发现中... 三.常用知识点说明 1.变量 1)变量类型 2)本地变量 3)环境变量 4)特殊变量 2.条件测试 1)整数测试 2)字符串测试 3)文件测试 4)测试表达式 3.条件判断(选择执行) 4.脚本参数(位置参数变量)

linux运维实战练习-2015年9月13日课程作业(练习)安排

一.作业(练习)内容: 1.描述shell程序的运行原理(可附带必要的图形说明): 2.总结shell编程中所涉及到的所有知识点(如:变量.语法.命令状态等等等,要带图的哟): 3.总结课程所讲的所有循环语句.条件判断的使用方法及其相关示例:(if (jpg|png is not exist):echo "You say a XX") 4.写一个脚本:如果某路径不存在,则将其创建为目录:否则显示其存在,并显示内容类型:(不要怀疑,就是这么简单) 5.写一个脚本,完成如下功能:判断给定的

每日总结-2015年1月13日

MVC写API接口遇到问题 [HttpPost] [POST("alterScriptParams")] public bool AlterScriptParamsByScriptName(string scriptName,string scriptParams) { var agencyDatasetScriptBusinessEntity = IocContainer.Resolve<IAgencyDatasetScriptBusinessEntities>(); r

2015年3月13日-日记

日子一天一天过~~我们会慢慢长大~~时间过得好快的说~总结今天做了什么呢.?今天把焊接机的画直线,画圆弧等操作的流程昨晚了~就剩调试了,不过电机这部分还是有点问题了~不知道为什么会多出几步来..真的有点蛋疼了.要是驱动板还没能够正常的话,那就难了..相信我们电子工程师一定可以滴!加油哈哈.然后晚上将大神辉的代码又看了一遍,有了点灵感,想想要把他的写代码的框架给移植过来,基本知道了该如何写了.剩下的就是思维方面的事情了.得向他学习学习~该如何写代码,如何构思.哈哈~感觉我就快学会了.加油吧!今天的

马哥linux+python&mdash;&mdash;2015年9月13日课程作业

一.作业(练习)内容: 1.描述shell程序的运行原理(可附带必要的图形说明): 什么是shell       shell是用户和Linux操作系统之间的接口.Linux中有多种shell,其中缺省使用的是Bash.Linux系统的shell作为操作系统的外壳,为用户提供使用操作系统的接口.它是命令语言.命令解释程序及程序设计语言的统称.shell是一个命令语言解释器,它拥有自己内建的shell命令集,shell也能被系统中其他应用程序所调用.用户在提示符下输入的命令都由shell先解释然后传

linux运维实战练习-2015年9月13日-9月15日课程作业(练习)安排

1.描述shell程序的运行原理(可附带必要的图形说明): 2.总结shell编程中所涉及到的所有知识点(如:变量.语法.命令状态等等等,要带图的哟): 3.总结课程所讲的所有循环语句.条件判断的使用方法及其相关示例:(if (jpg|png is not exist):echo "You say a XX") 4.总结文本处理工具sed及awk的用法:(必须附带示例) 5.写一个脚本:如果某路径不存在,则将其创建为目录:否则显示其存在,并显示内容类型:(不要怀疑,就是这么简单) 6.

IntelliJ IDEA 集成Tomcat后找不到HttpServlet问题(2015年06月13日)

今天第一次用IntelliJ IDEA集成Tomcat做东西玩,在IntelliJ IDEA中配置好Tomcat之后,开始写Servlet,结果却找不到HttpServlet类,原因就是IntelliJ IDEA没有自动把servlet-api.jar包导入,需要我们手动导入,下面是解决方案 添加之后再项目的External Libraries目录中也能看到导入的包了