记一次dell R720服务器ESXI5.5系统宕机的奇葩经历

?记一次dell R720服务器ESXI5.5系统宕机的奇葩经历?

总结点:
1,  没看宕机的原因。
2,  无故重置bois。
3,  不看日志。
4,  Dell r720服务器 内存需要按照顺序插入,如:A1,A2,A3,A4。
5,  使用idrac远程管理页面。
6,  要有自己的判断问题思路,不要什么都依着400。
7,  对问题不重视,要不然就不会直接重启设备了。

失误点一:没看宕机的原因

17号下午5点多的时候,正用着服务器上的虚拟机工作时,mstsc窗口突然断开了。Ping也ping不通,我当时也没想什么,就直接冲到机房把服务器断电重启了,(服务器没有显示器,也没想到去看看什么情况)然后就回到工作台做其他事情了,过了大概10分钟,ping了下服务器,Ping不通,一想坏了,玩大了,我就去拿显示器,键盘去看看情况。一看情况

提示没有Raid,奇了怪了,本着客服至上的精神,就打了400,400指导我看下硬盘,

物理硬盘各方面显示都很正常,状态也正常,所以400就告诉我硬件是没有问题,那就是软件导致的问题,也就是系统喽,让我重新做个raid0,重新装系统。可这问题没有解决,(要是听了400的,我的数据早都没了)。

这是第二天了18号

失误点二:不应该去重置bios

最后跟400客服邮件探讨,400提示我说看看是不是启动项的问题,从硬盘启动试试,我就去试了从硬盘启动,显示DHCP……也就是没找到系统喽,我就挨着试,选择drive C终于成功了,

可以启动了,但是问题又来了。

启动到这个界面就卡住了,我一看当时想估计是bios设置问题把,我就去重置bios。

接着重启,又在这个界面卡住了。然后我按了几下回车,到vkernel load success的时候就立马紫屏显示了。

看到这我就去上网查了一番,查到的方法:1,更新系统,用最新的,这个问题是右e网卡接收到大流量导致的。2,关闭bios的cpuid,3,开启VT功能

找到方法了,就去试试,

1,安装新系统,也是在这个界面就出现了紫屏,估计还是bios设置的问题,
2,bios里面就没有cpuid这个选项,
3,bios里面默认开启VT功能。

没办法就去求助了400

400让我提供这些错误的照片,我跟400说估计是我的bios里面设置有问题,然后他就让我配置下bios,主要是system profile settings这一项。

然后重启进入系统,还是在初始化界面卡住,然后进入紫屏

错误信息减少了,我更加相信是bios设置的问题,回到工作台,就到网上搜了下bios的设置(这个时间,400正在还原我说的问题),看下设置觉得自己设置的没有什么问题,这时候400来了,得出的结论说是我的系统光盘有问题,我第一时间回他说“光盘没有问题”,发过去一想,这问题不是在安装的时候出现的啊,就又回复了一个过去。说明下情况。又让我设置启动项,启动项跟400提供的设置项是一样的。

快要到下班的时候,400又发来一个信息。让我重新下载dell定制的esxi5.5定制的系统,并且在更新bios。今天就算浪费了一天,工作上的事都没干,就弄服务器了。

19号

重大发现:内存错误日志

今天以来我就打开了idrac,本想启动下设备,(开机进F2,一直按太累,就到网上搜了下远程管理的,就看到了这个idrac,也是在昨天捣鼓的,想看虚拟桌面,就必须要升级到企业版,升级就必须要买许可),就去看了下日志。

到网上搜下翻译,提示内存错误,建议操作重新拔插内存

把这个情况跟400说了下,确认是内存有问题,400让我把内存卡换换插槽,我就按照做了,重启设备,提示找不到内存,我里个心肝脾肺肾啊,只好重新拆机重新拔插,重新启动,系统可以进去了,哈哈。可是当我回到操作台去看的时候,发现内存只有8G。我可是有16G的,然后就去看日志(学乖了,知道看日志了)

这个显示A1,A3没有检测到内存卡

屏幕也显示错误

这个错误显示A9,A11内存功能关闭,提示内存要挨着放,

综合2个错误,把4个内存卡分别插在A1,A2,A3,A4 4个插槽内(A4忘了在哪个地方了,就不标了,以免误导),这样重启设备,ESXi主机可以使用了。

历时11个小时。

注:
1,期间不停的按关机,启动进入F11,F2耗费的时间非常长,有时候按了不一定进入设置界面,有一次我连续4次重启设备都没又进入设置界面。这个操作浪费很多时间。
2,期间不停的想重做ESXi系统(客服一直让我重做系统试试),尝试了各种方法。浪费了很多时间
时间: 2024-12-16 23:33:02

记一次dell R720服务器ESXI5.5系统宕机的奇葩经历的相关文章

戴尔dell R720服务器添加cpu和内存条注意事项!

最近公司到了10台服务器,要求是给每台服务器添加1个cpu和8根16G内存条,添加完成之后每台服务器就是2个cpu和8根16G内存条(原来服务器上的2根8G内存条拔掉). 装挡板和上架服务器就不说了,这里说下装cpu和内存条几个需要主要的地方.首先一个cpu对应一个cpu散热器,一开始我们也不知道这个情况,cpu拿来之后,直接装上去了,然后开机测试,结果无法开机,进不了系统,后来打电话给dell工程师咨询,才被告知后来加上的cpu也必须有散热器,否则无法开机,明白了这个情况之后,就从另外5台服务

经历dell R720 服务器坏盘 raid 重建

2015年3月30日下午快下班时候同事从机房出来跟我说服务器磁盘亮黄灯. 我走到机房看见有问题的服务器dell r720前面板闪烁着:Fault detected on drive 0 in disk drive bay 1.中文意思大约是:在驱动器托架1中磁盘0检测到故障. 磁盘0 LED指示灯的确亮着黄灯,看样情况不好很好.这台服务器上跑着公司至关重要的erp数据库,处理故障我需要格外小心.我决定今晚把问题处理掉,不希望问题会拖出其它问题. 在处理之前要做的一个非常关健的步骤就是对数据进行备

我们的手游服务器3个月内宕机1次

我们开发的一款数码宝贝OL的手游,上线3个月后,1个月维护一次.每个服务器进程保持着稳定得运行. 唯一一次宕机是因为业务逻辑代码,读取数码兽数据的时候,程序小兄弟没有对返回的数据指针做保护. 还有一次是目录服务器,无法连接,连接数竟然满了,是因为,目录服务器配置文件没有配置心跳检测时间.这块心跳检测机制须要作一个简单的调整,默认开启一个3~5分钟的定时器检测连接是否失效. 我们做服务器的底层组件的原则是,稳定第一,性能第二:没事千万别把事情搞复杂了,比如一块内存对象,通过引用计数的机制,到处传,

单台[dell R720]服务器部署多个mysql实例

一.安装mysql准备 1.1 下载mysql软件包 mkdir -p /home/xuekun/mysql cd /home/xuekun/tools/mysql wgethttp://dev.mysql.com/get/Downloads/MySQL-5.5/mysql-5.5.10.tar.gz 1.2安装mysql软件 yum-y install make gcc-c++ cmake bison bison-devel ncurses-devel tarxvf mysql-5.6.16.

DELL R720 RAID LINUX驱动问题 XEN安装

公司有台DELL R720服务器,想装上XEN,结果装的时候要求我选择磁盘,看来是磁盘RAID没有别识别的问题.找到DELL官方要了详细型号,MegaRAID SAS 9265-8i是LSI的产品,去LSI官网http://www.lsi.com 中国站:http://www.avagotech.cn/support/download-search  下载 了解,先去百度搜索一下这个RAID的信息,了解一下,去官网就能更快找到相关产品.看图我们知道是6Gb数据传输速率. 2.去LSI官网 点击S

DELL R720服务器安装Windows Server 2008 R2 操作系统图文详解

DELL R720服务器安装Windows Server 2008 R2 操作系统图文详解 说明:此文章中部分图片为网络搜集,所以不一定为DELL R720服务器安装界面,但可保证界面内容接近DELL R720安装界面 一.安装前准备物品 DELL R720服务器及其相关硬件 DELL Systems Management Tools and Documentation 光盘 Windows Server 2008 R2正版安装盘 二.配置服务器RAID 开机自检界面按照屏幕提示,按Ctrl+R

Linux服务器宕机案例一则

案例环境 操作系统 :Oracle Linux Server release 5.7 64bit 虚拟机 硬件配置 : 物理机型号为DELL R720 资源配置 :RAM 8G Intel(R) Xeon(R) CPU E5-2690 8核 案例描述 早晨发现桂林那边一台Linux服务器(虚拟机)网络无法ping通,于是联系那边的系统管理员通过Lync共享桌面给我,通过他的电脑VMware vSphere Client登录后,发现在控制台亦无响应.无法登录.无法操作,输入操作无响应.也就是说系统

Web服务器宕机诊断方法

如果你正面临Web服务器宕机的问题,下面几招可以帮你解决燃眉之急并避免再次出现此类事故. 过去20年里,网络已成为文明的重要部分.从社会需求层次看,网络需求排名仅低于饮用水与可靠电力供应,网络为人类社会提供了更多的生产力,个人娱乐以及整体生活质量改善在过去半个世纪的发展,是以往任何时期都无法比拟的. 通过访问网站满足需求已经被许多现代用户接受:可以通过Web进行学术研究.个人致富和订披萨,用户可以在舒适的家里完成这一切操作.为了竞争,最有信誉的企业也投身到世界级网站建设中,一般说来,就是深入We

趁阿里云宕机之际,我教妹子部署阿里云服务器,妹子邪恶的笑了

上一节教会妹子使用IDEA创建WEB应用之后,妹子的学习兴趣大增,有事没事都缠着我教她技术.看来学好技术好处非常多啊,欧耶!详情请看: 教妹子用IDEA创建web应用,部署到Tomcat服务器 最近阿里云宕机事件闹得沸沸扬扬,把我们的程序员兄弟弄的半夜起来加班修复,真是罪大恶极. 然而,伟大的哲学家认为,事物都是有两面性的.阿里云事件彻底启发了我,真的猛士要敢于直面淋漓的鲜血.程序员就应该迎难而上,到bug最多的地方去. 大家试想,如果我教会了妹子使用阿里云服务器,而阿里云又常常出问题,那妹子岂