CentOS6.5系统重启后宕机

刚接手新公司的业务,一天技术总监过来反映说,公司应用反应缓慢,通过检查发现,确有反应缓慢还时不时的关闭应用,查看日志文件发现是内存不足和内存溢出,步骤如下:

1、调整tomcat应用内存

vim bin/catalina.sh

JAVA_OPTS="-server -Xms1024m -Xmx1024m -XX:PermSize=256M -XX:MaxNewSize=512m -XX:MaxPermSize=1024m -Djava.awt.headless=true "

JAVA_OPTS="-Xms1024m -Xmx1024m"

无明显效果;

2、用TOP和free 查询,发现服务器内存剩余不是很多,JAVA进程占用很大内存空间,在暂时不能增加内存的情况下,考虑用重启服务器来释放内存,使服务有更多的内存空间;

3、重启服务器就启动不起来了

上图中fsck.ext4:Unable to resolve ‘UUID=‘,

原本是/dev/sda1:Unable to resolve ‘UUID=5lk456668886‘等一长串UUID序列号

一直这个画面无法进入系统正常登陆页面

4、以防万一,备份服务器数据,并转移应用到另外服务器,大费一番周折(拿了一块移动硬盘去,不认,提示格式不对,移动硬盘是NTFS格式,因服务器挂了上不了网络,后用FAT32的U盘拷贝NTFS-3g软件到服务器,安装出错,没有安装成功,只有用现有U盘一点点备份数据,我也是醉了。。。。)

5、接下来的一个星期就花在了导数据,恢复,部署,查错等事情上了;

6、数据是导出到了备用服务器上了,应用基本恢复,总算轻松了一些,但还是心有不甘,想办法恢复宕机的服务器,查了很多资料,还是一头雾水,

single进入单用户模式fsck -y /dev/sda1

fsck.ext4 -y /dev/sda1

重启提示就是fsck.ext4:Unable to resolve ‘UUID=‘

还是无法正常启动

找来光盘进入安全模式fsck.ext4 -y /dev/sda1

情况依然,无法恢复

网上查询到大量修复的是grub,但感觉使用在这个故障不合适

: 进入Linux rescue模式后有几种方法引导系统:

chroot /mnt/sysimage   默认是挂载到/mnt/sysimage

方法1:
1. 在系统提示符#后输入:fdisk -l
//显示硬盘的分区,以便确定安装Linux的分区。
//本例是第一个硬盘的第三个主分区hda3  
2. # grub-install /dev/hda
//重新安装GRUB引导程序在第一个硬盘上。
3. # exit;reboot
//退出并重启系统。

方法2:
1. # grub
//进入GRUB命令行模式,出现提示符:grub>
2. grub> root (hd0,3)
//定位安装Linux的根分区,root与参数(hd0,3)间有一个空格。
3. grub> setup (hd0)
//在重新安装GRUB引导程序在第一个硬盘上,setup与参数(hd0)间有一个空格。
4. grub> exit;reboot
//退出并重启系统。

方法3:
1. # grub
//进入GRUB命令行模式,出现提示符:grub>
2. grub> root (hd0,3)
3. grub> kernel (hd0,3)/boot/vmlinuz ro root=LABEL=/
//输入内核参数,注意内核的位置与名字。
4. grub> initrd (hd0,3)/boot/initrd-2.4.20-8.img
//传输映像文件,注意其所在的位置与名字。
5. grub> boot
//引导Linux系统启动。

有查询了UUID 大概明白是fstabs文件中/devsda1:UUID出了问题

7、进入single模式

mount -o remount rw, /      现在宕机系统默认为只读,此为重新挂载

vim /etc/fstabs

我先将/dev/sda1 : UUID=“XXXXXXXXX”/boot更改为其他序列号,错误依然

其次将/dev/sda1 : UUID=“XXXXXXXXX”/boot注释掉,提示信息如下

这是因为注释掉上边一行,也就是没有了/boot,所以一直没有动作

再次将/dev/sda1 : UUID=“XXXXXXXXX”/boot中序列号XXXXXXXXX删除,保留/boot

重启成功,进入久违的登陆界面,进入系统

# tune2fs -l /dev/sda1 |grep ‘UUID‘   查询系统UUID

将查询到的UUID序列号手动写入/etc/fstabs

/dev/sda1 : UUID=“XXXXXXXXX”/boot

重启成功,大功告成

8、总结

这个故障是突然的断电或重启使系统UUID不一致引起的无法启动,因为UUID是每个系统唯一的标志

步骤;

1 single模式

2 mount -o remount rw, /

3 vim /etc/fstabs

删除或更改挂载目录/boot的UUID

4 重启,使系统重新加载

5 查询UUID tune2fs -l /dev/sda1 |grep ‘UUID‘

并更改到/etc/fstabs中/boot的UUID

6 保存重启

时间: 2024-10-11 00:24:52

CentOS6.5系统重启后宕机的相关文章

ovs2.7 在系统重启后,再次使用时提示数据库无法连接的问题。

问题现象如下,ovs开始安装后,对ovs的操作是正常的,但是,现在系统重启后,OVS的操作第一条命令就失败,如下: 问题解决方法: 参考  http://blog.csdn.net/xyq54/article/details/51371819 问题根源是ovs 需要 the ovsdb, ovs-vswitchd, ovs-vsctl, 但是关机后它们会默认关闭 [解决方法]系统启动后,输入OVS命令前先输入如下命令:

Hyper-V 激活Windows系统重启后黑屏的解决方法 + 激活方法

异常处理汇总-服 务 器 http://www.cnblogs.com/dunitian/p/4522983.html 服务器相关的知识点:http://www.cnblogs.com/dunitian/p/4822808.html#iis 直接看激活:http://www.cnblogs.com/dunitian/p/5845589.html#jh 载入安装光盘ISO Shift+F10,输入:bootrec /fixboot 恢复启动了,但是还是未激活 这边说的是软激活(定期点一下,续激活)

系统重启后ngix reload不生效原因分析

这是一种比较少见,困扰我很久的问题,虽然这个问题很简单,但是找到根本原因还是费了不少时间,现在把分析过程分享如下. 前提:需要对Linux系统启动过程.Nginx进程启动过程及进程跟踪有一定的理解. 一,Nginx reload过程分析: 经过查看官网文档及结合Nginx源码分析,大致得出reload过程进行了如下操作. 1,检查配置是否正确 相当于nginx -t 2,打开日志文件 相当于nginx -s reopen 由于日志文件比较多,需要打开多个文件 3,重新监听套接字 相当于nginx

系统重启后,蓝鲸CMDB报404故障

故障:CMDB无法打开 原因:使用host解析域名,域名服务器无法解析域名 cat /etc/resolv.conf # Generated by NetworkManager nameserver 192.168.1.1 处理方法:去除域名 cat /etc/sysconfig/network-scripts/ifcfg-ens160 DNS1=127.0.0.1 systemctl restart network cd /data/install/ ./bkcec stop all ./bk

云平台数据库主机意外宕机问题

问题引入: 很多公司在使用自己的私有云环境时,会选择划分主机集合,像这种 很好,做得很好,但是新建主机集合的精髓在于:区分对待,每个zone内包含物理节点拥有不同的物理配置 比方说: 1.zone1用来新建cpu密集型云主机 2.zone2用来新建内存要求较高的云主机 3.zone3用来新建硬盘io要求较高云主机 如果不区分对待,那划分什么主机集合. 下列就是发生在我们公司的一个案例: 一:问题:生产环境DB主机主节点在19号中午突然宕机,导致公司某业务中断. 二:问题解决: 生产以第一时间恢复

使用虚拟机克隆CentOS 6.9系统重启网卡报错问题的解决

使用虚拟机克隆CentOS6.9系统重启网卡报错问题的解决 1.错误信息 Bringing up interface eth0:  Device eth0 does not seem to be present,delaying initialization.                    [FAILED] 2.解决方法 (1)配置IP地址,重启网卡,出现如下报错 (2)这是因为克隆后的系统和原系统MAC地址和UUID一样,删除UUID和MAC地址 (3)删除网卡相关信息的文件 (4)重

weblogic宕机crash问题解决分享

最近比较烦躁,系统频繁出现宕机,weblogic控制台打印出hs_error_pid****.log文件,打出crash报告. 错误内容如下,连续几天查询问题原因,系统如何优化都还出现crash原因. 最后得知这样可以解决,这个分享出来给大家,使同行们少走弯路,可以节省更多时间,知识共享. 出现此问题原因: 1.当前正在使用jar或者class文件被动态更新: 2.当前jar大于4G并且为JDK6或者更早版本:JDK6或者更早版本只能接受4G大小以下的版本. 问题解决: 1.在JDK的1.6.2

VPS每次重启后必做的优化工作

经过很多次的试验,CentOS.Debian.Ubuntu系统都暂时无法在开机是让它自启killall -9命令,用sleep的Shell语句让它在开机3或5分钟后再自动执行killall -9,依然不起作用.所以,这项工作必须在每次系统重启后手工添加.正好昨天收到主机商的邮件,每个VPS空间都收到了服务器要重启一次的通知: 对于OpenVZ,每次重启后需要手工执行一次这个Shell命令:killall -9 syslogd 对于KVM,每次重启后需要手工执行一次这个Shell命令:killal

双系统重新安装后修复引导xp、win7、ubuntu

本文针对单个硬盘的主机,分为三步. 第一步: 使用liveCD或者u盘引导电脑进入ubuntu,这里最好是确保二者的系统版本一致. 菜单 System -> Administration ->Disk Utility 查看ubuntu的根分区号,例如 /dev/sda6. [如果独立挂在 boot分区,则记住 boot分区的分区号] 通过快捷键 CTRL+ALT+T调出终端, 执行命令: sudo -i mount /dev/sda6 /mnt 写下下面这条命令的结果: uname -r 执行