linux启动常见故障

Linux在启动过程中会出现一些故障,导致系统无法正常启动,本文列举了几个应用单用户模式、GRUB命令操作、Linux救援模式的典型故障修复案例帮助读者了解此类问题的解决。

一、单用户模式

Linux提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护。在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程运行。单用户模式可以用来修改文件系统损坏、还原配置文件、移动用户数据等。

以下列举了几个单用户模式修复系统故障的典型案例:

案例一:硬盘扇区错乱

在启动过程中最容易遇到的问题就是硬盘可能有坏道或扇区错乱(数据损坏)的情况,这种情况多由于异常断电、不正常关机导致。

此种问题发生,在系统启动的时候,屏幕会显示:

Press root password or ctrl+D:

此时输入root密码系统自动进入单用户模式,输入“fsck -y /dev/hda6”(fsck为文件系统检测修复命令,“-y”设定检测到错误自动修复,/dev/hda6为发生错误的硬盘分区,请依据具体情况更改此参数),系统修复完成后,用命令“reboot”重新启动即可。

案例二:root密码忘记

在单用户模式中,Linux不需要root密码(Red Hat系统不需要root密码,但SuSe则需要,不同Linux系统稍有差别,本文以Fedora Core 6为例讲解),这使更改root密码非常容易。了解当系统引导进入多用户模式失败时,如何进入单用户模式,非常重要。

图1进入GRBU菜单选项

1、
在系统启动过程中,会出现图1所示画面,按任意键,进入GRUB菜单选项。

若希望以后无此提示,直接进入GRUB菜单选项,删除配置文件grub.conf中“hiddenmenu”项即可。

图2 GRUB引导菜单选项

2、按下键定义到kernel行,按下e键,
按“e”键编辑GRUB引导菜单选项,图2显示为按“e”键后的GRUB屏幕。

通过箭头键下移到kernel行,并按“e”键,得到图3中显示的编辑界面:

图3 kernel行编辑界面

在尾行光标处添加single,按回车键返回前一个屏幕,按“b”键进行引导,则系统自动进入单用户模式,如果要改变root密码,则执行命令:

sh-3.1# passwd root

更改成功后,执行命令exit退出重启即可。

我们可以在单用户模式中去纠正阻止系统正常启动的很多问题,比如:
1、
禁用可能中止系统运行的服务
如禁用Samba服务,则执行:
sh-3.1#chkconfig smb off
下次系统引导就不会启动Samba服务了。
2、
更改系统缺省运行级
如果X Window无法启动或者出现故障,可以编辑/etc/inittab文件,采用文本方式登录,更改initdefault引导级别为3:
id:3:initdefault:
案例三、GRUB选项设置错误

图4 GRUB引导错误信息

下图是一个系统管理员不希望看到的控制台信息,“Error 15”显示系统无法找到grub.conf中指定的内核。

我们观察发现因为打字错误,内核文件的“vmlinuz”打成了 “vmlinux”,所以系统无法找到内核的可执行文件。我们可以按任意键回到GRUB编辑界面,修改此错误,回车保存后按“b”键即可正常引导,当然不 要忘记进入系统后修改grub.conf文件中此处错误。
这是很多初学Linux的用户在修改GRUB设置时很容易犯的错误,出现此黑屏提示时注意观察报错信息,即可针对性修复。

二、GRUB引导故障排除

有时Linux启动后会直接进入GRUB命令行界面(只有“grub>”提示符),此时很多用户就选择了重新安装GRUB 甚至重新安装系统。其实一般而言此故障的原因最常见的有两个:一是GRUB配置文件中选项设置错误;二是GRUB配置文件丢失(还有少数原因,如内核文件或镜像文件损坏、丢失,/boot目录误删除等),如果是第一种情况,可以首先通过GRUB命令引导系统后修复;若是第二种情况,则要使用Linux救援模式修复了(本文后续有描述)。

首先,我们需要了解GRUB启动系统的引导过程,grub.conf文件中主要的配置选项如下(注意,GRUB配置文件为/boot/grub/grub.conf,/etc/grub.conf只是此文件的软链接):

title Fedora Core (2.6.18-1.2798.fc6)

root (hd0,0)

kernel /boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/ rhgb quiet

initrd /boot/initrd-2.6.18-1.2798.fc6.img

其中“title”段指定了GRUB引导的系统;“root”段指定了/boot分区所在的位置;“kernel”段指定了内核文件所在位置,内核加载时权限属性为只读(“ro”)以及指定根分区所在位置(root=LABEL=/);initrd指定了镜像文件所在位置。所以GRUB在引导时顺序为首先加载/boot分区,然后依次载入内核与镜像文件。

案例:“title Fedora Core (2.6.18-1.2798.fc6)”段被误删除

此时,系统启动后会自动进入“GRUB>”命令行,为排除故障我们可以依次做如下操作:

1、查找/boot/grub/grub.conf文件所在分区

GRUB> find /boot/grub/grub.conf

(hd0,0)

2、查看grub.conf文件错误

GRUB>cat (hd0,0)/boot/grub/grub.conf

建议系统安装设置好后,要将grub.conf文件备份,如果有备份文件如grub.conf.bak,则此时可以查看备份文件,与当前文件比较,发现错误:

GRUB>cat (hd0,0)/boot/grub/grub.conf.bak

3、确认错误后,先通过命令行方式完成GRUB引导,进入系统后再行修复grub.conf文件错误:

1)指定/boot分区

root (hd0,0)

2)指定内核加载

kernel /boot/vmlinuz-2.6.18-1.2798.fc6 ro root=LABEL=/ rhgb quiet

3)指定镜像文件所在位置

initrd /boot/initrd-2.6.18-1.2798.fc6.img

提示:GRUB支持tab键命令补全功能

4、从/boot分区启动
boot (hd0,0)

命令行模式可以在GRUB菜单模式中通过按“c”键调用,也可以用于测试新编译的内核(设置kernel、initrd引导新内核及镜像文件)。增加对GRUB引导以及Linux系统引导知识的了解将对此类故障排除大有帮助。

三、Linux救援模式应用

当系统连单用户模式都无法进入时或出现GRUB命令行也不能解决的引导问题,我们就需要使用Linux救援模式来进行故障排除了。步骤如下:

1、将Linux安装光盘(如果使用CD光盘,则放入第一张引导光盘)放入光驱,设置固件 CMOS/BIOS为光盘引导,当Linux安装画面出现后,在“boot:”提示符后输入“linux rescue”回车进入救援模式。(想了解救援模式详细信息,还可以按F5键查看)

图5进入linux救援模式

2、系统会检测硬件,引导光盘上的Linux环境,依次提示你选择救援模式下使用 的语言(建议选择默认的英文即可,根据笔者测试,部分Linux系统选择中文会出现乱码);键盘设置用默认的“us”就好;网络设置可以根据需要,大部分 故障修复不需要网络连接,可不进行此项设置,选择“No”。

图6挂载设置

3、接下来系统将试图查找根分区,出现以下提示:

默认在救援模式,硬盘的根分区将挂载到光盘Linux环境的/mnt /sysimage目录下,默认选项“continue”表示挂载权限为读写;“Read-only”为只读,如果出现检测失败可以选择“skip”跳 过。此处,因为要对系统进行修复,所以需要有读写权限,一般选择默认选项“continue”。
进入下一步后,系统提示执行“chroot /mnt/sysimage”命令,可以将根目录挂载到我们硬盘系统的根目录中去。

案例一:双系统启动修复

当我们安装双系统环境,先安装Linux再安装Windows;或者已经安装好双系统环境的Windows 损坏,在重新安装Windows后,保存GRUB的MBR(Master Boot Record,主引导记录)会被Windows系统的自举程序NTLDR所覆盖,造成Linux系统无法引导。

1、如果要恢复双系统引导,首先用上述方法进入救援模式,执行chroot命令如下:
sh-3.1# chroot /mnt/sysimage

2、将根目录切换到硬盘系统的根目录中,然后执行grub-install命令重新安装GRUB:
sh-3.1#grub-install /dev/hda
“/dev/hda”为硬盘名称,如使用SCSI硬盘或Linux安装在第二块IDE硬盘,此项设置要做相应调整。

3、然后依次执行exit命令,退出chroot模式及救援模式(执行两次exit命令):
sh-3.1# exit
sh-3.1# exit
系统重启后,将恢复GRUB引导的双系统启动。

案例二:系统配置文件丢失修复

图7 /etc/inittab文件丢失引导错误示例

系统在引导期间,很重要的一个过程就是init进程读取其配置文件/etc /inittab,启动系统基本 服务程序及默认运行级别的服务程序完成系统引导,如果/etc/inittab误删除或修改错误,Linux将无法正常启动,如图7所示。此时,只有通过 救援模式才可以解决此类问题。

1、有备份文件的恢复办法
进入救援模式,执行chroot命令后,如果有此文件的备份(强烈建议系统中的重要数据目录,如/etc、 /boot等要进行备份),直接将备份文件拷贝回去,退出重启即可。如果是配置文件修改错误,如比较典型的/boot/grub/grub.conf及 /etc/passwd的文件修改错误,也可以直接修正恢复。假设有备份文件/etc/inittab.bak,则在救援模式下执行:
sh-3.1# chroot /mnt/sysimage
sh-3.1# cp /etc/inittab.bak /etc/inittab

2、没有备份文件的恢复办法
如果一些配置文件丢失或软件误删除,且无备份,可以通过重新安装软件包来恢复,首先查找到/etc/inittab属于哪一个RPM包(即便文件丢失,因为存在RPM数据库,一样可以查找到结果):
sh-3.1# chroot /mnt/sysimage
sh-3.1#rpm -qf /etc/inittab
initscrīpts-8.45.3-1

退出chroot模式:
sh-3.1#exit

挂载存放RPM包的安装光盘(在救援模式下,光盘通常挂载在/mnt/source目录下):
sh-3.1# mount /dev/hdc /mnt/source

Fedora系统的RPM包存放在光盘Fedora/RPMS目录下,其他 Linux存放位置大同小异,这 里不一一列举;另外,因为要修复的硬盘系统的根目录在/mnt/sysimage下,需要使用–root选项指定其位置。覆盖安装/etc /inittab文件所在的RPM包:
sh-3.1# rpm -ivh –replacepkgs –root /mnt/sysimage /mnt/source/Fedora/RPMS/initscrīpts-8.45.3-1.i386.rpm
其中的rpm命令选项“–replacepkgs”表示覆盖安装,执行完成后,即已经恢复了此文件。

如果想只提取RPM包中的/etc/inittab文件进行恢复,可以在进入救援模式后,执行命令:
sh-3.1#rpm2cpio/mnt/source/Fedora/RPMS/initscrīpts-8.45.3-1.i386.rpm
| cpio -idv ./etc/inittab
sh-3.1# cp etc/inittab /mnt/sysimage/etc

注意此命令执行时不能将文件直接恢复至/etc目录,只能提取到当前目录下,且恢复的文件名称所在路径要写完整的绝对路径。提取文件成功后,将其复制到根分区所在的/mnt/sysimage目录下相应位置即可。

救援模式是维护Linux的有力武器,本文以上述两个例子讲解了它的应用方法,希望能够给读者一点启示。解决Linux系统启动的故障,必须充分理解Linux的引导过程,才能够对故障进行有效的判断和处理。

时间: 2024-12-28 13:58:40

linux启动常见故障的相关文章

Linux启动和故障排错

Linux启动和故障排错 系统启动流程: 系统初始化:POST --> BootSequence (BIOS) --> Bootloader(MBR) -->kernel(ramdisk) -->rootfs(只读) -->init(systemd)init程序的类型:Upstart: init,CentOS 6配置文件:/etc/inittab, /etc/init/*.confSystemd:systemd, CentOS 7配置文件:/usr/lib/systemd/s

硬盘无法启动常见故障解决办法

这个问题比较头痛,硬盘无法启动你就进不了系统.对一般刚学电脑的朋友有占难度.希望下面的文章对你有所帮助一:开机后屏幕显示:“Device error”,然后又显示:“Non-System disk or disk error,Replace and strike any key when ready”,说明硬盘不能启动,用软盘启动后,在A:\>后键入C:,屏幕显示:“Invalid drive specification”,系统不认硬盘. 故障分析及处理:造成该故障的原因一般是CMOS中的硬盘设

Linux的启动过程与常见故障排除

linux的基础启动流程 1. 加载BIOS的硬件信息,并获取第一个启动设备的代号.    2. 读取第一个启动设备的MBR的引导加载程序(即lilo.grub.spfdisk等)的启动信息.    3. 加载操作系统的核心信息,核心开始解压,并尝试驱动所有的硬件设备.    4. 核心执行init程序并获得运行信息.    5. init执行/etc/rc.d/rc.sysinit文件.    6. 启动核心的外挂模块(/etc/modprobe.conf).    7. init执行运行的各

Linux常见故障-------MBR引导扇区恢复

本次给大家介绍的是Linux常见故障其中的MBR引导扇区. ----------------故障概述-------------- 基本概述在Linux系统的启动过程中,涉及MBR主引导记录.GRUB启动菜单.系统初始化配置文件等各方面,其中任何一个环节出现故障都可能会导致系统启动的失常,因此一定要注意做好相关文件的备份工作. 完整的开机引导流程 开机自检:也称加电自检(POST,Power On Self Test). 指计算机系统,接通电源,(BIOS程序)的行为,包括对CPU.系统主板.基本

Linux启动过程笔记

Linux启动过程 1.启动流程(BIOS->MBR:Boot Code->引导GRUB->加载内核->执行init->runlevel) 2./boot/grub/下有多个文件   其中stage1为MBR镜像(512字节) stage2为引导程序 3./boot/grub/grub.conf为引导的配置文件 default=0#默认加载下边哪个系统 timeout=3#引导等待时间 splashimage=(hd0,1)/boot/grub/splash.xpm.gz#引

linux初学者-系统启动故障篇

linux初学者-系统启动故障篇 在系统的操作中,有时会不小心误删或者操作失误使得系统启动不起来,下文将列举几种常见的系统启动失败的情况及解决的办法. 1.删除或者覆盖mbr的446个字节 mbr的446个字节指定了系统启动时/boot分区在磁盘中的为至,所以mbr这446个字节如果被删除或者被覆盖,就会导致系统找不到/boot分区而开不了机. 例如下图,用"dd if=/dev/zero of=/dev/vda bs=446 count=1"覆盖掉前446个字节.重启系统发现无法启动

NFS服务的简介及常见故障解决方法

NFS服务的简介及常见故障解决方法 1.NFS基本介绍 (1)NFS简介 NFS 是Network File System的缩写,即网络文件系统.一种使用于分散式文件系统的协定,由Sun公司开发,于1984年向外公布.功能是让客户端通过网络访问不同主机上磁盘里的数据,主要用在类Unix系统上实现文件共享的一种方法.NFS在文件传送或信息传送过程中依赖于RPC协议. (2)NFS服务需要安装的软件 nfs-utils-* :包括基本的NFS命令与监控程序 rpcbind-* :支持安全NFS RP

【集群实战】NFS服务常见故障排查和解决方法

NFS,全名叫Network File System,中文叫网络文件系统,是Linux.UNIX系统的分布式文件系统的一个组成部分,可实现在不同网络上共享远程文件系统. NFS由Sun公司开发,目前已经成为文件服务的一种标准之一(RFC1904,RFC1813). 其最大的功能就是可以通过网络,让不同操作系统的计算机可以共享数据,所以可以把NFS看做是一个文件服务器.NFS缺点是其读写性能比本地硬盘要差一些. 一.NFS服务常见故障排查: NFS服务出现了故障,主要从以下几个方面检查原因: (1

51CTO学习笔记--Linux运维故障排查思路与系统调优技巧视频课程(高俊峰)

51CTO学习笔记--Linux运维故障排查思路与系统调优技巧视频课程 第一课 Linux运维经验分享与思路 1.一般把主机名,写到hosts下    127.0.0.1    hostname,因为很多应用要解析到本地.oracle没有这个解析可能启动不了. 2.注释掉UUID以及MAC地址,需要绑定网卡的时候,这个可能会有影响. 3.磁盘满了无法启动,  var下木有空间,无法创创建PID等文件,导致文件无法启动,按e   进入single  然后b  重启进入单用户模式. 4.ssh登陆系