linux系统启动与故障排除

1、Linux系统启动过程的大致步骤与调用过程:

第一阶段:BIOS启动引导阶段,主要实现硬件的初始化以及查找启动介质,从MBR中装载启动引导管理器(GRUB)并运行该启动引导管理;

第二阶段:GRUB引导阶段,装载statge1,statge1.5,statge2,读取/boot/grub.conf文件并显示启动菜单,装载所选的kernel和initrd文件到内存中;

第三阶段:内核阶段,运行内核启动参数,解压initrd文件并挂载initrd文件系统,装载必须的驱动,挂载根文件系统;

第四阶段:Sysinit初始化阶段,启动/sbin/init/程序,运行rc.sysinit脚本,设置系统环境,启动swap分区,检查和挂载文件系统,读取/etc/inittab文件,运行/etc/rc.d/rcn.d中定义的不同运行级别的服务初始化脚本,打开字符终端1-6号控制台或者图形显示管理的7号控制台


启动阶段


读取的文件和操作的对象


BIOS启动引导阶段


None


GRUB启动引导阶段


/boot/grub/grub.conf

/boot/grub/statge1_5

/boot/grub/statge2


内核阶段


/boot/vmlinux-<version>

/boot/initrd-<version>


Sysinit初始化阶段


/etc/rc.d/rc.sysinit

/etc/inittab

/etc/rc.d/rc<n>.d

/etc/rc.d/init.d/*

2、常见的系统启动故障与排除

1)、故障一:root口令丢失

当你忘记自己的root口令时,只需要在系统启动时进入单用户模式,即系统运行的0级别下即可,这个模式下不需要root的口令即可登录,具体过程如下:

在引导等待的读秒结束前按下回车键:

然后进入BIOS模式,选择需要操作的系统(如果是多系统的话),按E进入编辑模式

选择内核编辑,在quiet后面输入1或者single,表示进入单用户模式,

然后回车返回到内核,按下B启动系统

执行runlevel,可以看到已经进入单用户模式

修改root账号的密码

或者直接删除root账号的密码

修改完成后执行init 3,进入3级别运行系统

然后登入系统执行runlevel,可以看到运行正常

2)、故障二:grub.conf文件被误删除

/boot/grub/grub.conf文件肩负着引导内核和驱动等的重要功能,如果在操作中不小心误删除了该文件,那么系统的在启动时会自动进入grub shell模式,你只能手动来引导内核和驱动了,一般情况下,该文件最好做一个备份,防止由于误操作删除引起系统无法启动,具体解决过程如下:

没有grub.conf文件时开机会进入grub shell模式:

输入help可以查看当前模式的可用命令

输入root (按下tab键可以看到帮助,由于系统尚未启动,所以默认硬盘为hd0

输入root (hd0,按下tab可以查看分区

如果不知道系统的/boot在那个分区上,可以一个一个试试,不过要注意,安装操作系统时,/boot分区肯定是ext格式的文件系统,所以这也可以作为一个区分依据

假如我输入root (hd0,1),即选择第二个分区,输入kernel / 按下tab键,会显示当前分区下的文件,由此可以发现并没有我们引导所需的内核和驱动

输入正确的/boot分区,输入kernel / ,按下tab键,选择内核(ro表示只读,root=表示把引导程序交给/dev/sdb2分区,即为原系统的/boot/分区)

输入initrd / 按下tab键,选择驱动文件

输入boot重启系统

进入系统后,查看一下grub引导文件

没有grub.conf文件,所以下次系统启动后还需要重新手动引导,我们可以自己编写一个grub.conf文件,方便系统启动时自动引导

[[email protected] ~]# vim /boot/grub/grub.conf
default=0                   #默认启动第一个系统
timeout=5                  #引导等待时间
hiddenmenu              #隐藏BIOS,需要在timeout计时结束前按下enter进入
title CentOS-6.5       #系统启动显示的标题信息
     root (hd0,0)          #指定引导分区
  kernel /vmlinuz-2.6.32-431.el6.i686 ro root=/dev/sda2  rhgb quiet
         #指定内核文件,ro表示只读,root=/dev/sda2引导完成后交给真正的系统根目录,rhgb表示引导时以进度条的方式显示引导过程,quiet表示静默启动,即不输出引导进程
  initrd /initramfs-2.6.32-431.el6.i686.img                    #指定驱动文件名称

如果在指定内核和驱动时不知道文件完整名称,可以使用vim的底行命令来调入

按住shift输入两个!!,即可以进入底行命令模式,然后输入使用ls命令显示内核文件和驱动文件即可,支持命令补全

Grub.conf文件编辑文成后,重新启动系统即可

这个即为rhgb的作用

这个是timeout指定的时间,CentOS-6.5即为title

系统正常启动

3)、故障三:GRUB引导的statge1丢失(即MBR前446字节被覆盖)

使用命令覆盖MBR引导分区的前446字节

dd if=/dev/zero of=/dev/sda bs=446 count=1

重启系统,并插入光盘

发现选项里有一个Rescure install system,这是系统的救援模式,进入救援模式

救援模式下输入chroot /mnt/sysimage,执行grub-install  /dev/sda,即可重新设置MBR

重启系统,恢复正常

4)、故障四:MBR丢失

如果只是MBR的前446字节丢失,还可以用救援模式使用grub-install重新安装,这种情况下分区表并未丢失,如果整个MBR的512字节都丢失了,也就是意味着连同分区表与引导去一块没有了,为了防止这种情况出现,要提前做好MBR的备份文件

使用命令备份MBR文件,保存在系统本地或者远程服务器上

一但这种情况发生了,那么救援模式叶无法拯救你的系统了,这时候我们需要一种光盘,名为liveCD的镜像光盘,类似于windows的PE盘,是一种移动系统,启动liveCD系统后可以救援你的硬盘上的文件资源

装上liveCD的光盘后进入BIOS,并设置光盘启动系统,F10保存退出

登入系统后切换root账号,查看/dev/sda盘的信息,发现没有分区表

登录远程服务器,拷贝mbr的备份

恢复备份文件到MBR

再次查看/dev/sda的分区情况

可以看到,MBR已经恢复,重启系统即可

5)、故障五:statge2丢失(即/boot目录下的grub目录丢失)

进入系统,删除/boot/grub

重启系统后进入grub shell模式,重复故障二的步骤,手动引导系统启动

进入系统后会,使用命令重装grub,指定路径为根目录/

查看生成的grub目录,发现没有grub.conf文件

手工创建/boot/grub/grub.conf

重启系统即可

3、总结

作为一个系统运维师,熟悉linux系统的启动过程是必需的,并且能够处理最常见的系统启动故障问题。由于没有接触过真实环境的系统启动故障 ,以上排除方法只是手动模拟出来的,所以有很多欠缺,有错误和建议请指导。

时间: 2024-08-28 11:34:30

linux系统启动与故障排除的相关文章

linux系统安装及故障排除

GUI:安装 在安装时,连按两下Esc键 可以自己定制安装 boot:在提示符下可以提供一些配置信息,自定义如何启动安装过程 boot: linux ip=192.168.1.12 netmask=255.255.255.0 gateway=192.168.1.254 dns=192.168.1.254 ks=http://192.168.1.254/centos.x86_64.cfg 最后按回车 Linux的引导选项:即boot:提示符后可以使用的选项 Kickstart 资源 选项格式 DV

记一次linux Docker网络故障排除经历

背景: 之前做了一个项目,需要在容器内访问宿主机提供的Redis 服务(这是一个比较常见的应用场景哈), 常规方案: ①   主机网络(docker run --network=host): 完全应用主机网络堆栈,在容器内localhost就是指向宿主机 ②   网桥网络(docker run --network=bridge):  这也是docker容器默认的网络通信模式,容器内localhost 指向的是容器自身,不能使用 localhost 访问宿主机上localhost:6379承载的R

Linux下的系统启动原理及故障排除

Linux下的系统启动原理及故障排除 一:实验环境 1):虚拟机 2):linux系统环境 二:实验目标 1):理解Linux启动过程详解 2):理解影响启动的配置文件 3):常见的启动故障排除 4):救援模式的使用 三:实验步骤 第一块 Linux启动过程详解 1. 加载 BIOS 的硬件信息,跟据设定取得第一个可开机引导设置,如:光驱,硬盘,网络,USB: 如果是硬盘为第一引导. 2. 读取硬盘中 MBR 的 bootLoader (亦即是 grub,Lilo 等程序): 硬盘的0柱面.0磁

Linux 系统启动故障排查和修复

我发现Linux系统在启动过程中会出现一些故障,导致系统无法正常启动,我在这里写了几个应用单用户模式.GRUB命令操作.Linux救援模式的故障修复案例帮助大家了解此类问题的解决. (一)单用户模式 Linux系统提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护.在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程运行.单用户模式可以用来修改文件系统损坏.还原配置文件.移动用户数据等. 以下列举了几个单用户模式修复系统故障的典型案例:

linux启动常见故障

Linux在启动过程中会出现一些故障,导致系统无法正常启动,本文列举了几个应用单用户模式.GRUB命令操作.Linux救援模式的典型故障修复案例帮助读者了解此类问题的解决. 一.单用户模式 Linux提供了单用户模式(类似Windows安全模式),可以在最小环境中进行系统维护.在单用户模式(运行级别1)中,Linux引导进入根shell,网络被禁用,只有少数进程运行.单用户模式可以用来修改文件系统损坏.还原配置文件.移动用户数据等. 以下列举了几个单用户模式修复系统故障的典型案例: 案例一:硬盘

Linux系统启动原理及故障排除

Linux启动过程详解影响启动的配置文件常见的启动故障排除救援模式的使用Live CD的使用 Linux启动过程详解:1:加载BIOS的硬件信息,跟据设定取得第一个可开机引导设置2:读取硬盘中MBR的bootloader<grub.....>    MBR详解        名称:主引导扇区,主引导扇区        位置:硬盘的0柱面,0磁头,1扇区        大小:磁盘默认一个扇区大小为512字节,而MBR也是1个扇区,自然是512字节        三部分组成:           

系统启动过程以及故障排除

系统的启动过程 1.加电----CMOS----post(上电自测试程序)----- grub(早期的时候使用的是lilo) Grub的第一阶段主要起到一个引导MBR中的446B.第二阶段在硬盘上,主要是一个配置. 对于任何一种操作系统,任何一台机器,刚开始的时候,肯定是要进行加电的,加完电之后在主板上有一个叫CMOS的芯片,CMOS里面有一个程序,这个程序叫post上电自测试程序.它能够对硬件来完成一些自检,比如,在机器里面内存有多大,CPU是哪一种型号的,声卡.显卡,所以这个叫上电自测试.

linux 故障排除

1 root 口令丢失解决办法 重启系统,再启动时任意键进入grub菜单,然后根据提示按e键进入编辑状态. linux 故障排除,布布扣,bubuko.com

Linux -- 常见故障排除

目前Linux的擅长应用领域是:单一应用的基础服务器应用,譬如DNS.Web服务器.NFS服务器.防火墙.文件服务器.代理服务器.中小型数据库.Linux网络故障大多与服务器配置有关.下面我们介绍一下故障排除步骤. 一. Linux网络故障之网卡故障 Linux的网络实现是模仿FreeBSD的,它支持FreeBSD的带有扩展的Sockets(套接字)和TCP/IP协议.它支持两个主机间的网络连接和Sockets通讯模型,实现了两种类型的Sockets:BSD Sockets和INET Socke