linux服务器磁盘坏道的发现及解决全过程

服务器的磁盘也没有做监控,其实我也不知道如何对磁盘的状态做监控,突然查看不到新数据,上去看了一下磁盘的情况,发现磁盘出现只读的情况,无法写入数据,要是大家谁知道怎么可以监控磁盘只读的方法,可以告诉我下,来个高达上一些的。

一、处理过程

1、磁盘坏道检查

出现问题之后,首先把业务停掉了,然后把磁盘卸载掉来进行修复,出现这种问题有可能是磁盘的磁道有坏区,我首先检查了一下磁盘坏道的情况。

badblocks -sv /dev/sdb

差不多检查了一些时间,发现并没有坏道。

2、修复磁盘文件系统

在修复文件系统的时候发现无法修复,提示Superblock invalid。

[[email protected] ~]# fsck -t ext4 /dev/sdb
fsck from util-linux-ng 2.17.2
e2fsck 1.41.12 (17-May-2010)
fsck.ext4: Superblock invalid, trying backup blocks...
fsck.ext4: Bad magic number in super-block while trying to open /dev/sdb
The superblock could not be read or does not describe a correct ext2
filesystem.  If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock:
    e2fsck -b 8193 <device>

3、查看文件系统备份Superblock

[[email protected] ~]# mke2fs -n /dev/sdb         
mke2fs 1.41.12 (17-May-2010)
/dev/sdb is entire device, not just one partition!
Proceed anyway? (y,n) y
Filesystem label=
OS type: Linux
Block size=4096 (log=2)
Fragment size=4096 (log=2)
Stride=1 blocks, Stripe width=0 blocks
122093568 inodes, 488364854 blocks
24418242 blocks (5.00%) reserved for the super user
First data block=0
Maximum filesystem blocks=4294967296
14904 block groups
32768 blocks per group, 32768 fragments per group
8192 inodes per group
Superblock backups stored on blocks: 
        32768, 98304, 163840, 229376, 294912, 819200, 884736, 1605632, 2654208, 
        4096000, 7962624, 11239424, 20480000, 23887872, 71663616, 78675968, 
        102400000, 214990848

4、修复文件系统

e2fsck -b 214990848 -y /dev/sdb

出现了很多修复的东西,修复了一会

修复好之后,挂载进去目录查看如下

好歹只是丢失了文件夹的名称,剩下的回复交由DBA来进行操作。

时间: 2024-10-16 10:16:40

linux服务器磁盘坏道的发现及解决全过程的相关文章

磁盘坏道的处理

在前面,我有写到使用badblocks检查坏道. 因为badblocks只是检测坏道,然后在日志文件中标记出坏道的信息,并不会对坏道进行处理,如果希望在检测磁盘时也能跳过这些坏块不检测,可以使用fsck的-l参数. badblocks -b 4096 -c 16 /dev/sda1 -o sda-badblocks-list 使用这个对坏掉进行检查,并保存在sda-badblocks-list中 fsck.ext4 -l /tmp/sd-badblock-list.final /dev/sda1

Linux服务器磁盘满了如何处理

在我们日常工作中,服务器磁盘满了是一个常见的问题,那么我们如何有逻辑的有方法的去处理这件事儿呢?首先当我们服务器磁盘满了我们一般想到到的就是把比较大的而且不重要的文件删除,从而释放空间,在此之前我们必须要明白一件事情,那就是一个文件被彻底删除需要满足的条件:一是这个文件的硬链接数为0二是进程占用数为0好了废话不多说我们来看一看一个案例把!可以看到我在向文件里边追加数据的时候告诉我没有可用的空间了这时候我们用df命令查看一下剩余的空间:我们发现根空间的使用率已经是百分之百了,这时候我们使用du -

Linux服务器磁盘扩展和oracle表空间文件迁移操作记录

1.环境介绍 服务器硬件:Dell R710 服务器OS:红帽子Linux   RHEL4.8 数据库:Oracle 10g 2.出现的问题 因为数据表每天有上百万的数据写入表,加上建立索引,导致表空间不停增长,表空间被设置为自动增长,因此dbf文件在不断增大,硬盘空间在每天约400M的速度减少.数据库虽有自清理的脚本,清理3个月前的数据,但实际增加的数据太多,清理释放的空间不能满足需求了. 3.处理过程 解决思路是,该服务器的硬盘有预留空间,未完全划分的约有100G,可以建立新的分区,将已经存

Linux服务器磁盘占满问题解决

今天下班某电商技术部leader发现个问题,说他们服务器硬盘满了.把日志文件都删掉了,可硬盘空间依旧满.于是df -h查看了下各个挂载点的状况(如下图). /dev/sda3占用了100%,那么我们du -s -h ./*看下目录的占用情况(如下图). linux磁盘挂载点目录占用情况(图) 挂载点下的目录之和远小于4.5G,那么是什么占用了硬盘呢? 以下为该问题的解答: 在apache/tomcat服务在运行状态下,清空了运行服务的日志,从而导致了/dev/sda3 满了的问题.一般情况下,大

linux服务器 磁盘和文件系统管理(一)

本系统为红帽6.5企业版 一.管理磁盘及分区 1.检测并确认新硬盘 说明: Device:分区的设备文件名称 Boot:是否为引导分区,有"*"标记的表示为引导分区 Start:该分区在硬盘中的起始位置 Eed:该分区在硬盘中的结束位置 Blocks:分区的大小,以Blocks(块)为单位,默认的块大小为1024字节 Id:分区对应的系统ID号,83表示EXT4分区.8e表示LVM逻辑卷 System:分区类型 2.对新的硬盘进行管理 在硬盘设备中创建.删除.更改和保存分区等操作需要使

阿里 Linux服务器外网无法连接MySQL解决方法

我的服务器买的是阿里云ECS linux系统.为了更好的操作数据库,我希望可以用navicat for mysql管理我的数据库. 当我按照正常的模式去链接mysql的时候, 报错提示: 2003- Can't connect MySQL Server on 'x.x.x.x'(10038) 于是,通过查找资料,我找到了解决的方法,其实是阿里云服务器为了安全默认不允许从外面链接Mysql数据库. 下面是解决整理的三种解决的方法: 第一种.监听地址配置错误解决方法: 检查mysql服务端口(默认为

linux服务器磁盘扩容的方法

1.系统环境如下图: 2.为该系统添加一块新的虚拟硬盘,添加后需重启虚拟机,否则系统不识别:如下图,/dev/sdc 是新添加的硬盘: 3.fdisk /dev/sdc为新硬盘创建分区: 4.Linux允许的主分区为4个,则我们创建分区为 /dev/sdc15.默认情况下新建分区的格式为Linux,我们使用LVM动态添加磁盘空间,故需要修改 /dev/sdc1 分区格式为LVM,LVM格式id为8e;6.创建并修改成功后需格式化该分区:mkfs.ext3  /dev/sdc17.执行完成进入/e

linux服务器 磁盘和文件系统管理(二) LVM逻辑卷管理的基本操作

上一章我们说完了硬盘的分区.格式化与挂载分区,用是可以正常使用了,但是一旦出现系统分区不够用了,我们不得不备份.删除相关数据或者重新规划分区来满足系统的需要,那么如何才能解决这类的问题呢?这就可以用到我们标题中所提到的LVM动态分区,所谓LVM,它功能就是可以在现有数据不变的情况下动态调整磁盘容量,从而提高磁盘管理的灵活性 在进行LVM逻辑卷管理之前,我们需要先了解下LVM的几个基本术语: PV(Physical Volume,物理卷)物理卷是LVM机制的基本存储设备,通常对应一个普通分区或整个

linux服务器磁盘陈列

服务器为惠普的DL380服务器 一.进入设置界面 1.在惠普启动界面提示"按任意键进入..."之后,那么按任意键吧. 2.出现红色字样"Smart Array"之后会提示按"F8"进入.(这是第二个F8提示)不过,如果陈列出现问题,会提示"F1","F2"选项,选默认的"F1"进入查看. 下面具体步骤引用一个比较接近的文章吧: http://server.it168.com/a2011/