数据库服务器事故总结

数据库服务器事故总结。

宕机时间:20140107-20140111

事故起因:开发人员报告数据库服务器只能可读状态。登录服务器后发现只能可读。运行dmesg | grep error,发现有坏道,以为是系统问题,于是让IDC重启,这里操作不严谨,因为当时的主硬盘上是可读的并且备份硬盘上是可写的,安全的做法应该是把数据库本机备份一次,异地备份一次,然后再重启,下次应该注意。

重启后IDC回报系统卡在报错中断界面(无法加载/dev/root,/dev等)。IDC说他们无法解决,这是台数据库服务器,我决定开车到机房取回广州公司处理。我相信能从网络上找到参考资料去解决这个问题,因此我让小汪事先准备:1、网上资料;2、centos 5.5x32安装U盘。

取回机器后,从上面卸下备份硬盘插上外置硬盘盒,发现可读,心中稍感安慰,这也反映出备份的重要性。主硬盘是两块146Gsas硬盘做raid1,理论上单独一块坏了,另外一块可以独立接管工作的,奇怪的是:两块硬盘单独工作时,HDD0这块提示没有操作系统,HH1这块就是卡在报错中断界面。

经过资料搜集后,处理过程如下:

原理:Linux下普遍采用的是ext3文件系统,ext3是一个具有日志记录功能的日志文件系统,可以进行简单的容错和恢复,但是在一个高负荷读写的ext3文件系统下,如果突然发生掉电,就很有可能发生文件系统内部结构不一致,导致文件系统破坏。Linux在启动时,会自动去分析和检查系统分区,如果发现文件系统有简单的错误,会自动修复,如果文件系统破坏比较严重,系统无法完成修复时,系统就会自动进入单用户模式下或者出现一个交互界面,提示用户介入手动修复。

处理:从U盘启动centos 5.5x32,输入:linux resuce,进入修复模式。

1:查看是否检查到旧的硬盘 fdisk -l

2:扫描所有的卷组 vgscan

3:激活此卷 vgchange -ay /dev/卷名

4:挂载该卷。

5:mkfs.ext3 -n /dev/卷名 打印出超级块的位置,注意,一定要使用‘-n‘作为参数模拟 ext3 文件系统的创建而不是真的创建 ext3 文件系统。

6:fsck.ext3 -b -y 32768 /dev/卷名 使用备份的超级块来修复 ext3 文件系统。备注:如果这个超级块也有问题,那么可以尝试后面的几个超级块来修复。

7:重启后,会提示文件系统错误,这是只需要ctrl+D,进入单用户模式,卸载了出问题的那个卷,运行:fsck.ext3 -y /dev/卷名,则可解决问题。

时间: 2024-08-24 07:11:52

数据库服务器事故总结的相关文章

检查mysql主从同步结构中的从数据库服务器的状态-脚本shell

检查mysql主从同步结构(一主一从)中的从数据库服务器的状态          (ip授权.从服务器和IO是否正常.从mysql进程是否正常) 主mysql: 192.168.1.10 从mysql: 192.168.1.20 [[email protected] ~]# vi check_slave.sh #!/bin/bash master=192.168.1.10 i=1 service mysqld status &>/dev/null while [ true ] do echo

用MyEclipse10.0远程连接Mysql数据库服务器

说明:本文档所有的操作均在满足以下条件的情况下操作, A.远程Linux服务器已经安装好MySQL数据库 B.本地电脑可以ping通远程服务器 C.已经成功安装了Myeclipse 一.下载mysql-connector-java-3.1.14-bin.jar 这个是连接mysql数据库的驱动器. 下载地址: http://dev.mysql.com/downloads/connector/j/5.0.html 也可以到官方网站下载,网址如下:www.mysql.com 二.在Myeclipse

MySQL数据库服务器搭建及基本管理

1.安装MySQL数据库 从官网下载RPM包:http://dev.mysql.com/downloads/mysql/ 选择适用于当前系统的bundle集合包 [[email protected] 桌面]# tar -vxf MySQL-5.6.15-1.el6.x86_64.rpm-bundle.tar -C /opt/mysql/ MySQL-shared-5.6.15-1.el6.x86_64.rpm   //共享库 MySQL-devel-5.6.15-1.el6.x86_64.rpm

简单说说THP——记一次数据库服务器阻塞的问题解决

背景:公司某个大型业务系统反馈最近数据库服务器总是宕机(此处描述不准确,后面解释),最后,客户.运维人员都觉得实在是忍无可忍了,项目经理打电话找到我问是否能帮忙诊断一下,刚好第二天要去现场沟通另外一个系统的测试需求,于是答应第二天顺便看一下.------------------------------------ 排查解决过程:第二天来到现场,正在沟通需求的时候,运维人员突然说,操作又开始卡了,于是连上服务器,先用top大概看了一下资源的使用情况,此时CPU已经基本上满载了,而且可以发现用户态的

MySQL数据库服务器 主从配置

A B 为两台 MySQL 服务器,均开启二进制日志,数据库版本 MySQL 5.5 一.服务器参数 [A 服务器 192.168.1.100] server-id = 1 binlog-do-db = test binlog-ignore-db = mysql replicate-do-db = test replicate-ignore-db = mysql sync-binlog = 1 [B 服务器 192.168.1.101] server-id = 2 binlog-do-db =

企业云桌面-06-安装数据库服务器Sql Server 2012 With SP1

作者:学 无 止 境 QQ交流群:454544014 注意: <企业云桌面>系列博文是<企业云桌面规划.部署与运维实践指南>的基础部分,因为书中内容涉及非常多,非常全面,所以基础部分将以博文的形式给读者展现,将在书中引用. <企业云桌面规划.部署与运维实践指南>将以某社保中心云桌面为中心,采用VMware Workstation Pro 12.5.2在1台物理机上模拟.读者按书中的步骤一步一步去做,就可以实现.     1. 基本设置 1.1. 服务器基本配置 编号 项

查看oracle数据库服务器的名字

原文:查看oracle数据库服务器的名字 windows 中 1. select name from v$database ; 直接运行就可以查看了, 2.查看tnsnames.ora 的连接,有个SID,SID就是服务名了 1.查看oracle的安装目录,方法是查看注册表:如:HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\ORACLE_HOME REG_SZ E:\ORACLE\ORA92 得到了oracle的安装目录一般来讲,如果服务器在安装时采用的是默认值那么这个值

mysql数据库服务器的调整

前天给客户做一次数据库服务器的调整,把以前的一台主机废弃,一台从库提升为主,然后新加入其他从机,这里记录下操作步骤: 一.老主库开启只读,以便后面步骤出问题回滚回来:flush tables with read lock 二.110.10.1.102升级为主库,暂停同步,重置为主,清理中继信息,重启数据库 stop slave , reset master , mv master.info relay.log /tmp 修改配置文件my.cnf 加入expire_logs_days=15和inn

oracle实例,数据库,服务器区别

实例(instance) 实例是一个非固定的,基于内存的基本进程与内存结构.当服务器关闭时,实例就不存在了. 数据库(DataBase) 数据库指固定的,基于磁盘的数据文件,控制文件,日志文件,参数文件,归档日志文件.一般情况下一个数据库包含一个实例. 数据库服务器(database server) 数据库服务器一般指数据库各软件部分(sqlplus,exp/imp,oem),实例,数据库三部分.是由安装在服务器上的所有软件及服务启动成功后的实例组成的. oracle实例,数据库,服务器区别,布