RAC在OCR磁盘故障且有备份时的恢复操作

问题描述:

CRS启动失败,并且RAC进程全部退出。

查看messages日志:

... ...

Apr 10 15:58:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7510.

Apr 10 15:58:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7264.

Apr 10 15:58:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7174.

Apr 10 15:59:31 node74 su: (to oracle) root on none

Apr 10 15:59:31 node74 su: (to oracle) root on none

Apr 10 15:59:31 node74 su: (to oracle) root on none

Apr 10 15:59:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7510.

Apr 10 15:59:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7174.

Apr 10 15:59:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7264.

Apr 10 16:00:26 node74 su: (to oracle) root on /dev/pts/0

Apr 10 16:00:31 node74 su: (to oracle) root on none

Apr 10 16:00:31 node74 su: (to oracle) root on none

Apr 10 16:00:31 node74 su: (to oracle) root on none

Apr 10 16:00:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7264.

Apr 10 16:00:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7510.

Apr 10 16:00:31 node74 logger: Cluster Ready Services waiting on dependencies. Diagnostics in /tmp/crsctl.7174.

... ...

取其中一个文件下来,/tmp/crsctl.7174:

Oracle Cluster Registry initialization failed with invalid format: PROC-22: The OCR backend has an invalid format

怀疑是OCR损坏。运行crsctl check boot命令,与上面的日志报错是一致的:

[email protected]:~> crsctl check boot

Oracle Cluster Registry initialization failed with invalid format: PROC-22: The OCR backend has an invalid format

问题处理:

查看是否有OCR自动备份,很不幸,没有结果输出:

[email protected]:~> ocrconfig -showbackup

---空

幸好之前做OCR迁移实验时,有做过OCR的手动备份。

node74:/home/database/oracle/oracrs/bin # ll /home/oracle/ocr.exp

-rw-r--r-- 1 root root 87246 Dec 29 16:45 /home/oracle/ocr.exp

导入之前备份的OCR:

node74:/home/database/oracle/oracrs/bin # ./ocrconfig -import /home/oracle/ocr.exp

检查OCR:

node74:/home/database/oracle/oracrs/bin # ./ocrcheck

Status of Oracle Cluster Registry is as follows :

Version                  :          2

Total space (kbytes)     :     975584

Used space (kbytes)      :       3844

Available space (kbytes) :     971740

ID                       :  811637621

Device/File Name         : /dev/raw/raw1

Device/File integrity check succeeded

Device/File not configured

Cluster registry integrity check succeeded

Logical corruption check succeeded

---修复成功

启动CRS:

node74:/home/database/oracle/oracrs/bin # /etc/init.d/init.crs start

所有RAC进程启动成功:

node74:~ # su - oracle

[email protected]:~> crs_stat -t

Name           Type           Target    State     Host

------------------------------------------------------------

ora....SM1.asm application    ONLINE    ONLINE    node74

ora....74.lsnr application    ONLINE    ONLINE    node74

ora.node74.gsd application    ONLINE    ONLINE    node74

ora.node74.ons application    ONLINE    ONLINE    node74

ora.node74.vip application    ONLINE    ONLINE    node74

ora....SM2.asm application    ONLINE    ONLINE    node76

ora....76.lsnr application    ONLINE    ONLINE    node76

ora.node76.gsd application    ONLINE    ONLINE    node76

ora.node76.ons application    ONLINE    ONLINE    node76

ora.node76.vip application    ONLINE    ONLINE    node76

ora.orcl.db    application    ONLINE    ONLINE    node74

ora....l1.inst application    ONLINE    ONLINE    node74

ora....l2.inst application    ONLINE    ONLINE    node76

--问题解决

时间: 2024-10-10 20:42:14

RAC在OCR磁盘故障且有备份时的恢复操作的相关文章

Oracle Study之--AIX RAC下OCR磁盘故障(PROT-602)

Oracle Study之--AIX RAC下OCR磁盘故障(PROT-602) ********************************************************************************  Welcome to AIX Version 5.3!                                                **                                                  

Oracle 12c RAC 替换 OCR 磁盘组操作步骤

注:本文谢绝转载! 为方便以后的测试,整了一套新的测试环境,600G PCIe 闪存卡+8核CPU+16G内存.  把整个虚拟机从我的电脑上直接copy 过去,网络什么都没问题,但是RAC 的共享设备是重新添加的. 这样之前旧的数据都不存在. 所以用脚本直接重建了OCR和Voting Disk,RAC 启动,没有问题,但是磁盘组出现错乱,Dave 有强迫症的倾向,所以重新重新添加了一个磁盘组.  把OCR 和 voting disk 都替换到新创建的OCR 磁盘组了. 所以以下所有的操作,只为一

RAC OCR盘故障导致的集群重启恢复

一.事故说明 最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功. 因此在此处进行事故重现以吸取教训. 二.重现步骤 测试RAC环境中只有+OCR和+DATA两个ASM磁盘组. 1.做好ocr的手工备份 [[email protected] ~]# ocrconfig -export /home/oracle/ocr.bak 紧急情况下没有ocr的备份也不要紧,在$CRS_H

AIX 5.3 Install Oracle 10g RAC 错误集锦--磁盘I/O 故障

AIX 5.3  Install Oracle 10g RAC 错误集锦--磁盘I/O 故障 系统环境: 操作系统: AIX 5300-09 集群软件: CRS 10.2.0.1 数据库:   Oracle 10.2.0.1                      系统架构图                                        本机采用vg 并发(VG concurrent)作为共享的存储 故障现象: . 当在第一个node(aix211)执行root.sh时,被ha

重新初始化RAC的OCR盘和Votedisk盘,修复RAC系统

假设我们的RAC环境中OCR磁盘和votedisk磁盘全部被破坏,并且都没有备份,那么我们该如何恢复我们的RAC环境.最近简单的办法就是重新初始化我们的ocr盘和votedisk盘,把集群中的所有相关资源重新注册到OCR磁盘和votedisk磁盘中. 1.停掉所有节点的Clusterware Stack [[email protected] bin]# ./crsctl stop crs Stopping resources. Successfully stopped CRS resources

RAC(11gR2) OCR BACKUP & RESTORE

首先检查下OCR盘 [[email protected]1 cdata]$ ocrcheck Status of OracleCluster Registry is as follows : Version                  :          3 Total space (kbytes)     :    262120 Used space (kbytes)      :      3068 Available space (kbytes) :     259052 ID  

Oracle Study之--Oracle 11gR2构建RAC之hosts文件故障

Oracle Study之--Oracle 11gR2构建RAC之hosts文件故障 系统环境:RedHat EL55 Oracle:    Oracle 11gR2 +GI 在安装GI,运行root.sh script时,其中一个node出现以下错误: [[email protected] ctssd]# /u01/11.2.0/grid/root.sh Running Oracle 11g root.sh script... The following environment variabl

4.10/4.11/4.12 lvm讲解 4.13 磁盘故障小案例

4.10/4.11/4.12 lvm讲解 4.13 磁盘故障小案例 4.10/4.11/4.12 lvm讲解 lvm讲解 4.10 lvm讲解上 安装下lvm 如果忘记了 lvm包 pvdisplay 查看 4.11 lvm 中 查看物理卷 除了pvdisplay命令还有一个 pvs命令也可以直观查看当前的物理卷 有了物理卷之后再来创建卷组 先用俩个物理卷创建一个卷组 vgcreate vg1 /dev/sdb1 /dev/sdb2 可以查看下卷组vgdiskplay 或者 vgs vgremo

lvm、磁盘故障

lvm讲解(上) 方便扩容和缩容磁盘空间,由于使用了lvm,如果文件系统发生损坏文件数据找不到了,要恢复数据的时候就想一下,首先硬盘划分了物理分区,物理分区的基础上划分了lvm,恢复起来麻烦,毕竟是一个软件 物理卷(磁盘分区) 卷组(上划分逻辑卷) 逻辑卷(格式化.挂载) 磁盘分区 [[email protected] ~]# fdisk /dev/sdb n创建3个新分区,分别是1G  p +1G t 改变分区类型  8e 创建物理卷 [[email protected] ~]# yum in