rac某节点asm磁盘启动失败故障定位及恢复

RAC环境：

oracle数据库：oracle11gr2

操作系统：rhel6.4_x86_64

故障现象：

　　1、rac其一个节点的oracle与asm相关的进程和实例启动失败；

　　　　查看方法：ps -ef|grep ora_

ps -ef|grep asm_

crsctl stat res -t　（只能看到节点1上启动的oracle实例和asm实例）

　　2、在节点2上查看不到asm磁盘设备标签；

　　　　查看方法：oracleasm listdisks （没有内容）

　　　　　　　　　ll /dev/oracleasm/disks/*　（没有内容）

　　3、在节点2上扫描asm磁盘时报以下错误；

　　　　查看方法：oracleasm scandisks

Reloading disk partitions: done

Cleaning any stale ASM disks...

Scanning system for ASM disks...

Instantiating disk "VOL4"

Unable to instantiate disk "VOL4"

Instantiating disk "VOL1"

Unable to instantiate disk "VOL1"

　　4、查看oracleasm日志信息提示权限问题；

　　　　查看方法：cat /var/log/oracleasm

分析过程：

　　为了排除其它因素的干扰，我重启了节点2的操作系统，重启后节点2上的asm磁盘依旧不能正常加载，通过查看oracleasm日志依然提示是权限问题，大胆猜想下，可能有以下原因导致asm

磁盘不能正常加载：

　　1、asm相关的rpm包安装不正常，如版本不对应；

　　2、操作系统相关的安全服务导致；

　　3、系统重启时rule规则配置不正确，导致asm磁盘不能正常加载；

　　排除：

　　1、rpm -aq|grep oracleasm　需要安装3个包（kmod-oracleasm oracleasmlib oracleasm-support）

　　2、service iptables status　（iptables 服务关闭）

　　　 getenforce （查看状态enforcing，说明selinux服务没有关闭）

　　3、本实例并没有使用raw裸设备，因此没有配置rule规则在启动时加载

处理方法：

　　由于节点2的selinux服务没有关闭，因此关闭selinux服务

　　setenforce 0

vi /etc/sysconfig/selinux

　　将SELINUX=enforcing改为SELINUX=disabled，这样重启服务器则不会启动selinux服务

　　关闭selinux服务后，执行asm磁盘扫描操作，正常识别asm磁盘。

oracleasm scandisks

时间： 2024-07-29 08:47:07

rac某节点asm磁盘启动失败故障定位及恢复的相关文章

网卡mtu 值不同导致rac 2节点ASM不能同时启动 ORA-27550: Target ID protocol check failed.

在安装完10205 rac 后准备配置 asm dg ,发现节点二上的ASM 没法启动: en12 为private 网卡 en13 为 public 网卡 ---->> 查看 oracle asm alert log 报错显示: LMD0 started with pid=6, OS id=565728 LMS0 started with pid=7, OS id=491812 MMAN started with pid=8, OS id=594200 DBW0 started with p

Linux下搭建Oracle11g RAC(5)----配置ASM磁盘

将共享磁盘格式化.然后用asmlib将其配置为ASM磁盘,用于将来存放OCR.Voting Disk和数据库用. 注意:只需在其中1个节点上格式化就可以,接下来我们选择在node1节点上格式化. 这里我们以asmlib软件来创建ASM磁盘,而不使用raw disk,而且从11gR2开始,OUI的图形界面已经不再支持raw disk. 格式化共享磁盘 ① 以root用户分别在两个节点上执行fdisk命令,查看现有硬盘分区信息: node1: [[email protected] ~]# fdisk

RAC数据库迁移ASM磁盘组到其它存储

环境介绍: 一共有两个磁盘组:crs和data:crs使用normal冗余:data使用外部冗余. 添加新的asm磁盘过程(略) 1.迁移前 SQL> select group_number, failgroup ,name,path from v$asm_disk order by 1 GROUP_NUMBER FAILGROUP NAME PATH ------------ ------------------------------ ----------------------------

Oracle 学习之RAC(五) 创建ASM磁盘组

以grid用户,运行asmcma命令 [[email protected] database]# su - grid 11grac1-> asmca 我们在安装Grid时已经建立了一个磁盘组,现在点击create按钮,建立其他的磁盘组新建一个data组,磁盘为ORADATA,点击ok 再建立一个FRA的磁盘组,完成后结果如下

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败系统环境: 操作系统: AIX 5300-09 集群软件: CRS 10.2.0.1 数据库: Oracle 10.2.0.1 系统架构图故障现象: 系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE. [[email protected] racg] cat /etc/hosts 127.0.0.1

srvctl和crs_start命令无法启动oracle RAC实例, 但sqlplus可以启动

今天遇到一个奇怪问题,发现srvctl和crs_start命令无法启动Oracle RAC实例,但用sqlplus却可以正常启动.最终发现原因是在OCR中数据库的状态变成了disable,将此状态更改为enable后恢复正常. 以下是一个模拟示例: [email protected]:~ $> crs_stat -t Name Type Target State Host ------------------------------------------------------------ o

rhel 7.0 配置ASM磁盘，使用udev绑定方法

配置ASM磁盘,并用udev绑定最近在rhel 7.0上安装12c RAC 遇到配置ASM磁盘问题,自己改写了一个脚本,经过测试验证. 1.虚拟机需要在vmx文件中添加,才能显示UUID disk.enableUUID = "TRUE" 2.创建 /etc/udev/rules.d/99-my-asmdevices.rules 步骤1(可省略) #rm -rf /etc/udev/rules.d/99-my-asmdevices.rules 步骤2(创建文件) #for i in b

ORACLE 11G RAC ASM磁盘组全部丢失后的恢复

一.环境描述(1)Oracle 11.2.0.3 RAC ON Oracle Linux 6 x86_64,只有一个ASM外部冗余磁盘组--DATA:(2)OCR,VOTEDISK,DATAFILE,CONTROLFILE,SPFILE全部位于这个磁盘组上:二.故障描述(1)存储故障导致ASM磁盘丢失.(2)CRS因为OCR和VOTEDISK的丢失,除了OHAS还联机外,CLUSTERWARE服务都已经停止.三.备份情况(1)RMAN备份:包括controlfile,database,spfil

LINUX 11G RAC ASM磁盘组在线增加磁盘扩容

[javascript] view plain copy LINUX 11G RAC ASM磁盘组在线增加磁盘扩容 1.操作系统版本 OEL 6.1 [[email protected] ~]# more /etc/redhat-release Red Hat Enterprise Linux Server release 6.1 (Santiago) 2.数据库版本 oracle 11g rac SQL> select * from v$version; BANNER ------------