rac某节点asm磁盘启动失败故障定位及恢复

RAC环境:

oracle数据库:oracle11gr2

操作系统:rhel6.4_x86_64

故障现象:

  1、rac其一个节点的oracle与asm相关的进程和实例启动失败;

    查看方法:ps -ef|grep ora_

ps -ef|grep asm_

crsctl stat res -t (只能看到节点1上启动的oracle实例和asm实例)

  2、在节点2上查看不到asm磁盘设备标签;

    查看方法:oracleasm listdisks  (没有内容)

         ll /dev/oracleasm/disks/* (没有内容)

  3、在节点2上扫描asm磁盘时报以下错误;

    查看方法:oracleasm scandisks

Reloading disk partitions: done

Cleaning any stale ASM disks...

Scanning system for ASM disks...

Instantiating disk "VOL4"

Unable to instantiate disk "VOL4"

Instantiating disk "VOL1"

Unable to instantiate disk "VOL1"

  4、查看oracleasm日志信息提示权限问题;

    查看方法:cat /var/log/oracleasm

分析过程:

  为了排除其它因素的干扰,我重启了节点2的操作系统,重启后节点2上的asm磁盘依旧不能正常加载,通过查看oracleasm日志依然提示是权限问题,大胆猜想下,可能有以下原因导致asm

磁盘不能正常加载:

  1、asm相关的rpm包安装不正常,如版本不对应;

  2、操作系统相关的安全服务导致;

  3、系统重启时rule规则配置不正确,导致asm磁盘不能正常加载;

  排除:

  1、rpm -aq|grep oracleasm 需要安装3个包(kmod-oracleasm oracleasmlib oracleasm-support)

  2、service iptables status (iptables 服务关闭)

    getenforce  (查看状态enforcing,说明selinux服务没有关闭)

  3、本实例并没有使用raw裸设备,因此没有配置rule规则在启动时加载

  

处理方法:

  由于节点2的selinux服务没有关闭,因此关闭selinux服务

  setenforce 0

vi /etc/sysconfig/selinux

  将SELINUX=enforcing改为SELINUX=disabled,这样重启服务器则不会启动selinux服务

  关闭selinux服务后,执行asm磁盘扫描操作,正常识别asm磁盘。

oracleasm scandisks

时间: 2024-07-29 08:47:07

rac某节点asm磁盘启动失败故障定位及恢复的相关文章

网卡mtu 值不同导致rac 2节点ASM不能同时启动 ORA-27550: Target ID protocol check failed.

在安装完10205 rac 后准备配置 asm dg ,发现节点二上的ASM 没法启动: en12 为private 网卡 en13 为 public 网卡 ---->> 查看 oracle asm alert log 报错显示: LMD0 started with pid=6, OS id=565728 LMS0 started with pid=7, OS id=491812 MMAN started with pid=8, OS id=594200 DBW0 started with p

Linux下搭建Oracle11g RAC(5)----配置ASM磁盘

将共享磁盘格式化.然后用asmlib将其配置为ASM磁盘,用于将来存放OCR.Voting Disk和数据库用. 注意:只需在其中1个节点上格式化就可以,接下来我们选择在node1节点上格式化. 这里我们以asmlib软件来创建ASM磁盘,而不使用raw disk,而且从11gR2开始,OUI的图形界面已经不再支持raw disk. 格式化共享磁盘 ① 以root用户分别在两个节点上执行fdisk命令,查看现有硬盘分区信息: node1: [[email protected] ~]# fdisk

RAC数据库迁移ASM磁盘组到其它存储

环境介绍: 一共有两个磁盘组:crs和data:crs使用normal冗余:data使用外部冗余. 添加新的asm磁盘过程(略) 1.迁移前 SQL> select group_number, failgroup ,name,path from v$asm_disk order by 1 GROUP_NUMBER FAILGROUP NAME PATH ------------ ------------------------------ ----------------------------

Oracle 学习之RAC(五) 创建ASM磁盘组

以grid用户,运行asmcma命令 [[email protected] database]# su - grid 11grac1-> asmca 我们在安装Grid时已经建立了一个磁盘组,现在点击create按钮,建立其他的磁盘组 新建一个data组,磁盘为ORADATA,点击ok 再建立一个FRA的磁盘组,完成后结果如下

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败 系统环境: 操作系统: AIX 5300-09 集群软件: CRS 10.2.0.1 数据库:   Oracle 10.2.0.1                     系统架构图 故障现象: 系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE. [[email protected] racg] cat /etc/hosts 127.0.0.1              

srvctl和crs_start命令无法启动oracle RAC实例, 但sqlplus可以启动

今天遇到一个奇怪问题,发现srvctl和crs_start命令无法启动Oracle RAC实例,但用sqlplus却可以正常启动.最终发现原因是在OCR中数据库的状态变成了disable,将此状态更改为enable后恢复正常. 以下是一个模拟示例: [email protected]:~ $> crs_stat -t Name Type Target State Host ------------------------------------------------------------ o

rhel 7.0 配置ASM磁盘,使用udev绑定方法

配置ASM磁盘,并用udev绑定 最近在rhel 7.0上安装12c RAC 遇到配置ASM磁盘问题,自己改写了一个脚本,经过测试验证. 1.虚拟机需要在vmx文件中添加,才能显示UUID disk.enableUUID = "TRUE" 2.创建 /etc/udev/rules.d/99-my-asmdevices.rules 步骤1(可省略) #rm -rf /etc/udev/rules.d/99-my-asmdevices.rules 步骤2(创建文件) #for i in b

ORACLE 11G RAC ASM磁盘组全部丢失后的恢复

一.环境描述(1)Oracle 11.2.0.3 RAC ON Oracle Linux 6 x86_64,只有一个ASM外部冗余磁盘组--DATA:(2)OCR,VOTEDISK,DATAFILE,CONTROLFILE,SPFILE全部位于这个磁盘组上:二.故障描述(1)存储故障导致ASM磁盘丢失.(2)CRS因为OCR和VOTEDISK的丢失,除了OHAS还联机外,CLUSTERWARE服务都已经停止.三.备份情况(1)RMAN备份:包括controlfile,database,spfil

LINUX 11G RAC ASM磁盘组在线增加磁盘扩容

[javascript] view plain copy LINUX 11G RAC ASM磁盘组在线增加磁盘扩容 1.操作系统版本 OEL 6.1 [[email protected] ~]# more /etc/redhat-release Red Hat Enterprise Linux Server release 6.1 (Santiago) 2.数据库版本 oracle 11g rac SQL> select * from v$version; BANNER ------------