ORACLE 10G RAC 节点自动重启故障处理

将数据库集群升级到10.2.0.5之后,双节点服务器不断重启,查询oracle oprocd进程日志,信息如下:

Jul 03 08:16:34.702 | INF | monitoring started with timeout(1000), margin(500), skewTimeout(125)
Jul 03 08:16:34.704 | INF | fatal mode startup, setting process to fatal mode

可以看到看到oprocd进程的时间间隔设置为

timeout(1000), margin(500), skewTimeout(125)

查看其它的日志信息,没有发现明显的错误信息,因此怀疑是oprocd的时间参数设置不当。

修改参数如下:

#crsctl set css diagwait 13 -force

修改参数时,需要注意如下几个事项

当我们设置diagwait参数时,需要停止所有rac节点的集群活动,停止顺序如下(如果集群式活动的,修改diagwait有可能会损害ocr):

1,以root用户在所有节点执行

#crsctl stop crs
#<CRS_HOME>/bin/oprocd stop

2,确认所有节点的进程已经停止

#ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"

3,修改参数,仅仅在一个节点修改就可以了

#crsctl set css diagwait 13 -force

4,查看参数修改情况

#crsctl get css diagwait

5,启动集群节点

#crsctl start crs
#crsctl check crs

修改参数后,集群服务运行正常,没有再自动重启过。

ORACLE 10G RAC 节点自动重启故障处理,布布扣,bubuko.com

时间: 2024-10-12 22:11:14

ORACLE 10G RAC 节点自动重启故障处理的相关文章

redhat 下 oracle 10G RAC 集群 详细安装

在大家做RAC安装测试搭建环境时,没有存储环境下,我来教大家怎么采用虚拟机来安装 ORACLE 10 rac,这样可以让大家更快学习好 ORACLE 10 RAC ,我会把很详细的安装写给大家. 1.安装前的准备 准备需要软件 10201_clusterware_linux_x86_64.cpio.gz 10201_database_linux_x86_64.cpio.gz binutils-2.17.50.0.6-6.0.1.el5.x86_64.rpm oracleasm-2.6.18-16

oracle 10g RAC中DRM的理解

关于DRM的一些总结 1. 什么是DRM DRM(Dynamic Resource Management)是oracle 10g的一个新特性,在oracle rac环境中,ORACLE使用GRD(Global Resource Service)来记录各个节点的资源信息,具体是通过GCS(Global Cache Service)和GES(Global Enqueue Service)这两个服务进行管理.由于RAC中每个节点都有自己的SGA和buffer cache,为了保证所有节点cache 资

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败 系统环境: 操作系统: AIX 5300-09 集群软件: CRS 10.2.0.1 数据库:   Oracle 10.2.0.1                     系统架构图 故障现象: 系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE. [[email protected] racg] cat /etc/hosts 127.0.0.1              

oracle 10g rac 修改public ip、vip和private ip

oracle 10g rac 修改public ip.vip和private ip [TOC] 1.IP地址规划 Hostname 当前IP 修改后IP Public IP node1 192.168.56.20 192.168.100.20 Public IP node2 192.168.56.21 192.168.100.21 VIP node1-vip 192.168.56.98 192.168.100.98 VIP node2-vip 192.168.56.99 192.168.100.

RedHat EL5 安装Oracle 10g RAC之--系统环境配置(1)

RedHat EL5 安装Oracle 10g RAC之--系统环境配置(1) 系统环境: 操作系统:RedHat EL5 Cluster: Oracle CRS 10.2.0.1.0 Oracle:  Oracle 10.2.0.1.0 如图所示:RAC 系统架构 一.操作系统环境 1.网络配置(在所有节点) [[email protected] ~]# cat /etc/hosts # Do not remove the following line, or various programs

RedHat EL5 安装Oracle 10g RAC之--系统环境配置(2)

RedHat EL5 安装Oracle 10g RAC之--系统环境配置(2) 系统环境: 操作系统:RedHat EL5 Cluster: Oracle CRS 10.2.0.1.0 Oracle:  Oracle 10.2.0.1.0 如图所示:RAC 系统架构 6.通过SSH配置主机间的信任关系 node1: [[email protected] ~]$ mkdir .ssh [[email protected] ~]$ ssh-keygen -t rsa Generating publi

修改oracle 10g rac监听端口号为1523的步骤

修改oracle  10g rac监听端口号为1523的步骤 一. 修改listener.ora ,将其中的1521改为1523.事先做该文件的备份,以便快速复原 二. 修改tnsnames.ora ,将remote_listener对应的值 在 tnsnames.ora中的参数改为1523,事先做该文件的备份,以便快速复原 三. 修改local_listener数据库初始化参数 alter system set local_listener = '(ADDRESS = (PROTOCOL =

Oracle 10g RAC启动与关闭命令

一. 检查共享设备 一般情况下, 存放OCR 和 Voting Disk 的OCFS2 或者raw 都是自动启动的. 如果他们没有启动,RAC 肯定是启动不了的. 1.1 如果使用ocfs2的,检查ocfs2 状态 /etc/init.d/o2cb status 在挂载之前,/etc/init.d/o2cb status 显示为Checking O2CB heartbeat: Not active. 在格式化和挂载文件系统之前,应验证 O2CB 在两个节点上均联机:O2CB 心跳当前没有 活动,

Solaris 10(x86)构建Oracle 10g RAC之--配置系统环境(1)

系统环境: 操作系统:Solaris 10(x86-64) Cluster: Oracle CRS 10.2.0.1.0 Oracle:  Oracle 10.2.0.1.0 如图所示:RAC 系统架构 一.操作系统环境 1.网络配置(在所有节点) [[email protected]:/]# cat /etc/inet/ipnodes  # # Internet host table # ::1     localhost        127.0.0.1       localhost