Oracle RAC中的一台机器重启以后无法接入集群

前天有个同事说有套AIX RAC的其中一台服务器重启了操作系统以后,集群资源CSSD的资源一直都在START的状态,检查日志输出有如下内容:

[    CSSD][1286]clssnmvDiskVerify: Successful discovery of 0 disks

[    CSSD][1286]clssnmCompleteInitVFDiscovery: Completing initial voting file discovery

[    CSSD][1286]clssnmvFindInitialConfigs: No voting files found

[    CSSD][1286](:CSSNM00070:)clssnmCompleteInitVFDiscovery: Voting file not found. Retrying discovery in 15 seconds

[    CSSD][1029]clssscSelect: cookie accept request 111272110

[    CSSD][1029]clssscevtypSHRCON: getting client with cmproc 111272110

[    CSSD][1029]clssgmRegisterClient: proc(3/111272110), client(56/110a1a770)

从集群的日志信息可以看到,由于一直没有扫描到CRS的相关磁盘信息,最终导致异常产生。

cd /dev

ls -l

发现可以看到相关的rhdiskpower盘

lsdev -Cc disk

发现相关的盘符的状态都在defined状态,该状态标识磁盘之前被认出,但是当前不可用。由此可以判断应该是由于存储方面的原因导致RAC集群相关资源无法读取到OCR盘的内容。

存储工程师处理过程:

1、检查确认物理线路没有任何问题。

2、将在小型机上将相关认出来的盘都删除。 rmdev -Dl

3、将相关的链路都删除掉。 emcpower delete dev=all

4、重新扫描盘符。

5、根据正常的那台机器的Lun编号,调整重新扫描出来的hdiskpowerN的序号。

6、保存配置。powermt save

7、重新检查磁盘状态。lsdev -Cc dev 确保状态为可用。

处理完存储问题后,重启机器,观察集群资源状况。

Oracle RAC中的一台机器重启以后无法接入集群

时间: 2025-01-01 21:19:47

Oracle RAC中的一台机器重启以后无法接入集群的相关文章

Oracle RAC中的几个IP

oracle11g开始,设置了SCAN ip,除此之外还有public ip,virtual ip,private ip,容易让人犯晕. 下面逐一解释: public ip: 类似与单实例的oracle数据库ip,主要用于管理\访问. virtual ip(vip): oracle在rac架构中专用,这个vip用于实现故障转移,当一个节点发生故障时,其vip会"浮动"到另外一个正常的节点,也即该正常节点对应着两个vip了. SCAN: Single Client Access Name

windows 下 oracle rac 中的共享盘与磁盘的gpt分区格式

现在磁盘不值钱,因此,从存储映射给主机的一个LUN,可能很大. 最近就遇到一个问题:2个windows主机要作为rac来用,存储映射给windows 的一个disk 有10T大小.众所周知,在 windows 下 oracle   rac 中的共享盘,对应到windows 磁盘管理中的概念 是 扩展分区(extension partition )中的逻辑分区(logical partition),而 逻辑分区(logical partition) 在 gpt分区格式下是不能建立的.并且,对该10

集群中配置多台机器之间 SSH 免密码登录

集群中配置多台机器之间 SSH 免密码登录 问题描述 由于现在项目大多数由传统的单台机器部署,慢慢转变成多机器的集群化部署. 但是,这就涉及到机器间的 SSH 免密码互通问题. 当集群机器比较多的时候,如何能快速简洁地配置机器之间的免密码登录呢? 完美方案 1.分别查看集群的机器上,是否安装了 SSH,并且服务正常运行 ps -ef | grep ssh 2.如果步骤 1 检查后,确认没有安装 SSH,可以通过如下命令安装 SSH sudo apt-get install ssh 找到隐藏目录.

CentOS-6.4-minimal版中Apache-2.2.29与Tomcat-6.0.41实现集群

/** * CentOS-6.4-minimal版中Apache-2.2.29与Tomcat-6.0.41实现集群 * ---------------------------------------------------------------------------------------------------------------------- * 本文建立在Apache-2.2.29与Tomcat-6.0.41实现负载均衡的基础上,实现过程详见http://blog.csdn.net

Oracle RAC中的投票算法

RAC集群中有三台机器,A,B,C A,B,C都会有3票,假设这是A的心跳线出现问题,整个RAC集群就划分为两个paritition, 一个是只有A的partition,一个是B,C组成的partition, 两个partition都想以为对方出问题,自己需要接管业务,如果没有投票算法就会导致两个partition同时操作数据库(共享存储)的情况,注意,这里的数据库不是我们通常说的数据库,因为在RAC集群中,数据文件,配置文件,日志文件是放在后端的共享存储上的,RAC集群中的多个节点所共享. 话

万台规模下的SDN控制器集群部署实践

目前在网络世界里,云计算.虚拟化.SDN.NFV这些话题都非常热.今天借这个机会我跟大家一起来一场SDN的深度之旅,从概念一直到实践一直到一些具体的技术. 本次分享分为三个主要部分: SDN & NFV的背景介绍 SDN部署的实际案例 SDN控制器的集群部署方案 我们首先看一下SDN.其实SDN这个东西已经有好几年了,它强调的是什么?控制平面和数据平面分离,中间是由OpenFlow交换机组成的控制器,再往上就是运行在SDN之上的服务或者是应用.这里强调两个,控制器和交换机的接口——我们叫做南向接

服务器要高防就选【韩国KA高防机房】多台金盾万兆NP防火墙集群,免备案,再也不用担心被打死!

在这个恶意竞争的社会,你还在担心服务器被攻击吗?还在担心服务器被打死吗?告诉你使用韩国KA高防服务器,再也不用担心服务器被打死了.韩国KA服务器可提供单防100G(100G UDP+10G TCP),多台金盾万兆NP企业级硬件防火墙集群,单机承诺10G/30G硬防,超出防御自动屏蔽IP,攻击过去立即解封. 韩国KA机房: 单机10G防御区 至强E3-1230 4G  500G 10Mbps 独立IP  月付1699元 至强E3-1230 8G  500G 10Mbps 独立IP  月付1999元

Oracle RAC中su: ​无法设置用户ID: 资源暂时不可用

su: 无法设置用户ID: 资源暂时不可用 问题现象: 问题原因: 问题是出在:在/etc/security/limits.d目录下,rhel6和centos6下面多了个文件:90-nproc.config,以保证root用户无限制.此配置会覆盖主配置文件的设定.内容如下: 解决方法: 删除/etc/security/limits.d/90-nproc.conf 文件中1024那一行,或者将1024值改大,保存退出,立即生效!

oracle云计算及大型数据库集群系统架构

数据库集群技术是将多台服务器联合起来组成集群来实现综合性能优于单个大型服务器的技术,这种技术不但能满足应用的需要,而且大幅度的节约了投资成本.数据库集群技术分属两类体系:基于数据库引擎的集群技术和基于数据库网关(中间件)的集群技术. 在数据库集群产品方面,其中主要包括基于数据库引擎的集群技术的Oracle RAC.Microsoft MSCS.IBM DB2 UDB.Sybase ASE,以及基于数据库网关(中间件)的集群技术的ICX-UDS等产品. 1为什么搭建数据库集群 随着经济的高速发展,