oracle rac 常见安装、管理错误

1. 安装CRS失败,或执行root.sh报错,可能原因:

  (1) 节点间的时间不同步,解决方法:使用ntp服务

  (2) Linux下启用了默认的防火墙,导致执行root.sh报错:

  Failure at final check of Oracle CRS stack.

  10

  解决方法:禁用iptables ,注释/etc/pam.d/other ;

  # service iptables stop; # chkconfig iptables off.

  (3) 裸设备的权限问题,可能因为操作系统重新启动后权限发生变化。(RHEL4)

  解决方法: 把 chown oracle:dba /dev/raw/raw* 命令加入到/etc/rc.local中,每次开机自动执行

  或者修改文件/etc/udev/permissions.d/50-udev.permissions

  第113行raw/*:root:disk:0660 改成 raw/*:oracle:dba:0660

  (4) Solaris使用了包括cylinder 0的磁盘分区来存储OCR或者vote disk。

  解决办法:相关分区不应该包括cylinder 0,可以从1开始。

  (5) 使用的公网IP地址不可路由,

  解决方法:添加相关网关

  (6) 在/etc/hosts 中没有loopback地址,即127.0.0.1 localhost

  (7) 主机名含有大些字母、减号或者下划线等特殊字符;

  (8) HPUX中oracle不要使用gnu的bash,修改使用默认shell;

  (9) 检查操作系统、第三方集群是否是oracle官方支持的,是否需要补丁,比如在AIX5.3+HACMP上安装

  Oracle 10g/11g RAC,oslevel就需要06及以上;

  (10) AIX平台,需要将共享设备的reserve_policy (reserve_lock) 属性修改为no_reserve(no);

  (11) 所有节点看到的OCR和vote设备的路径名应该一致,如果不一致,可以用软连接解决;

  (12) 心跳设备问题或者ocr/votedisk 访问问题,unix/linux查看有无/tmp/crsctl.*文件,得到错误信息;

  (13) 在CRS旧的安装的环境中重新安装失败

  解决方法: dd清除ocr和vote disk,并使用下面语句清理旧的crs配置文件

  rm -rf /usr/tmp/.oracle /var/tmp/.oracle /tmp/.oracle /etc/oracle/* /var/opt/oracle/*

  rm -rf /etc/init.cssd /etc/init.crs* /etc/init.evmd /etc/init.d/init.cssd /etc/init.d/init.crs

  rm -rf /etc/init.d/init.crsd /etc/init.d/init.evmd /etc/rc3.d/K96init.crs /etc/rc3.d/S96init.crs

  rm -rf /etc/rc.d/rc2.d/K96init.crs /etc/rc.d/rc2.d/S96init.crs

  2 客户端有时候报错:

  ORA-12545: Connect failed because target host or object does not exist

  ORA-12545: 因目标主机或对象不存在, 连接失败

  解决方法:设置local_listener初始化参数

  3 如果选择节点界面出不来。

  (1)HACMP环境中需要检查oracle 用户必须在 hagsuser组里.

  (2)如果是hacmp5.4,需要打Oracle补丁6718715;

  (3)可以使用集群配置文件cluster CONFIGURATION FILE ,内容模板如下:

  MyCluster

  rac01 rac01-priv rac01-vip

  rac02 rac02-priv rac02-vip

  rac03 rac03-priv rac03-vip

  rac04 rac04-priv rac04-vip

  4. AIX上数据库启动报错

  ora-27504 IPC error creating OSD context

  ora-27300 OS system dependent operation:sendmsg failed with status:59

  ora-27301 OS failure message:Message too long

  ora-27302 failure occurred at:sskgxpsnd1

  原因:没有设置网络参数udp_recvspace/udp_sendspace

  5. Windows平台,ORA-600 [kccsbck_first]

  解决方法:关闭Media Sense(媒体感知)

  6. 系统循环重启:

  可能是CRS导致,如果因为crs,首先设置 crsctl disable crs 来禁止oracle crs的自动启动。

  查看OS、crsd和cssd的对应日志,看/tmp/下是否有crs文件 (ls -lrt /tmp/crsctl*),确定crs失败原因。

  7. 第二个节点的数据实例无法mount,挂起或者报错,

  原因1:使用了vendor clusterware ,libskgxn2.so文件链接错误,

  解决方法:比较两个节点的ORACLE_HOME/lib/libskgxn2和CRS_HOME/lib/libskgxn2*都是否相同,

  如果不同需要重新link

  原因2:任何平台Oracle 9i,没有设置网络参数udp参数

  导致udp_sendspace或者udp_recvspace小于 db_block_size * db_file_multiblock_read_count

  解决方法:设置对应参数,如AIX上设置udp_recvspace = 65536 udp_sendspace = 65536

  原因3:AIX/HACMP/Oracle9i,在hacmp中定义了service IP

  解决方法:在初始化参数中定义cluster_interconnects

  原因4:任何平台,设置了错误的cluster_interconnects

  解决方法:检查并纠正此参数,

  8. 建库时不能识别裸设备;

  原因1:Oracle,10.2.0.3 ,很多平台(比如aix和linux)有rawutl相关bug,

  解决办法:还原10.2.0.1中的rawutl工具,该程序在 $ORACLE_HOME/bin目录中。

  原因2:Oracle9i,AIX平台,需要设置环境变量export PGSD_SUBSYS=grpsvcs

  9. evm资源自动报错oac_init:2: Could not connect to server, clsc retcode = 9

  解决方法:关闭 “UDP ICMP rejections”

  /etc/rc.d/init.d/iptables stop ;chkconfig iptables off

oracle rac 常见安装、管理错误

时间: 2024-10-13 10:42:51

oracle rac 常见安装、管理错误的相关文章

oracle rac存储安装

oracle rac 10.2 的在 linux 上的存储选项 博客分类: Oracle OracleLinux项目管理配置管理 Oracle 集群需要存储的软件和数据 项目 内容 最少磁盘空间 Clusterware 软件 集群软件 500M(安装完成后不变) voting disk(表决磁盘) 记录集群节点信息 20M OCR(Oracle 集群注册) 存储集群配置信息 100M Oracle 数据库软件 数据库软件 1.3G(安装完成后不变) RAC 数据库 存储所有数据库文件 1.2G(

Oracle RAC OCR 的管理与维护

OCR相当于Windows的注册表.对于Windows而言,所有的软件信息,用户,配置,安全等等统统都放到注册表里边.而集群呢,同样如此,所有和集群相关的资源,配置,节点,RAC数据库统统都放在这个仓库里.如果OCR被破坏则导致集群服务启动异常,需要修复OCR.因此OCR的管理与维护对于整个集群而言,是相当重要的.本文主要描述了Oracle 10g RAC下的OCR的管理与维护. [python] view plain copy print? 1.环境 [email protected]:~> 

Oracle RAC OCR 的备份与恢复

Oracle Clusterware把整个集群的配置信息放在共享存储上,这些信息包括了集群节点的列表.集群数据库实例到节点的映射以及CRS应用程序资源信息.也即是存放在ocr 磁盘(或者ocfs文件)上.因此对于这个配置文件的重要性是不言而喻的.任意使得ocr配置发生变化的操作在操作之间或之后都建议立即备份ocr.本文主要基于Oracle 10g RAC环境描述OCR的备份与恢复.        OCR 相关参考:        Oracle RAC OCR 与健忘症        Oracle

Oracle Rac 11.2.0.3迁移OCR和VOTEDISK

环境:AIX7.1+Oracle Rac 11.2.0.3 迁移描述:今天在装Oracle Rac的时候,错误的将500G的数据盘用作OCRDG了,遂后续比较麻烦,只能讲ocr和votedisk迁移到新建的OCRDG上,并把DATADG删除并格式化该盘.(OCRDG为normal 冗余) 操作如下: [email protected]:/home/grid>/oraapp/grid/gridhome/bin/ocrcheck Status of Oracle Cluster Registry i

Oracle RAC 环境下的连接管理(转) --- 防止原文连接失效

崔华老师的文章!!! 这篇文章详细介绍了Oracle RAC环境下的连接管理,分别介绍了什么是 Connect Time Load Balancing.Runtime Connection Load Balancing.Connect Time Connection Failover 和 Runtime Connection Failover,以及里面所涉及到的 TAF.ONS.FCF.FAN.LBA 等诸多知识点.本文主要是针对 Oracle RAC 11gR2 环境下的连接管理,但同时也会对

【Oracle 集群】Linux下Oracle RAC集群搭建之Oracle DataBase安装(八)

Oracle 11G RAC数据库安装(八) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总.然后形成体系的总结,一则进行回顾复习,另则便于查询使用.本图文文档亦源于此.阅读Oracle RAC安装与使用教程前,笔者先对这篇文章整体构思和形成进行梳理.由于阅读者知识储备层次不同,我将从Oracle RAC安装前的准备与规划开始进行整体介绍安装部署Oracle RAC.始于唐博士指导,对数据库集群进行

Oracle 启动常见的疑难及安装卸载

转一位大神的笔记. 实例和数据库的启动与关闭是DBA的重要职责之一.只有打开数据库,其他用户才能对数据库中的数据进行操作.一旦数据库关闭,便不能对其操作.对于DBA们来说,关闭和重新启动数据库以便优化.调整应用程序的运行是经常碰到的事情.如果用户已经进入了数据库,使用SHUTDOWN IMMEDIATE 或SHUTDOWN ABORT命令来执行关闭数据库,则用户将失去连接,直到数据库重新启动.经常关闭和启动会对数据库性能造成一定的影响,当然也会影响到用户对数据库的使用.本文从管理数据库的角度来分

Oracle RAC集群安装

安装企业版Oracle数据库需要安装两部分:Oracle RAC, Oracle Database. Oracle RAC原理请参考这篇文章.本篇原创介绍的是RAC 安装的实操部分,数据库的安装部分请参考这篇文章. 以Oracle 12C为例. Oracle官方网站下载grid 安装包: http://www.oracle.com/technetwork/database/enterprise-edition/downloads/oracle12c-linux-12201-3608234.htm

安装Oracle RAC 11g

1.Oracle Enterprise Linux 和 iSCSI 上构建 Oracle RAC 11g 集群 2.Oracle RAC 的所有共享磁盘存储将基于 iSCSI,iSCSI 使用在第三个节点(该节点在本文中称为网络存储服务器)上运行的 Openfiler 2.3 版 x86_64 3.每个 Linux 节点仅配置两个网络接口 - eth0 用于连接公共网络, eth1 用于 Oracle RAC 专用互连"和"连接网络存储服务器以便进行共享 iSCSI 访问.而在实现生产