RAC5——11gR2以后GI进程的变化

参考文档:

11gR2 Clusterware and Grid Home - What You Need to Know (Doc ID 1053147.1)
诊断 Grid Infrastructure 启动问题 (Doc ID 1623340.1)

Oracle 11gR2 中对CRSD资源进行了重新分类: Local Resources 和 Cluster Resources,可以通过命令crsctl查看:

[[email protected] ~]# crsctl stat res -t
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Local Resources
--------------------------------------------------------------------------------
ora.DATA.dg
               ONLINE  ONLINE       rac1                                         
               OFFLINE OFFLINE      rac2                                         
ora.FRA.dg
               ONLINE  ONLINE       rac1                                         
               OFFLINE OFFLINE      rac2                                         
ora.LISTENER.lsnr
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
ora.OCR_VOTE.dg
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
ora.asm
               ONLINE  ONLINE       rac1                     Started             
               ONLINE  ONLINE       rac2                     Started             
ora.eons
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
ora.gsd
               OFFLINE OFFLINE      rac1                                         
               OFFLINE OFFLINE      rac2                                         
ora.net1.network
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
ora.ons
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
ora.registry.acfs
               ONLINE  ONLINE       rac1                                         
               ONLINE  ONLINE       rac2                                         
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.LISTENER_SCAN1.lsnr
      1        ONLINE  ONLINE       rac1                                         
ora.oc4j
      1        OFFLINE OFFLINE                                                   
ora.rac1.vip
      1        ONLINE  ONLINE       rac1                                         
ora.rac2.vip
      1        ONLINE  ONLINE       rac2                                         
ora.scan1.vip
      1        ONLINE  ONLINE       rac1                                         
ora.test.db
      1        ONLINE  ONLINE       rac1                     Open                
      2        OFFLINE OFFLINE                    ——这里我故意关掉了rac2节点上的数据库实例

对应起来看:Local Resource就是应用层的东西;而Cluster Resource就是集群层的东西了。

我们可以用以下命令查看ohasd管理的资源:

[[email protected] ~]#  crsctl stat res -init -t             ——在节点1上执行
--------------------------------------------------------------------------------   
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  ONLINE       rac1                     Started             
ora.crsd
      1        ONLINE  ONLINE       rac1                                         
ora.cssd
      1        ONLINE  ONLINE       rac1                                         
ora.cssdmonitor
      1        ONLINE  ONLINE       rac1                                         
ora.ctssd
      1        ONLINE  ONLINE       rac1                     OBSERVER            
ora.diskmon
      1        ONLINE  ONLINE       rac1                                         
ora.drivers.acfs
      1        ONLINE  ONLINE       rac1                                         
ora.evmd
      1        ONLINE  ONLINE       rac1                                         
ora.gipcd
      1        ONLINE  ONLINE       rac1                                         
ora.gpnpd
      1        ONLINE  ONLINE       rac1                                         
ora.mdnsd
      1        ONLINE  ONLINE       rac1

[[email protected] ~]#  crsctl stat res -init -t        在节点2上执行
--------------------------------------------------------------------------------
NAME           TARGET  STATE        SERVER                   STATE_DETAILS       
--------------------------------------------------------------------------------
Cluster Resources
--------------------------------------------------------------------------------
ora.asm
      1        ONLINE  ONLINE       rac2                     Started             
ora.crsd
      1        ONLINE  ONLINE       rac2                                         
ora.cssd
      1        ONLINE  ONLINE       rac2                                         
ora.cssdmonitor
      1        ONLINE  ONLINE       rac2                                         
ora.ctssd
      1        ONLINE  ONLINE       rac2                     OBSERVER            
ora.diskmon
      1        ONLINE  ONLINE       rac2                                         
ora.drivers.acfs
      1        ONLINE  ONLINE       rac2                                         
ora.evmd
      1        ONLINE  ONLINE       rac2                                         
ora.gipcd
      1        ONLINE  ONLINE       rac2                                         
ora.gpnpd
      1        ONLINE  ONLINE       rac2                                         
ora.mdnsd
      1        ONLINE  ONLINE       rac2

可以发现has进程在每个实例上看到和管理的东西是不一样的,也就是说has只管理自己服务器上的进程。我们接下来尝试关闭has进程:

[[email protected] bin]# ./crsctl stop has

CRS-2791: Starting shutdown of Oracle HighAvailability Services-managed resources on ‘rac1‘

CRS-2673: Attempting to stop ‘ora.crsd‘ on‘rac1‘

CRS-2790: Starting shutdown of ClusterReady Services-managed resources on ‘rac1‘

CRS-2673: Attempting to stop ‘ora.LISTENER_SCAN1.lsnr‘on ‘rac1‘

CRS-2673: Attempting to stop‘ora.OCRVOTING.dg‘ on ‘rac1‘

CRS-2673: Attempting to stop ‘ora.sdd.db‘on ‘rac1‘

CRS-2673: Attempting to stop‘ora.LISTENER.lsnr‘ on ‘rac1‘

CRS-2673: Attempting to stop ‘ora.oc4j‘ on‘rac1‘

CRS-2673: Attempting to stop ‘ora.cvu‘ on‘rac1‘

CRS-2677: Stop of ‘ora.LISTENER_SCAN1.lsnr‘on ‘rac1‘ succeeded

CRS-2673: Attempting to stop‘ora.scan1.vip‘ on ‘rac1‘

CRS-2677: Stop of ‘ora.LISTENER.lsnr‘ on‘rac1‘ succeeded

CRS-2673: Attempting to stop ‘ora.rac1.vip‘on ‘rac1‘

CRS-2677: Stop of ‘ora.rac1.vip‘ on ‘rac1‘succeeded

CRS-2672: Attempting to start‘ora.rac1.vip‘ on ‘rac2‘

CRS-2677: Stop of ‘ora.scan1.vip‘ on ‘rac1‘succeeded

CRS-2672: Attempting to start ‘ora.scan1.vip‘on ‘rac2‘

CRS-2676: Start of ‘ora.scan1.vip‘ on‘rac2‘ succeeded

CRS-2676: Start of ‘ora.rac1.vip‘ on ‘rac2‘succeeded

CRS-2672: Attempting to start‘ora.LISTENER_SCAN1.lsnr‘ on ‘rac2‘

CRS-2677: Stop of ‘ora.sdd.db‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop ‘ora.DATA.dg‘on ‘rac1‘

CRS-2673: Attempting to stop ‘ora.FRA.dg‘on ‘rac1‘

CRS-2676: Start of‘ora.LISTENER_SCAN1.lsnr‘ on ‘rac2‘ succeeded

CRS-2677: Stop of ‘ora.FRA.dg‘ on ‘rac1‘succeeded

CRS-2677: Stop of ‘ora.DATA.dg‘ on ‘rac1‘succeeded

CRS-2677: Stop of ‘ora.oc4j‘ on ‘rac1‘succeeded

CRS-2672: Attempting to start ‘ora.oc4j‘ on‘rac2‘

CRS-2677: Stop of ‘ora.cvu‘ on ‘rac1‘succeeded

CRS-2672: Attempting to start ‘ora.cvu‘ on‘rac2‘

CRS-2676: Start of ‘ora.cvu‘ on ‘rac2‘succeeded

CRS-2677: Stop of ‘ora.OCRVOTING.dg‘ on‘rac1‘ succeeded

CRS-2673: Attempting to stop ‘ora.asm‘ on‘rac1‘

CRS-2677: Stop of ‘ora.asm‘ on ‘rac1‘succeeded

CRS-2676: Start of ‘ora.oc4j‘ on ‘rac2‘succeeded

CRS-2673: Attempting to stop ‘ora.ons‘ on‘rac1‘

CRS-2677: Stop of ‘ora.ons‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop‘ora.net1.network‘ on ‘rac1‘

CRS-2677: Stop of ‘ora.net1.network‘ on‘rac1‘ succeeded

CRS-2792: Shutdown of Cluster ReadyServices-managed resources on ‘rac1‘ has completed

CRS-2677: Stop of ‘ora.crsd‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop ‘ora.mdnsd‘ on‘rac1‘

CRS-2673: Attempting to stop ‘ora.ctssd‘ on‘rac1‘

CRS-2673: Attempting to stop ‘ora.evmd‘ on‘rac1‘

CRS-2673: Attempting to stop ‘ora.asm‘ on‘rac1‘

CRS-2677: Stop of ‘ora.evmd‘ on ‘rac1‘succeeded

CRS-2677: Stop of ‘ora.mdnsd‘ on ‘rac1‘succeeded

CRS-2677: Stop of ‘ora.ctssd‘ on ‘rac1‘succeeded

CRS-2677: Stop of ‘ora.asm‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop‘ora.cluster_interconnect.haip‘ on ‘rac1‘

CRS-2677: Stop of‘ora.cluster_interconnect.haip‘ on ‘rac1‘ succeeded

CRS-2673: Attempting to stop ‘ora.cssd‘ on‘rac1‘

CRS-2677: Stop of ‘ora.cssd‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop ‘ora.crf‘ on‘rac1‘

CRS-2677: Stop of ‘ora.crf‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop ‘ora.gipcd‘ on‘rac1‘

CRS-2677: Stop of ‘ora.gipcd‘ on ‘rac1‘succeeded

CRS-2673: Attempting to stop ‘ora.gpnpd‘ on‘rac1‘

CRS-2677: Stop of ‘ora.gpnpd‘ on ‘rac1‘succeeded

CRS-2793: Shutdown of Oracle HighAvailability Services-managed resources on ‘rac1‘ has completed

CRS-4133: Oracle High Availability Serviceshas been stopped.

[[email protected] bin]#

注意:

我这里测试的是Oracle11gR2的环境,我们在节点1上执行该命令,只把节点1上的进程停了,而把相关的资源转移到我们的节点2上了,因此也证实了我们上面的说的,该命令只争对当前服务器有效。

启动HAS

[[email protected] bin]# ./crsctl start has

CRS-4123: Oracle High Availability Serviceshas been started.

[[email protected] bin]#

从上面看只是启动了HAS。实际上后面会把Oracle Restart 管理的资源都会启动。这个可以使用crs_stat 命令来进程验证,不过Oracle 11g的进程启动过程比较慢,需要耐心等待。

等关闭has进程后,grid用户下,会有这几个进程被关闭:

[[email protected] ~]# ps -fu grid
UID        PID  PPID  C STIME TTY          TIME CMD
grid      4899     1  0 22:28 ?        00:00:00 /u01/app/11.2.0/grid/bin/oraagent.bin
grid      4912     1  0 22:28 ?        00:00:00 /u01/app/11.2.0/grid/bin/gipcd.bin
grid      4917     1  0 22:28 ?        00:00:00 /u01/app/11.2.0/grid/bin/mdnsd.bin
grid      4932     1  0 22:28 ?        00:00:00 /u01/app/11.2.0/grid/bin/gpnpd.bin
grid      4992     1  1 22:28 ?        00:00:01 /u01/app/11.2.0/grid/bin/ocssd.bin 
grid      5008     1  0 22:28 ?        00:00:00 /u01/app/11.2.0/grid/bin/diskmon.bin -d -f

关于以上进程的解释如下:

(3)Grid Plug and Play (GPNPD):

Provides access to the Grid Plug and Play profile, and coordinates updates to the profile among the nodes of the cluster to ensure that all of the nodes have the most recent profile.

(4)Grid Interprocess Communication (GIPC):

A support daemon that enables Redundant Interconnect Usage.

(5)ora.mdns

Used by Grid Plug and Play to locate profiles in the cluster, as well as by GNS to perform name resolution. The mDNS process is a background process on Linux and UNIX, and a service on Windows.

(6)Cluster Time Synchronization Service (CTSS):

Provides time management in a cluster for Oracle Clusterware. 在上面的查询结果中,我们看到CTSS 的状态是OBSERVER。即旁观者。

在11gR2中,RAC在安装的时候,时间同步可以用两种方式来实现,一是NTP,还有就是CTSS. 当安装程序发现 NTP 协议处于非活动状态时,安装集群时间同步服务将以活动模式自动进行安装并通过所有节点的时间。如果发现配置了 NTP,则以观察者模式启动集群时间同步服务,Oracle Clusterware 不会在集群中进行活动的时间同步。

(7)Automatic Storage Management Cluster File System (Oracle ACFS):

Oracle Automatic Storage Management Cluster File System (Oracle ACFS) is a multi-platform, scalable file system, and storage management technology that extends Oracle Automatic Storage Management (Oracle ASM) functionality to support customer files maintained outside of Oracle Database. Oracle ACFS supports many database and application files, including executables, database trace files, database alert logs, application reports, BFILEs, and configuration files. Other supported files are video, audio, text, images, engineering drawings, and other general-purpose application file data.

An Oracle ACFS file system is a layer on Oracle ASM and is configured with Oracle ASM storage, as shown in Figure 5-1. Oracle ACFS leverages Oracle ASM functionality that enables:

·         Oracle ACFS dynamic file system resizing

·         Maximized performance through direct access to Oracle ASM disk group storage

·         Balanced distribution of Oracle ACFS across Oracle ASM disk group storage for increased I/O parallelism

·         Data reliability through Oracle ASM mirroring protection mechanisms

[[email protected] u01]# shcrs_stat.sh

Name                           Target     State     Host

------------------------------ -------------------  -------

ora.DATA.dg                    ONLINE     ONLINE    rac1

ora.FRA.dg                     ONLINE    ONLINE     rac1

ora.LISTENER.lsnr              ONLINE     ONLINE    rac1

ora.LISTENER_SCAN1.lsnr        ONLINE     ONLINE    rac2

ora.OCRVOTING.dg               ONLINE     ONLINE    rac1

ora.asm                        ONLINE     ONLINE    rac1

ora.cvu                        ONLINE     ONLINE    rac2

ora.gsd                        OFFLINE    OFFLINE

ora.net1.network               ONLINE     ONLINE    rac1

ora.oc4j                       ONLINE     ONLINE    rac2

ora.ons                        ONLINE     ONLINE    rac1

ora.rac1.ASM1.asm              ONLINE     ONLINE    rac1

ora.rac1.LISTENER_RAC1.lsnr    ONLINE    ONLINE     rac1

ora.rac1.gsd                   OFFLINE    OFFLINE

ora.rac1.ons                   ONLINE     ONLINE    rac1

ora.rac1.vip                   ONLINE     ONLINE    rac1

ora.rac2.ASM2.asm              ONLINE     ONLINE    rac2

ora.rac2.LISTENER_RAC2.lsnr    ONLINE    ONLINE     rac2

ora.rac2.gsd                   OFFLINE    OFFLINE

ora.rac2.ons                   ONLINE     ONLINE    rac2

ora.rac2.vip                   ONLINE     ONLINE    rac2

ora.scan1.vip                  ONLINE     ONLINE    rac2

ora.sdd.db                     ONLINE     ONLINE    rac2

2.2.3 禁用HAS(Restart)在server 重启后的自动启动

[[email protected] bin]# ./crsctl disable has

CRS-4621: Oracle High Availability Servicesautostart is disabled.

[[email protected] bin]#

2.2.4 查看HAS(Restart)的状态

[[email protected] bin]# ./crsctl config has

CRS-4621: Oracle High Availability Servicesautostart is disabled.

2.2.5 启用HAS(Restart)在server 重启后的自启动

[[email protected] bin]# ./crsctl enable has

CRS-4622: Oracle High Availability Servicesautostart is enabled.

--查看has的状态,验证刚才命令的效果:

[[email protected] bin]# ./crsctl config has

CRS-4622: Oracle High Availability Servicesautostart is enabled.

[[email protected] bin]#

2.2.6 查看Restart 当前状态

[[email protected] bin]# ./crsctl check has

CRS-4638: Oracle High Availability Servicesis online

2.2.7 查看Oracle Restart 中由OHASD管理的resource 状态

[[email protected] bin]# ./crsctl stat res -t

--------------------------------------------------------------------------------

NAME           TARGET  STATE       SERVER                  STATE_DETAILS

--------------------------------------------------------------------------------

Local Resources

--------------------------------------------------------------------------------

ora.DATA.dg

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

ora.FRA.dg

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

ora.LISTENER.lsnr

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

ora.OCRVOTING.dg

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

ora.asm

ONLINE  ONLINE      rac1                    Started

ONLINE  ONLINE      rac2                    Started

ora.gsd

OFFLINE OFFLINE      rac1

OFFLINE OFFLINE      rac2

ora.net1.network

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

ora.ons

ONLINE  ONLINE      rac1

ONLINE  ONLINE      rac2

--------------------------------------------------------------------------------

Cluster Resources

--------------------------------------------------------------------------------

ora.LISTENER_SCAN1.lsnr

1        ONLINE  ONLINE      rac2

ora.cvu

1        ONLINE  ONLINE      rac2

ora.oc4j

1        ONLINE  ONLINE      rac2

ora.rac1.vip

1        ONLINE  ONLINE      rac1

ora.rac2.vip

1        ONLINE  ONLINE      rac2

ora.scan1.vip

1        ONLINE  ONLINE      rac2

ora.sdd.db

1        ONLINE  ONLINE      rac1                     Open

2        ONLINE  ONLINE      rac2                     Open

[[email protected] bin]#

2.3 使用SRVCTL 命令管理Restart(OHASD)

可以手工的使用SRVCTL 命令来管理Oracle Restart。从Oracle Restart 配置里添加或者删除一些组件。当我们手工的添加一个组件到到Oracle Restart,并使用SRVCTL启用该组件,那么Oracle Restart 就开始管理该组件,并根据需要决定是否对该组件进行重启。

官方文档的说明如下:

SRVCTL Command Reference for Oracle Restart

http://docs.oracle.com/cd/E11882_01/server.112/e25494/restart005.htm

Configuring OracleRestart

http://docs.oracle.com/cd/E11882_01/server.112/e10595/restart002.htm

转:http://blog.csdn.net/cymm_liu/article/details/7955340

时间: 2024-10-26 21:04:59

RAC5——11gR2以后GI进程的变化的相关文章

Oracle CRS/GI 进程介绍

转自:http://blog.itpub.net/31444259/viewspace-2151582/ 在 10g和11.1,Oracle的集群称为CRS(Oracle Cluster Ready Service), 在11.2,Oracle的集群称为GI(Grid Infrastructure). 对于CRS/GI,他们的一些核心进程的功能基本类似,但是在11.2,新增了很多新的Deamon进程. 10.2 CRS:$ ps -ef|grep crs/binroot      4373  3

【翻译自mos文章】在11gR2/12c 的GI中,ORA_CRS_HOME 环境变量必须被unset

在11gR2/12c 的GI中,ORA_CRS_HOME 环境变量必须被unset 来源于: Environment Variable ORA_CRS_HOME MUST be UNSET in 11gR2/12c GI (文档 ID 1502996.1) 适用于: Oracle Database - Enterprise Edition - Version 11.2.0.1 and later Information in this document applies to any platfo

linux基本命令整理(三):进程和vim

linux基本命令整理(三) -----------进程和vim 一.进程 1.查看进程 ps:将某个时间点的程序运行的状况截取下来 a:所有的进程 x:后台进程 u:有效的使用者相关的进程(常用组合aux) -IA:也能观察系统所有的数据 axjf:连同部分的程序树状态 -I:今查看和自己bash相关的程序 top:动态的观察进程的变化 -d:后面接描述,就是整个页面刷新的时间:默认是5秒 -b:以批次的方式执行top -n:与-b搭配使用,意义是需要进行几次top的输出结果 如:top -b

进程管理工具htop/glances/dstat的使用

友情提醒:文件涉及到的实验平台为vmware workstation 10 + Centos 6.6 X86_64,所述命令请谨慎使用. Centos linux中自带了很多进程查看管理工具,诸如:ps ,top,vmstat除了这些之外还有很多提供类似功能的工具程序,这其中有三款高大上的工具 htop/glances/dstat.今天就来认识一下他们. 工具一,htop:令人惊艳的类top工具 htop是款类似于top的工具,但是htop提供的功能却是top望尘莫及. 1.安装 htop非系统

#每日Linux小练习#12进程的详细分析

经常被问到进程和线程的区别,今天对进程进行详细的分析讨论. 一.进程的定义 进程是操作系统的概念,每当我们执行一个程序时,对于操作系统来讲就创建了一个进程,在这个过程中,伴随着资源的分配和释放.可以认为进程是一个程序的一次执行过程. 二.进程与程序的区别 程序时静态的,它是一些保存 在磁盘上得指令的有序集合,没有任何执行的概念. 进程是一个动态的概念,它是程序执行的过程,包括创建.调度和消亡. 三.linux系统中进程的表示 在linux系统中,进程由一个叫task_struct的结构体描述,也

linux学习之路之进程管理

什么是进程? 所谓进程就是将一个二进制文件加载到内存形成的一个个体,这就是一个进程. 在我们的linux系统中,系统只识别二进制文件,所以一个系统要想正常的运行时,必须启动一些二进制文件,从而形成进程,在以这些进程的方式去执行相应的任务. 我们常常听到所谓的程序,那么程序和进程是什么关系呢? 刚刚说过进程是由二进制文件加载到内存中形成的.而这些二进制文件就是程序. 可以这么来理解: 程序是实实在在地文件,是存放在磁盘上的. 进程是一个逻辑概念,进程是存在内存当中的,所以当机器重启,这些进程也随之

工作管理、进程管理-(Linux笔记)

一.工作管理 1.&:直接将命令丢到后台中执行 Eg: tar -jcv -f infor/t.tar.bz2 infor/test1 & (将test1压缩) 2.[ctrl] -z :将目前的工作丢到后台中暂停 3.jobs:查看目前后台工作状态 jobs [-lsr] -l:除了列出job number与命令串外,还列出PID的号码 -s:仅列出正在后台暂停的工作 -r:仅列出正在后台运行的工作 4.fg:将后台工作拿到前台来处理 fg %jobnumber 5.bg:让后的状态变成

linux 进程管理相关命令汇总

## processes 进程管理 ##ps查看当前系统执行的线程列表,进行瞬间状态,不是连续状态,连续状态需要使用top名称查看 更多常用参数请使用 man ps查看 ps ##显示所有进程详细信息 ps aux ##-u 显示某个用户的进程列表 ps -f -u www-data ## -C 通过名字或者命令搜索进程 ps -C apache2 ## --sort 根据进程cpu使用率降序排列,查看前5个进程 -pcpu表示降序 pcpu升序 ps aux --sort=-pcpu | he

Linux进程管理(鸟哥)

进程管理知识点总结: 一,什么是进程 1,进程与程序 (1)程序 (program):通常为 binary program ,放置在储存媒体中 (如硬盘.光盘.软盘.磁带等), 为实体文 件的型态存在: (2)进程 (process):程序被触发后,执行者的权限与属性.程序的程序代码与所需数据等都会被加载内存中, 操 作系统并给予这个内存内的单元一个标识符 (PID),可以说,进程就是一个正在运作中的程序. (3)父进程和子进程:ps -l 父进程:pid 子进程:ppid 注:日常运维中,ki