HACMP&Cluster相关及常用命令

1启动HACMP

使用smitty clstart命令用来启动HACMP。

# smitty clstart

- 运行指令"smit clstart"回车. 等待命令执行OK,退出smit.

- 等待HACMP完全启动,可用指令"tail -f /tmp/hacmp.out"观察HACMP启动状况.

- 用指令"netstat -i"检查IP address,确认主网卡使用service IP adress,

备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on 的VG,确认共享VG变为varyon状态.

- 用指令"df"检查mount的文件系统.

- 确认属于Node1的online应用正常.

注:有两种启动HACMP的方式:

now手工启动HACMP

restartboth在系统启动时自动启动HACMP

2停止HACMP

使用smitty clstop该命令用来停止HACMP。

- 运行指令"smit clstop"回车.在shutdown mode项选择graceful并回车, 等待命令执行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"观察HACMP停止状况.

- 用指令"netstat -i"检查IP address,确认主网卡变为boot IP adress,备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on 的VG,确认共享VG变为varyoff状态.

注:有三种停止方式:

graceful: 只停止本节点上HACMP的运行,并释放由本节点管理的资源,但允许其它节点接管。(是指在关闭双机软件时将调用客户应用预定义的善后处理例程。)

graceful with takeover停止本节点上HACMP的运行,释放资源,让其他节点接管。(是指该节点将关闭双机软件并释放资源请求备节点进行接管。)

forced停止本节点上HACMP的运行,但不释放资源。(是指立即关闭双机软件不调用任何客户应用的善后处理例程。)

3查看cluster运行情况和HACMP状态

使用/usr/es/sbin/cluster/clstat命令用来显示HACMP状态。

查看cluster运行情况:/usr/sbin/cluster/clstat

# /usr/sbin/cluster/clinfo –a

/usr/sbin/cluster/clstat可以帮助你查看当前HACMP的节点状态。

屏幕会如下显示:

clstat - HACMP for AIX Cluster Status Monitor

----------------------------------------------------------------

Cluster: cluster1 (1) Tue Jul 20 09:52:03 CDT 1999

State: UP Nodes: 2

SubState: STABLE

Node: j50a State: UP <--节点A状态

Interface: j50_a_srv (0) Address: 192.9.200.1 <-- 服务IP地址

State: UP <--服务IP状态

Interface: j50_a_tty1 (1) Address: 0.0.0.0

State: UP <--心跳线状态

Node: j50b State: UP <--节点B状态

Interface: j50_b_srv (0) Address: 192.9.200.2 <-- 服务IP地址

State: UP <--服务IP状态

Interface: j50_b_tty1 (1) Address: 0.0.0.0

State: UP <--心跳线状态

************************ f/forward, b/back, r/refresh, q/quit *****************

节点和CLUSTER绿色为正常,红色表示HACMP宕机或没有起来,×××表示HACMP处在不稳定状态,可能是某节点HACMP正在启动、切换、停止。

查看HA状态报错

配置完powerHA5.5,在两台设备上启动hacmp双机软件,执行/usr/sbin/cluster/clstat查看HA状态报错,报错总体意思是clinfoES 或snmpd未启动。通过lssrc -s snmpd;lssrc -s clinfoES实际查看这两个进程已经启动;将进程重启结果还是一样。奇怪,难道HA5.5不用这个命令了么? N天之后,在IBM 官方发布的文档上发现了此类问题的解决办法,经过测试后果然好用,呵呵,下面把方法告诉大家哦!

编辑/etc/snmpdv3.conf文件(每个节点都要添加),添加如下行:

VACM_VIEW defaultView internet - included - VACM_VIEW defaultView 1.3.6.1.4.1.2.3.1.2.1.5 - included - ************************************************

查看进程状态

lssrc -s snmpd

lssrc -s clinfoES实时查看这两个进程

重启进程clinfoES、snmpd:

stopsrc -s clinfoES

startsrc -s clinfoES

stopsrc -s snmpd

startsrc -s snmpd

执行/usr/sbin/cluster/utilities/cldisp cltopinfo

以上步骤执行完后,在等2到3分钟即可。

4查看HACMP的输出

#tail -f /tmp/hacmp.out

HACMP启动时,用该命令查看该文件中有无报错显示

5查看地址信息

#netstat -i

用该命令查看网卡绑定的地址类型是否正确,三种类型:boot1、boot2、service。

6查看逻辑卷组和文件系统

#lsvg -o

用该命令查看应该激活(varyon)的VG是否激活。

#mount

用该命令查看应该mount上的文件系统是否正常。

7、查看HACMP配置情况

# /usr/es/sbin/cluster/utilities/cllscf 显示群集拓朴

# /usr/es/sbin/cluster/utilities/cllsclstr 显示群集定义

# /usr/es/sbin/cluster/utilities/cllsnode 按节点显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsnw 按网络名称显示拓朴信息

# /usr/es/sbin/cluster/utilities/cllsif 按网卡显示拓朴信息

# /usr/es/sbin/cluster/utilities/clshowres 显示资源组信息

8、查看Cluster的进程状态:

# ps -ef | grep cluster

注:应有三个HACMP进程:clstrmgr、clinfo、clsnuxpd

9、查看Cluster的日志及错误信息(HACMP环境下的排错):

HACMP的LOG文件:以下文件都是文本文件,可以用VI来看.每个日志文件都含有每个信息的产生时间.

/usr/adm/cluster.log   :记录了HACMP的状态,由HA的守护进程所产生.

/tmp/hacmp.out         :记录了HA的详细脚本.

/usr/sbin/cluster/history/cluster.mmdd :记录了HA的各个事件的发生.

/tmp/cm.log            :由clstrmgr进程产生,每次HA重起时会被覆盖.

注:可以在启动HACMP时使用 # tail –f /tmp/hacmp.out命令,以查看HACMP的启动是否正常或跟踪启动时的错误信息。

10、查看Cluster运行的历史记录:

# cd /usr/sbin/cluster/history

注:此目录下存放着每天的Cluster运行记录

11、查看Cluster运行时的网络情况及资源组的使用情况:

HACMP启动之前:

# netstat -i

此时应可以看到boot和standby地址

# lsvg -o

此时只能看到本地的VG

HACMP启动之后:

# netstat -i

此时应可以看到service和standby地址

# lsvg -o

此时应可以看到本地的VG及共享VG

12、存储和恢复Cluster的配置:

存储cluster的配置:

#smitty hacmp

选择:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name)

恢复cluster的配置:

# smitty hacmp

选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot

键入Snapshot文件名(Cluster Snapshot Name)

注:菜单中各项的意义:

Cluster Snapshot Name指定Cluster Snapshot的文件名

Cluster Snapshot Des cription对Cluster Snapshot地描述

Un/Configure Cluster Resource是否重新配置Cluster资源

Force Apply if verify fails当Cluster校验失败时,是否强制恢复配置

13、注意:向由HACMP管理的共享VG中增加FS时的具体步骤为:

1)、# smitty

选择:System storage management

File systems

Add/change/show/delete file systems

Journaled file systems

Add a journaled file system

Add a standard journaled file system

选择共享VG

指定FS的大小,Mount point

2)、# smitty clstop

停止HACMP的运行

3)、在增加FS的节点上作:

# varyoffvg SHARE_VG_NAME

# exportvg SHARE_VG_NAME

在另一个节点上作:

# importvg –y SHARE_VG_NAME –f hdiskX

# varyonvg SHARE_VG_NAME

作此步的目的是将新加入的FS的定义取过来

4)、# smitty hacmp

选择:cluster configuration

cluster resources

define resource group

change/show resources for a resource group

将增加的FS加入到Cluster资源组的定义中

5)、# smitty hacmp

选择:cluster configuration

cluster resources

synchronize cluster resources

同步Cluster的资源组的配置

6)、# smitty hacmp

选择:cluster configuration

cluster verification

进行Cluster配置的校验

14、Cluster的配置参数:

参数名称参数值

Cluster ID

Cluster Name

Node Name

Resource Group Name

Node RelationshipCascadingcascading

Participating Node Names

Service IP label

Filesystems

Filesystems Consistency Checkfsckfsck

Filesystems Recovery MethodSequentialsequential

Volume Groups

Application Servers

Start s cript

Stop s cript

检查心跳线是否已经配置好:

1、在两台上分别输入如下命令:

S85_1# cat /etc/hosts >/dev/tty0

S85_2# cat

如果在S85_2机能接收到信息,则表明心跳线已经配置好

2、测试心跳线是否可以正常工作:

A机上:

# stty

B机上:

# stty

如果在两台主机上均出现了该TTY的配置信息,则说明心跳线设置正确。

安装HACMP时,一般不选择全部安装,只安装一部分关键的软件,如cluster.adt、cluster.base、cluster.cspoc和cluster.doc.en_US。

15、HA可把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来.

1、/usr/es/sbin/cluster/utilities/cllscf Show Cluster Topology

2、/usr/es/sbin/cluster/utilities/cllsclstr Show Cluster Definitions

3、/usr/es/sbin/cluster/utilities/cllsnode Show Topology Information by Node

4、/usr/es/sbin/cluster/utilities/cllsnw Show Topology Information by Network Name

5、/usr/es/sbin/cluster/utilities/cllsif Show Topology Information by Network Adapter

6、/usr/es/sbin/cluster/utilities/clshowres -g'sxptt_con_rg'

Show Resource Information by Resource Group

7、/usr/es/sbin/cluster/utilities/clshowres -n's85a'

Show Resource Information by Node

Filesystems Consistency Check

1. fsck

2. logredo

Resource Group的三种节点关系

(Node Relationship):

(1) Cascading

(2) Concurrent

(3) Rotating

HA启动脚本:/usr/sbin/cluster/local/app_start1

HA停止脚本:/usr/sbin/cluster/local/app_stop1

lspv -p hdiskx 列出hdiskx上PP的状态

lspv hdiskx 看hdiskx上的详细信息

lspv 看硬盘及所在VG

lslv lv00 查看LV状态

lsvg -p datavg 看指定VG上所有的硬盘

16、人为接管HACMP

在某些维护情况下,需将某节点的HACMP及应用切换至另一节点.

- 运行指令"smit clstop"回车.在shutdown mode项选择takeover并回车, 等待命令执行OK,退出smit.

- 等待HACMP完全停止,可用指令"tail -f /tmp/hacmp.out"观察HACMP停止状况.

- 用指令"netstat -i"检查IP address,确认主网卡变为boot IP adress, 备用网卡使用standby IP address.

- 用指令"lsvg -o"检查vary on 的VG,确认共享VG变为varyoff状态.

- 在另一节点运行相同命令,确认网卡,VG及应用接管成功。
17、如何删除系统发给root用的mail ?

# change to system mail directory

cd /var/spool/mail

# backup root mail to OtherUser ( can use pop3 recevied mail user)

# if you have configure /etc/aliases file, you can ignore the step

cat root >> [OtherUserID]

# clean root mail file

true > root

18、HACMP一些常用的命令

clshowsrv –v

查询HACMP子系统的状态

clRGinfo

显示资源组目前的状态

cllscf/cltopinfo

显示集群拓扑结构信息

clshowres

显示资源组的配置信息

cllsnw、cllsif

显示集群网络信息

clstat(需要启动clinfoES服务)

显示集群内所有节点运行情况

/usr/sbin/snap –e

collects the hacmp data.

/usr/sbin/rsct/bin/dhb_read –p devicename –r/-t

test the link status of the disk heartbeating path.

clpasswd

Changes a user’s password on each node in the cluster.

cllsdisk

Lists PVIDs of accessible disks in a specified resource chain

cllsvg

List volume groups accessible in a specified resource chain.

cllsparam

Lists runtime parameters.

cl_clstop

Stops cluster services on nodes running C-SPOC.

cl_lsfs

Displays shared filesystem attributes for all cluster nodes.

cl_lsgroup

Displays group attributes for all cluster nodes.

cl_lslv

Displays shared logical volume attributes for cluster nodes.

cl_lsuser

Displays user account attributes for all nodes.

cl_lsvg

Displays shared volume group attributes for cluster nodes.

原文地址:http://blog.51cto.com/sf1314/2083583

时间: 2024-08-30 07:07:01

HACMP&Cluster相关及常用命令的相关文章

整理kafka相关的常用命令

创建主题(4个分区,2个副本) bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 2 --partitions 4 --topic test 查询集群描述 bin/kafka-topics.sh --describe --zookeeper 生产者 bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test 消

centos7 yum相关的常用命令

[[email protected] ~]# history |grep yum 40 yum repolist 42 cd /etc/yum.repos.d/ 49 yum clean all 50 yum repolist 51 yum install -y httpd 52 yum repolist 53 yum list 54 yum list|wc 55 yum install vim-X11.i686 vim-common.i686 vim-enhanced.i686 56 man

linux基础及常用命令的使用

linux系统是一个主要使用命令进行日常工作的系统,所以了解并熟练掌握常用命令的使用是进入linux大门的基本,以下便是linux学习过程中学习的常用的命令的用法: linux的日常管理工作一般有如下几个部分,下面通过这几个方面的管理工作来整理与其相关的常用命令: 一  shell的介绍 1.普通用户需要直接使用计算机系统提供的功能,是非常困难的,因为计算机系统能接收的指令和人发出的指令是不相同的,因此需要在计算机系统及用户之间建立一个可以将相互的指令进行"翻译"的功能.shell就是

Linux网络常用命令及配置文件

引 入 网络,是一个很大的话题.如果你想了解OSI七层模型,想看看网桥,路由器等网络设备长什么样,这里可能你要失望了.不过,对于那些没入门或刚入门,英文又不好的网络生手,你就找对文章了.下面,我就来介绍一下CentOS中网络相关的常用命令及配置文件,让你能够轻松配置上网. ifcfg家族:  net-tools 这是一个古老的家族,通过procfs(/proc)和ioctl系统调用,访问和更改内核网络配置.centos6之后就推荐用iproute2家族来取代它,不过作为一个经典的网络系列,还是值

Java的cmd配置(也即Java的JDK配置及相关常用命令)——找不到或无法加载主类 的解决方法

Java的cmd配置(也即Java的JDK配置及相关常用命令) ——找不到或无法加载主类  的解决方法 这段时间一直纠结于cmd下Java无法编译运行的问题.主要问题描述如下: javac 命令可以正常运行,而java命令有时可以正常运行,有时却不可以,不可以的症状就是显示“找不到或无法加载主类”. 在网上找了各种资料,最终发现是因为代码里含有package语句,所以无法在cmd下运行java命令解释.class文件.而那些可以运行的文件就是因为没有使用package语句. 我这种问题的解决方法

Linux系统学习之路和常用命令及其他系统相关内容

Linux系统学习之路 目录 Linux系统学习之路[第一篇]:Linux目录和基础知识 Linux系统学习之路[第二篇]:文件操作,文件查看,find查找 Linux系统学习之路[第三篇]:grep,vim,压缩功能详解 Linux系统学习之路[第四篇]:mount,rpm,yum,yum组讲解 Linux系统学习之路[第五篇]:用户和用户组管理 Linux系统学习之路[第六篇]:权限管理 Linux系统学习之路[第七篇]:磁盘和文件管理 Linux系统学习之路[第八篇]:LVM逻辑卷和RAI

05_NoSQL数据库之Redis数据库:Redis的常用命令,键值相关命令和服务器相关命令

 Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作,这些命令可以再Linux终端使用. 键值相关命令: Keys:返回满足给定pattern的所有key 用表达式*表示取出所有的key 127.0.0.1:6379> keys * 1) "age" 2) "name" 3) "age2" 127.0.0.1:6379> keys a* 1) "age" 2) "age2&

node.js 使用----相关常用命令总结

node.js 使用----相关常用命令总结 1. 下载并安装node.js 2. 设置全局模块存放的目录 2.1 查看默认配置 npm config ls 2.2 修改全局模块存放目录 npm config set prefix "e:\\stores\\nodejs\\node_modules\\node_global" npm config set cache "e:\\stores\\nodejs\\node_modules\\node_global" 2.

linux系统防火墙相关问题及常用命令介绍

今天介绍关于linux系统防火墙:centos5.centos6.redhat6系统自带的是iptables防火墙,centos7.redhat7自带firewall防火墙,ubuntu系统使用的是ufw防火墙.本平台www.gxdeqiong.com 安装的是iptables防火墙(其他云服务供应商可能使用的是其他防火墙). 防火墙导致服务不正常的问题: 在服务器安装某些服务之后,服务无法连接.无法正常启动等情况.查看下系统防火墙有没开放相关的服务端口.(linux系统防火墙开放相关端口后还要