常用命令介绍
对VCS的常用命令进行介绍,便于工程师进行日常维护。本手册描述的命令仅供参考,具体描述请以Veritas公司提供的相关资料为准。
VCS的安装和命令都在下列目录下:sbin, /usr/sbin, /opt/VRTS/bin,和/opt/VRTSvcs/bin
,如果没有设置VCS的环境变量,请在/etc/profile文件中增加蓝色信息PATH=/opt/VRTSvcs/bin :/sbin:/usr/sbin:/usr/local/sbin:$PATH
修改完毕后需执行source /etc/profile,或者重新登陆。
1.1 基本命令
使用/etc/rc.d/llt {start|stop|restart|condrestart|status}命令可以启动、停止、重启llt及查看llt状态;
使用/etc/rc.d/gab{start|stop|restart|condrestart|status}命令可以启动、停止、重启gab及查看gab状态;
使用/etc/rc.d/vcs {start|stop|restart|condrestart|status}命令可以启动、停止、重启VCS及查看VCS状态;也可使用hastart [-stale|-force]来启动VCS;
使用下列命令来查看集群状态:hastatus或者hastat -sum
启动单节点集群:hastart –onenode
以时间共享方式启动VCS:hastart –ts
关闭整个集群服务:hastop -all [-force]
关闭集群中一台主机上的集群服务:hastop -local
只关闭VCS相关进程,而不停止VCS所保护的服务进程:hastop -sys system [-force | -evacuate]
使配置文件可读写:haconf –makerw
使配置文件只读:haconf -dump –makero
1.2 VCS的用户管理:
增加用户,用户默认有观察员身份:hauser -add user
将用户提升为集群管理员:haclus -modify Administrators -add user
将用户提升为集群操作员:haclus -modify Operators -add user;
将用户提升为服务组管理员:hagrp -modify service_group Adminstrators -add user
将用户提升为服务组操作员:hagrp -modify service_group Operators -add user
删除用户:hauser -delete user
显示所有用户:hauser -display
查询集群日志:
hamsg -list
hamsg -info [-path path_name] LDF
1.3 对服务组的基本管理操作:
查询service_group状态:hagrp -state [service_group] -sys [system];
查询节点之间依赖关系:hagrp -dep [service_group]
查询资源表:
hagrp -resources [service_group] ;
hagrp -display [service_group] [-attribute attribute] [-sys system]
hares -display [resource]
hares -display -attribute [attribute]
hares -display -group [service_group]
hares -display -type [resource_type]
hares -display -sys [system]
启动服务组及使服务联机:hagrp –online service_group –sys system
关闭服务组及使服务脱机:hagrp –offline service_group –sys system
将服务组切换到另一个系统上:(只对failover组有效,且当服务组中服务部分或全部联机时):
hagrp -switch service_group -to system
冻结服务组(disable onlining, offlining, and failover),option -persistent 是使cluster重启时freeze:
hagrp -freeze service_group [-persistent]
解冻被冻结的服务组 (reenable onlining, offlining, and failover)
hagrp -unfreeze service_group [-persistent]
激活服务组:(服务组激活后才能进行联机操作)hagrp -enable service_group [-sys system]
禁用服务组:(服务组禁用后不能进行联机或切换操作)hagrp -disable service_group [-sys system]
激活服务组中资源:hagrp -enableresources service_group
禁用服务组中资源:(如资源为disable时agents不监控资源组)hagrp -disableresources service_group
清除故障状态:hagrp -clear [service_group] -sys [system]
1.4 管理资源操作:
查询资源代理列表:
hatype -list
hatype -resources resource_type
hatype -display [resource_type]
haagent -display [agent]
使资源联机:hares -online resource -sys system
使资源脱机:hares -offline resource -sys system
使资源脱机并将命令传播给子节点:hares -offprop resource -sys system
提示资源代理(agent)监控指定系统上的资源:(命令可能立即返回,但监控的进程可能还没结束)hares -probe resource -sys system
清洗资源,使状态从RESOURCE_FAULTED 转为RESOURCE_OFFLINE:
hares -clear resource [-sys system]
1.5 管理主机:
查询主机列表:
hasys -list
hasys -display [system]
haclus -value attribute
haclus –display
在ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效:
hacf –verify /etc/VRTSvcs/conf/concig
hasys -force system
修改主机的属性,一些属性是VCS的内部属性,不能修改:
hasys -modify modify_options
查询主机ID,主机ID定义在文件/etc/llttab中:hasys –nodeid node_ID
冻结主机 (防止主机进行联机或切换操作):hasys -freeze [-persistent] [-evacuate] system
解冻被冻结的主机 (使主机可以进行联机或切换操作):hasys -unfreeze [-persistent] system
1.6 VCS的license的管理操作:
安装VCS的License(root用户下执行):halic <key>或者vxlicinst –k <key>
查询license:vxlicrep
2 使用图形界面管理VCS
使用图形界面来管理VCS,必须保证VCS已经启动,否则不能访问,如果在本机上使用图形界面管理VCS,必须保证VCS图形界面的rpm包已经安装好了,使用rpm –qa |grep VRTS查询,结果中存在以下两个rpm包则说明可以使用
VRTSjre-1.4-GA1
VRTScscm-4.4.00.10-GA_GENERIC
如果是在window终端上使用图形界面,在光盘中找到/windows/WindowsClusterManager这个目录,点击安装,按照提示完成安装,安装完成之后直接可以使用。
2.1 登录Cluster Manager
2.1.1 启动Cluster Manager
Cluster Manager有两种版本:Windows版本和Linux版本。建议使用Windows版本来远程管理Cluster。Windows版本安装后通过开始菜单或者桌面图标即可启动。
Linux版本启动方式如下:
启动图形界面的Veritas Cluster Monitor
# hagui &
启动后将显示Cluster Monitor界面
图1 启动Cluster Monitor界面
第一次登陆,Cluster Monitor界面上可能没有上图中的cluster_HA-test,需要新增一个要管理的Cluster:点击Cluster Monitor的File->New Cluster菜单,会出来如下界面:
图2 在cluter monitor中增加cluster的界面
其中Host name使用任一接点的IP即可,Port使用缺省值。
增加要管理的cluster后,Cluster Monitor中就会出现如图1中的cluster列表,显示为未登陆状态,点击Cluster Monitor中的cluster列表区,将弹出登陆界面,如下图所示:
图3 登陆界面
输入用户名和密码(默认情况下用户为admin,密码为password),点击OK。
编号 |
问题描述 |
解决办法 |
1 |
重启机器后,需要重新start llt,gab.机器reboot之后,gab异常: # lsmod |grep gab gab 253244 0 llt 139680 0 [gab] |
这个是SuSe linux 8操作系统默认不加载网卡驱动导致的问题。解决办法: 在文件 /etc/modules.conf中加入如下内容,ethX对应具体的心跳网卡 alias ethX e1000 |
2 |
在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,心跳线使用正常;但如果用户使用yast配置其他网卡的IP,eth5将不可用,系统显示eth5的驱动没有加载 |
因为yast配置网卡时会将没有配置文件的网卡去激活,要确保yast对心跳线无影响,必须同时给心跳线网卡写配置文件 在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,同时给心跳线的网卡加入配置文件,在/etc/sysconfig/network/中加入ifcfg-ethX文件,内容如下: BOOTPROTO=‘static‘ STARTMODE=‘onboot‘ |
3 |
备用机与主服务器之间只有一条线跳线时,服务不会FailOver到备用机。有没有参数可以控制? |
在集群中只剩下一条心跳线的情况下,如果LLT收不到心跳线信号,VCS将无法判断是主机损坏还是仅是心跳线故障。所以在集群中只剩下一条心跳线的情况下,不会FailOver。 |
4 |
在提供服务组的主机上使用yast给其他网卡配置IP后,浮动IP会报错,导致服务发生切换 |
因为yast配置网卡时会将没有配置文件的网卡去激活,浮动IP是没有配置文件的,所以会被yast干掉,导致浮动IP不可用,引发切换,这是yast的固有bug,只能避免使用yast配置网卡信息,如果需要配置,请直接修改网卡的配置文件 |
5 |
使用命令hastatus -sum 查看状态是下面两种状态 STALE_ADMIN_WAIT: ADMIN_WAIT: |
在STALE_ADMIN_WAIT 和ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效: hacf –verify /etc/VRTSvcs/conf/concig hasys -force system |