LVM故障导致RHCS启动故障

1、故障提示

抓取资源管理日志发现提示如下错误

tail -f /var/log/cluster/rgmanager.log

May  6 18:21:24 yktdb1 rgmanager[17425]: State change: Local UP

May  6 18:21:24 yktdb1 rgmanager[17425]: Starting stopped service service:yktoracle

May  6 18:21:24 yktdb1 rgmanager[18533]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:24 yktdb1 rgmanager[18555]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:24 yktdb1 rgmanager[17425]: start on lvm "yktoracledb" returned 1 (generic error)

May  6 18:21:24 yktdb1 rgmanager[17425]: #68: Failed to start service:yktoracle; return value: 1

May  6 18:21:24 yktdb1 rgmanager[17425]: Stopping service service:yktoracle

May  6 18:21:25 yktdb1 rgmanager[18586]: [script] Executing /etc/init.d/dbora stop

May  6 18:21:25 yktdb1 rgmanager[18682]: [fs] stop: Could not match /dev/yktoracledb/oracledblv with a real device

May  6 18:21:25 yktdb1 rgmanager[18720]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:25 yktdb1 rgmanager[18742]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:25 yktdb1 rgmanager[18778]: [lvm] Deactivating yktoracledb/oracledblv

May  6 18:21:25 yktdb1 rgmanager[18800]: [lvm] Making resilient : lvchange -an yktoracledb/oracledblv

May  6 18:21:25 yktdb1 rgmanager[18825]: [lvm] Resilient command: lvchange -an yktoracledb/oracledblv --config devices{filter=["a|/dev/mapper/LUN-1800G|","a|/dev/mappe

May  6 18:21:26 yktdb1 rgmanager[17425]: Service service:yktoracle is recovering

May  6 18:21:26 yktdb1 rgmanager[17425]: #71: Relocating failed service service:yktoracle

May  6 18:21:26 yktdb1 rgmanager[17425]: Service service:yktoracle is stopped

May  6 18:21:35 yktdb1 rgmanager[17425]: State change: 192.168.10.2 UP

May  6 18:21:35 yktdb1 rgmanager[17425]: Starting stopped service service:yktoracle

May  6 18:21:36 yktdb1 rgmanager[18886]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:36 yktdb1 rgmanager[18908]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:36 yktdb1 rgmanager[17425]: start on lvm "yktoracledb" returned 1 (generic error)

May  6 18:21:36 yktdb1 rgmanager[17425]: #68: Failed to start service:yktoracle; return value: 1

May  6 18:21:36 yktdb1 rgmanager[17425]: Stopping service service:yktoracle

May  6 18:21:36 yktdb1 rgmanager[18939]: [script] Executing /etc/init.d/dbora stop

May  6 18:21:36 yktdb1 rgmanager[19035]: [fs] stop: Could not match /dev/yktoracledb/oracledblv with a real device

May  6 18:21:36 yktdb1 rgmanager[19073]: [lvm] HA LVM:  Improper setup detected

May  6 18:21:37 yktdb1 rgmanager[19095]: [lvm] * "volume_list" not specified in lvm.conf.

May  6 18:21:37 yktdb1 rgmanager[19131]: [lvm] Deactivating yktoracledb/oracledblv

May  6 18:21:37 yktdb1 rgmanager[19153]: [lvm] Making resilient : lvchange -an yktoracledb/oracledblv

May  6 18:21:37 yktdb1 rgmanager[19178]: [lvm] Resilient command: lvchange -an yktoracledb/oracledblv --config devices{filter=["a|/dev/mapper/LUN-1800G|","a|/dev/mappe

May  6 18:21:37 yktdb1 rgmanager[17425]: Service service:yktoracle is recovering

May  6 18:21:37 yktdb1 rgmanager[17425]: #71: Relocating failed service service:yktoracle

May  6 18:21:39 yktdb1 rgmanager[17425]: Service service:yktoracle is stopped

查看lvdiskplay  对应的oracledblv 状态提示 Not available

在/dev/yktoraclevg/下面竟然没有这个oracledblv

除非把clvmd停止后才这个在/dev/yktoarclevg/里就可以看了

查了好多资料都不知道怎么回事

查到一个service clvmd status 后发现 集群 vg和lv都是显示none

这一下让我找到了问题所在

直接用命令vgchange -cy yktoracledb

在查看service clvmd status

[[email protected] ~]#   service clvmd status

clvmd (pid  7550) 正在运行...

Clustered Volume Groups: yktoracledb

Active clustered Logical Volumes: oracledblv ysbaklv test

[[email protected] ~]#

已经可以看见集群共享的vg和lv了

在查看集群状态正常了服务也启动了,然后对这个两个节点测试是否可以正常切换。

[[email protected] ~]# clustat

Cluster Status for ytkcluter @ Sun May  7 11:53:49 2017

Member Status: Quorate

Member Name                                                 ID   Status

------ ----                                                 ---- ------

192.168.10.1                                                    1 Online, Local, rgmanager

192.168.10.2                                                    2 Online, rgmanager

Service Name                                       Owner (Last)                                       State

------- ----                                       ----- ------                                       -----

service:yktoracle                                  192.168.10.1                                       started

时间: 2024-10-03 22:00:35

LVM故障导致RHCS启动故障的相关文章

RAC OCR盘故障导致的集群重启恢复

一.事故说明 最近出现了一次OCR盘的故障导致Oracle集群件宕机的事故,后以独占模式启动集群,并使用ocr备份恢复了OCR文件以及重新设置了vote disk,然后关闭集群,重启成功. 因此在此处进行事故重现以吸取教训. 二.重现步骤 测试RAC环境中只有+OCR和+DATA两个ASM磁盘组. 1.做好ocr的手工备份 [[email protected] ~]# ocrconfig -export /home/oracle/ocr.bak 紧急情况下没有ocr的备份也不要紧,在$CRS_H

Oracle Study之--Oracle 11gR2 RAC crs启动故障(CRS-4000)

Oracle Study之--Oracle 11gR2 RAC crs启动故障(CRS-4000) 系统环境:     操作系统:RedHat EL5     Cluster:  Oracle 11gR2 Grid     Oracle:   Oracle 11gR2  在启动一个node的CRS时出现以下错误,错误现象: [[email protected] ~]# crsctl start crs   Failure at scls_scr_getval with code 1   Inte

ubuntu下处理mysql无法启动故障一例

故障现象: mysql无法启动 1: dmesg |grep mysql [101353.820000] init: mysql post-start process (9077) terminated with status 1 [101354.650000] init: mysql main process (9113) terminated with status 1 [101354.650000] init: mysql respawning too fast, stopped 2: g

LVM讲解和磁盘挂载故障

LVM是 Logical Volume Manager(逻辑卷管理)的简写,它是Linux环境下对磁盘分区进行管理的一种机制,使硬盘不必使用分区也能被简单地重新划分大小. 首先我们先准备磁盘分区,模拟sdb创建3个分区,每个分区1g,并且将分区类型改为lvm,否则就无法向下进行 命令(输入 m 获取帮助):nPartition type:p primary (0 primary, 0 extended, 4 free)e extendedSelect (default p): p分区号 (1-4

记一次启动故障

记一次启动故障 Terrasse 2019.08.30 本机使用的是 Windows 10 Manjaro 双系统,今天从Win切换成Linux时出现了You are in emergency mode...等字样,无图形界面,提示登录后查看系统日志解决问题. 值得一提的是,我最开始差点没登录进去,原因是默认不开启 Numlock ,我以前是通过一个自动执行的命令开启的 Numlock,而今天系统启动失败,也就没有这个命令了.另外,我的终端默认是中文,在emergency mode下没有加载中文

记一次zimbra服务器故障导致mysql起不来问题

记一次zimbra服务器故障导致mysql起不来问题服务器有一天突然访问不了,局域网连接不上,去机房查看,硬盘灯亮着,屏黑的,按电源键没法关机,没办法,只能强制关机了.强制关机后,启动起来,登陆进去看.zmcontrol status过了好久才出现内容,提示如下:Unable to determine enabled services from ldap. Unable to determine enabled services. Cache is out of date or doesn't

Linux系统无法启动故障解决方案

Linux系统无法启动故障解决方案 2011-09-27 09:42 佚名 比特网 我要评论(0) 字号:T | T 不管你多么喜爱你的Linux系统机器,有时候你都必须恢复你的系统.是的,即使一台Linux系统机器也可能遭受系统崩溃:不管是由于视频配置错误.内核更新出错.或是由于init脚本配置错误,这种情况都是必然的. AD:2014WOT全球软件技术峰会北京站 课程视频发布 当你的心爱的linux系统出现故障的时候,你是如何来解决的呢?没有操作系统能够确保100%可靠.终有一天,即使Lin

4.10/4.11/4.12 lvm讲解 4.13 磁盘故障小案例

4.10/4.11/4.12 lvm讲解 4.13 磁盘故障小案例 4.10/4.11/4.12 lvm讲解 lvm讲解 4.10 lvm讲解上 安装下lvm 如果忘记了 lvm包 pvdisplay 查看 4.11 lvm 中 查看物理卷 除了pvdisplay命令还有一个 pvs命令也可以直观查看当前的物理卷 有了物理卷之后再来创建卷组 先用俩个物理卷创建一个卷组 vgcreate vg1 /dev/sdb1 /dev/sdb2 可以查看下卷组vgdiskplay 或者 vgs vgremo

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败

AIX 5.3下Oracle 10g RAC 启动故障--CRS启动失败 系统环境: 操作系统: AIX 5300-09 集群软件: CRS 10.2.0.1 数据库:   Oracle 10.2.0.1                     系统架构图 故障现象: 系统重启后,在节点上CRS 启动失败或CRS服务启动成功,CRS Resource无法ONLINE. [[email protected] racg] cat /etc/hosts 127.0.0.1