Ceph mon一个故障案例的处理

mon故障问题:

故障现象:health HEALTH_WARN 1 mons down, quorum 0,1 ceph-mon1,ceph-mon2

详细信息可以看下下面的博客,跟这个里面的描述差不多:

http://www.tuicool.com/articles/ju2uA3U

具体解决办法:

mon 故障处理:

[[email protected] ~]# ceph -s

cluster 00000000-0000-0000-0001-000000000010

health HEALTH_WARN 23 pgs degraded; 41 pgs peering; 31 pgs stale; 12 pgs stuck inactive; 24 pgs stuck unclean; recovery 7/60 objects degraded (11.667%); too few pgs per osd (4 < min 20); 4/45 in osds are down; 1 mons down, quorum 0,1,2,3 TDXY-ceph-02,TDXY-ceph-04,TDXY-ceph-05,TDXY-ceph-07

monmap e1: 5 mons at {TDXY-ceph-01=0.0.0.0:0/1,TDXY-ceph-02=10.10.120.12:6789/0,TDXY-ceph-04=10.10.120.14:6789/0,TDXY-ceph-05=10.10.120.15:6789/0,TDXY-ceph-07=10.10.120.17:6789/0}, election epoch 38, quorum 0,1,2,3 TDXY-ceph-02,TDXY-ceph-04,TDXY-ceph-05,TDXY-ceph-07

[[email protected] ~]# ceph mon remove TDXY-ceph-01

[[email protected] ~]# rm -rf /var/lib/ceph/mon/ceph-TDXY-ceph-01

[[email protected] ~]# ceph-mon --mkfs -i TDXY-ceph-01 --keyring /etc/ceph/ceph.mon.keyring

[[email protected] ~]# touch /var/lib/ceph/mon/ceph-TDXY-ceph-01/done

[[email protected] ~]# touch /var/lib/ceph/mon/ceph-TDXY-ceph-01/sysvinit

[[email protected] ~]# service ceph start mon

时间: 2024-10-30 14:30:59

Ceph mon一个故障案例的处理的相关文章

Ceph:一个开源的 Linux PB 级分布式文件系统

探索 Ceph 文件系统和生态系统 M. Tim Jones , 自由作家 简介:  Linux®持续不断进军可扩展计算空间,特别是可扩展存储空间.Ceph 最近才加入到 Linux 中令人印象深刻的文件系统备选行列,它是一个分布式文件系统,能够在维护 POSIX 兼容性的同时加入了复制和容错功能.探索 Ceph 的架构,学习它如何提供容错功能,简化海量数据管理. 标记本文! 发布日期:  2010 年 6 月 12 日 级别:  中级 其他语言版本:  英文 访问情况  5726 次浏览 建议

Ceph mon节点故障处理案例分解

Ceph monitor故障恢复 查看ceph健康状态 [[email protected] ~]# ceph health HEALTH_OK [[email protected] ~]# ceph health detail HEALTH_OK [[email protected] ~]# ceph mon stat e2: 3 mons at{bgw-os-node151=10.240.216.151:6789/0,bgw-os-node152=10.240.216.152:6789/0,

KVM部署LVS集群故障案例一则

一.故障现象 KVM部署LVS(Linux Virtual Server)集群后,能够单独以HTTP方式访问RS(Real Server)的实际IP,但无法通过VIP(Virtual IP)访问. 二.故障分析过程   1.简化架构   在原部署环境中,采用的架构是LVS的DR(Direct Return)模式,如下图所示: 为了便于故障排查,我们简化为 也就是在2台宿主机上,各保留一个虚拟机,角色分别是LVS的Director(调度器)和RS. 该架构中的服务器(及虚拟机)的IP和MAC地址如

手动增加swap空间、lvm、磁盘故障案例

手动增加swap空间                        一般我们的swap空间都是设置为内存的两倍(不超8GB) 手动增加swap空间步骤 : 1.首先我们必须增加一个虚拟磁盘,增加虚拟磁盘基本思路:建立swapfile->格式化swap格式->启用虚拟磁盘 建立swapfile # dd if=/dev/zero of=tmp/newdisk bs=1M count=100 (if指定源(一般为 /dev/zero ,它是unix下源源不断产生"0"的特有文件

MySQL故障案例

第1章 MySQL故障案例: 1.1 背景说明: mysql的架构中没有主从复制的体系,也没有按时进行备份 数据库中有两个库conf库和jira库,仅有一份备份的数据,还是一年前的备份 1.2 故障场景: 意外宕机,导致磁盘物理损坏,也就是说mysql软件程序中data数据目录中的jira文件都没有了 数据库无法启动,经过检查,conf库数据文件都还在,也就是ibd和frm文件都存在 领导要求,conf还是好的,能不能临时先把数据库跑起来,然后想办法修复jira库 1.3 故障环境模拟: 1.3

一个测试案例的分析

案例: 某软件公司在开发一个城镇居民保险系统时,在单元测试.集成测试阶段,为了追赶进度,开发人员与测试人员都没有介入测试工作. 系统测试阶段,测试小组借助缺陷管理工具和开发人员交互进行测试与缺陷修复工作.期间,发现"扭转文档无法归档"的严重错误,开发人员在修改时,认为难度太大,决定暂停修改,得到测试人员认可.在产品发布前,该问题在开发环境下得到解决. 回归测试结束后,开发人员把开发环境下的产品打包,发送给客户. 分析:在案例中,有几处显然不合理的地方: 1.测试介入太晚 2.回归测试做

MySQL在Ubuntu设置自启动的一个故障解决

MySQL在Ubuntu设置自启动的一个故障解决 作者:chszs,转载需注明.博客主页:http://blog.csdn.net/chszs 在解决MySQL自启动,执行命令: # chkconfig --list The program 'chkconfig' is currently not installed. You can install it by typing: apt-get install chkconfig 发现没安装chkconfig脚本,安装它: [email prot

1.3.2 企业案例 切换到alex用户之后企业故障案例:切换到alex用户之后 出现 -bash-4.1$ 错误

企业故障案例:切换到alex用户之后 -bash-4.1$ -bash-4.1$ 1.1.1.1 模拟环境 su - alex \rm -f .bash* 重新登录alex用户 1.1.1.2 原因与解决方法 -bash-4.1$ #与用户有关的环境变量的配置文件 没了 -bash-4.1$ #解决方法: -bash-4.1$ #从/etc/skel 中复制一下即可 1.1.1.3 解决 -bash-4.1$ cp /etc/skel/.bash* ~ ###检查 -bash-4.1$ logo

现场故障 案例:控制文件损坏

本文出自 "深蓝的blog" 博客,若转载,请务必保留此出处:http://blog.csdn.net/huangyanlong 1.手工切归档时出错: 2.查看告警信息: 3.转储/disk2下的控制文件: 4.启库,切归档: 5.手工执行0级全备. 时间 目的 操作 09:50 正常巡检,开启告警日志, 检查数据库时间.状态 #tail -f /u01/app/oracle/admin/metro/bdump/alert_metro.log SQL> SELECT sysda