Ceph 时钟偏移故障处理

时钟偏移故障现象:

[[email protected] ~]# ceph -w

cluster b516386f-cb9d-49d5-bf48-07f0dac29e97

health HEALTH_WARN 192 pgs degraded; 192 pgs stuck unclean

monmap e1: 3 mons at {node1=10.240.217.101:6789/0,node4=10.240.217.104:6789/0,node5=10.240.217.105:6789/0}, election epoch 18, quorum 0,1,2 node1,node4,node5

osdmap e63: 3 osds: 2 up, 2 in

pgmap v249: 192 pgs, 3 pools, 0 bytes data, 0 objects

10314 MB used, 2063 GB / 2073 GB avail

192 active+degraded

2014-06-19 10:46:24.736860 mon.0 [WRN] mon.1 10.240.217.104:6789/0 clock skew 0.060021s > max 0.05s

解决上面问题的方法:

ceph默认的时钟偏移的时间是0.05s,由于这个时间太小,导致集群间的时间偏移值都大于0.05s,解决这个问题

需要到各个monitor节点修改ceph.conf的配置,在配置文件中加入下面的配置

[[email protected] ~]# vi /etc/ceph/ceph.conf

[mon]

mon clock drift allowed = .50

修改后重启ceph进程

[[email protected] ~]# service ceph restart

=== mon.node1 ===

=== mon.node1 ===

Stopping Ceph mon.node1 on node1...kill 4723...done

=== mon.node1 ===

Starting Ceph mon.node1 on node1...

Starting ceph-create-keys on node1...

更详细的处理方法可以看官方文档

http://ceph.com/docs/master/rados/configuration/mon-config-ref/#monitor-store-synchronization

时间: 2024-08-05 19:04:54

Ceph 时钟偏移故障处理的相关文章

Ceph 时钟偏移问题 clock skew detected 解决方案--- 部署内网NTP服务

告警:HEALTH_WARN clock skew detected on mon.ip-10-25-195-6; 8 requests are blocked > 32 sec; Monitor clock skew detected 原因: MON可能被MON节点之间的重要的时钟偏移激烈的影响.这经常会转变为没有明显原因的诡异的行为.为了避免这种问题,你应该在MON节点上运行一个时间同步的工具. 默认最大容忍的时钟偏移为0.05s,不建议修改这个官方开发推荐值.私自未经测试修改虽然无数据丢失

Ceph mon节点故障处理案例分解

Ceph monitor故障恢复 查看ceph健康状态 [[email protected] ~]# ceph health HEALTH_OK [[email protected] ~]# ceph health detail HEALTH_OK [[email protected] ~]# ceph mon stat e2: 3 mons at{bgw-os-node151=10.240.216.151:6789/0,bgw-os-node152=10.240.216.152:6789/0,

ceph

1.Ceph是分布式存储系统,支持三种接口. Object:有原生的API,而且也兼容Swift和S3的API Block:支持精简配置.快照.克隆 File:Posix接口,支持快照 Ceph也是分布式存储系统,它的特点是: 高扩展性:使用普通x86服务器,支持10~1000台服务器,支持TB到PB级的扩展. 高可靠性:没有单点故障,多数据副本,自动管理,自动修复. 高性能:数据分布均衡,并行化度高.对于objects storage和block storage,不需要元数据服务器. 目前In

ceph安装配置文档(centos6.6)

Ceph安装部署文档 目录 一:简介... 1 二:部署环境介绍... 1 三:集群配置准备工作... 2 四:安装ceph软件包... 6 五:安装ceph对象网关... 9 六.搭建ceph集群... 10 6.1.配置mon节点... 10 6.2:添加osd节点... 13 6.2.1.添加第一块osd节点... 13 6.3:添加元数据服务器... 17 6.3.1.添加第一个元数据服务器... 17 七:安装client端RBD.cephFS挂载演示... 18 7.1:客户端内核要

Ceph配置参数(三)

Ceph配置参数(一) Ceph配置参数(二) 8.MONITOR CONFIG REFERENCE http://ceph.com/docs/master/rados/configuration/mon-config-ref/ 客户端在读写数据前,都比去和monitor取得联系,获得cluster map,结合CRUSH算法计算得到对象的位置. (1)最小配置 生成一个fsid和monitorde的最小配置,配置字段[mon]或[mon.a],ceph监视器默认监听6789端口. 主机名(e.

数字设计中的时钟与约束

最近做完了synopsys的DC workshop,涉及到时钟的建模/约束,这里就来聊聊数字中的时钟(与建模)吧.主要内容如下所示: ·同步电路与异步电路: ·时钟/时钟树的属性:偏移(skew)与时钟的抖动(jitter).延时(latency).转换(transition)时间: ·内部时钟: ·多路复用时钟: ·门控时钟: ·行波时钟: ·双沿时钟: ·Design Compiler中的时钟约束. 1.同步电路与异步电路 首先来谈谈同步电路与异步电路.那么首先就要知道什么是同步电路.什么是

关于多网络时钟的讨论

由特拉华大学的David L. Mills热心提供.http://www.eecis.udel.edu/~mills [email protected] 由Reinhard v. Hanxleden CAU Kiel稍微改编.[email protected] 原文http://www.doc88.com/p-7864235424656.html 相关文章http://blog.chinaunix.net/uid-13532695-id-90421.html 百度文库地址http://wenku

分布式系统卫星时钟服务器(NTP服务器)架设与设计

分布式系统卫星时钟服务器(NTP服务器)架设与设计 分布式系统卫星时钟服务器(NTP服务器)架设与设计 本文由安徽京准科技提供支持和原资料——更多阐述可参考微♥ ahjzsz  分布式系统由Tanenbaum定义,“分布式系统是一组独立的计算机,在”分布式系统?—?原理和范例“中作为用户的单一,连贯的系统出现”. 区块链通过构建全球分布式系统,尝试实现分散的新数据存储和组织结构. 首先,定位到分布式系统的原因主要是可扩展性,位置和可用性.区块链也不例外.地理可扩展性,形成全球价值存储网络/信息保

从传统运维到云运维演进历程之软件定义存储(六)完结

回到最初的Ceph运维工程师的问题,本系列讲述的是传统运维向新一代云运维转型之软件定义存储部分的转型,运维是企业业务系统从规划.设计.实施.交付到运维的最后一个步骤,也是重要的步骤.运维小哥最初的梦想搭建一个Ceph存储集群,对接云服务,底层存储实现高可用的数据访问架构.其中运维小哥经历了硬件选型.部署.调优.测试.高可用架构设计等的一系列转型的关卡学习,终于就要到最后的应用上线了.但是往往在生产环境中除了无单点.高可用的架构设计之外还需要平时做一些预案演练,比如:服务器断电.拔磁盘等问题,避免