mysql glera cluster集群监控

一、集群复制状态检查

1、SHOW GLOBAL STATUS LIKE ‘wsrep_%‘;

+------------------------------+-------------------------------------------------------------+

| Variable_name                | Value                                                       |

+------------------------------+-------------------------------------------------------------+

| wsrep_local_state_uuid       | 9f6a992a-7dd9-11e5-9f85-f760745ffb39                        |

| wsrep_protocol_version       | 7                                                           |

| wsrep_last_committed         | 53                                                          |

| wsrep_replicated             | 6                                                           |

| wsrep_replicated_bytes       | 1368                                                        |

| wsrep_repl_keys              | 9                                                           |

| wsrep_repl_keys_bytes        | 210                                                         |

| wsrep_repl_data_bytes        | 774                                                         |

| wsrep_repl_other_bytes       | 0                                                           |

| wsrep_received               | 37                                                          |

| wsrep_received_bytes         | 23347                                                       |

| wsrep_local_commits          | 0                                                           |

| wsrep_local_cert_failures    | 0                                                           |

| wsrep_local_replays          | 0                                                           |

| wsrep_local_send_queue       | 0                                                           |

| wsrep_local_send_queue_max   | 2                                                           |

| wsrep_local_send_queue_min   | 0                                                           |

| wsrep_local_send_queue_avg   | 0.125000                                                    |

| wsrep_local_recv_queue       | 0                                                           |

| wsrep_local_recv_queue_max   | 2                                                           |

| wsrep_local_recv_queue_min   | 0                                                           |

| wsrep_local_recv_queue_avg   | 0.027027                                                    |

| wsrep_local_cached_downto    | 14                                                          |

| wsrep_flow_control_paused_ns | 0                                                           |

| wsrep_flow_control_paused    | 0.000000                                                    |

| wsrep_flow_control_sent      | 0                                                           |

| wsrep_flow_control_recv      | 0                                                           |

| wsrep_cert_deps_distance     | 1.000000                                                    |

| wsrep_apply_oooe             | 0.100000                                                    |

| wsrep_apply_oool             | 0.000000                                                    |

| wsrep_apply_window           | 1.250000                                                    |

| wsrep_commit_oooe            | 0.000000                                                    |

| wsrep_commit_oool            | 0.000000                                                    |

| wsrep_commit_window          | 1.250000                                                    |

| wsrep_local_state            | 4                                                           |

| wsrep_local_state_comment    | Synced                                                      |

| wsrep_cert_index_size        | 10                                                          |

| wsrep_cert_bucket_count      | 22                                                          |

| wsrep_gcache_pool_size       | 27144                                                       |

| wsrep_causal_reads           | 0                                                           |

| wsrep_cert_interval          | 0.325000                                                    |

| wsrep_incoming_addresses     |  |

| wsrep_evs_delayed            |                                                             |

| wsrep_evs_evict_list         |                                                             |

| wsrep_evs_repl_latency       | 0/0/0/0/0                                                   |

| wsrep_evs_state              | OPERATIONAL                                                 |

| wsrep_gcomm_uuid             | 5e28860a-829e-11e5-9c06-665d7fe4003d                        |

| wsrep_cluster_conf_id        | 3                                                           |

| wsrep_cluster_size           | 3                                                           |

| wsrep_cluster_state_uuid     | 9f6a992a-7dd9-11e5-9f85-f760745ffb39                        |

| wsrep_cluster_status         | Primary                                                     |

| wsrep_connected              | ON                                                          |

| wsrep_local_bf_aborts        | 0                                                           |

| wsrep_local_index            | 1                                                           |

| wsrep_provider_name          | Galera                                                      |

| wsrep_provider_vendor        | Codership Oy <[email protected]>                           |

| wsrep_provider_version       | 3.12(rXXXX)                                                 |

| wsrep_ready                  | ON                                                          |

+------------------------------+-------------------------------------------------------------+

wsrep_notify_cmd.sh——监控状态的变化。使用方法参见http://galeracluster.com/documentation-webpages/notificationcmd.html

2、wsrep_cluster_state_uuid显示了cluster的state UUID,由此可看出节点是否还是集群的一员

SHOW GLOBAL STATUS LIKE ‘wsrep_cluster_state_uuid‘

集群内每个节点的value都应该是一样的,否则说明该节点不在集群中了

+--------------------------+--------------------------------------+

| Variable_name                    | Value                                                  |

+--------------------------+--------------------------------------+

| wsrep_cluster_state_uuid | 9f6a992a-7dd9-11e5-9f85-f760745ffb39 |

+--------------------------+--------------------------------------+

3、wsrep_cluster_conf_id显示了整个集群的变化次数。所有节点都应相同,否则说明某个节点与集群断开了

4、wsrep_cluster_size显示了集群中节点的个数

5、wsrep_cluster_status显示集群里节点的主状态。标准返回primary。如返回non-Primary或其他值说明是多个节点改变导致的节点丢失或者脑裂。如果所有节点都返回不是Primary,则要重设quorum。具体参见http://galeracluster.com/documentation-webpages/quorumreset.html如果返回都正常,说明复制机制在每个节点都能正常工作,下一步该检查每个节点的状态确保他们都能收到write-set

show global status like ‘wsrep_cluster_status‘;
+----------------------+---------+
| Variable_name        | Value   |
+----------------------+---------+
| wsrep_cluster_status | Primary |
+----------------------+---------+

二、检查节点状态

节点状态显示了集群中的节点接受和更新write-set状态,以及可能阻止复制的一些问题

1、wsrep_ready显示了节点是否可以接受queries。ON表示正常,如果是OFF几乎所有的query都会报错,报错信息提示“ERROR 1047 (08501) Unknown Command”

SHOW GLOBAL STATUS LIKE ‘wsrep_ready‘;

+---------------+-------+

| Variable_name | Value |
+---------------+-------+
| wsrep_ready   | ON    |
+---------------+-------+

2、SHOW GLOBAL STATUS LIKE ‘wsrep_connected’显示该节点是否与其他节点有网络连接。(实验得知,当把某节点的网卡down掉之后,该值仍为on。说明网络还在)丢失连接的问题可能在于配置wsrep_cluster_address或wsrep_cluster_name的错误

+-----------------+-------+

| Variable_name   | Value |

+-----------------+-------+

| wsrep_connected | ON    |

+-----------------+-------+

3、wsrep_local_state_comment 以人能读懂的方式显示节点的状态,正常的返回值是Joining, Waiting on SST, Joined, Synced or Donor,返回Initialized说明已不在正常工作状态

+---------------------------+--------+

| Variable_name             | Value  |

+---------------------------+--------+

| wsrep_local_state_comment | Synced |

+---------------------------+--------+

三、查看复制的健康状态

通过Flow Control的反馈机制来管理复制进程。当本地收到的write-set超过某一阀值时,该节点会启动flow control来暂停复制直到它赶上进度。监控本地收到的请求和flow control,有如下几个参数:

1、wsrep_local_recv_queue_avg——平均请求队列长度。当返回值大于0时,说明apply write-sets比收write-set慢,有等待。堆积太多可能导致启动flow control

+----------------------------+----------+
| Variable_name              | Value    |
+----------------------------+----------+
| wsrep_local_recv_queue_avg | 0.027027 |
+----------------------------+----------+

wsrep_local_recv_queue_max 和 wsrep_local_recv_queue_min可以看队列设置的最大最小值

2、wsrep_flow_control_paused 显示了自从上次查询之后,节点由于flow control而暂停的时间占整个查询间隔时间比。总体反映节点落后集群的状况。如果返回值为1,说明自上次查询之后,节点一直在暂停状态。如果发现某节点频繁落后集群,则应该调整wsrep_slave_threads或者把节点剔除

+---------------------------+----------+

| Variable_name             | Value    |

+---------------------------+----------+

| wsrep_flow_control_paused | 0.000000 |

+---------------------------+----------+

3、wsrep_cert_deps_distance显示了平行apply的最低和最高排序编号或者sql编号之间的平均距离值。这代表了节点潜在的并行程度,和线程相关

+--------------------------+----------+

| Variable_name            | Value    |

+--------------------------+----------+

| wsrep_cert_deps_distance | 1.000000 |

+--------------------------+----------+

四、检测网络慢的问题

通过检查发送队列来看传出的连接状况

1、wsrep_local_send_queue_avg显示自上次查询之后的平均发送队列长度。比如网络瓶颈和flow control都可能是原因

+----------------------------+----------+

| Variable_name              | Value    |

+----------------------------+----------+

| wsrep_local_send_queue_avg | 0.033333 |

+----------------------------+----------+

wsrep_local_send_queue_max 和 wsrep_local_send_queue_min可以看队列设置的最大值和最小值

五、日志监控

在my.cnf中做如下配置

# wsrep Log Options

wsrep_log_conflicts=ON   #会将冲突信息写入错误日志中,例如两个节点同时写同一行数据

wsrep_provider_options="cert.log_conflicts=ON"    #复制过程中的错误信息写在日志中

wsrep_debug=ON    #显示debug 信息在日志中,其中也包括鉴权信息,例如账号密码。因此在生产环境中不开启

六、附加的日志

当某节点在从节点上应用一个事件失败时,数据库服务器会创建一个特殊的binary log文件。文件名默认是GRA_*.log

时间: 2024-10-03 03:50:51

mysql glera cluster集群监控的相关文章

centos7 mysql cluster集群搭建基于docker

1.准备 mn:集群管理服务器用于管理集群的其他节点.我们可以从管理节点创建和配置集群上的新节点.重新启动.删除或备份节点. db2/db3:这是节点间同步和数据复制的过程发生的层. db4/db5:应用程序使用的接口服务器连接到数据库集群. [[email protected] ~]# docker inspect -f '{{.Name}} - {{range .NetworkSettings.Networks}}{{.IPAddress}}{{end}}' $(docker ps -aq)

Mysql Cluster集群配置详解

一. MySQL集群简介 MySQL群集技术在分布式系统中为MySQL数据提供了冗余特性,增强了安全性,使得单个MySQL服务器故障不会对系统产生巨大的负面效应,系统的稳定性得到保障.MySQL群集需要有一组计算机,每台计算机的角色可能是不一样的.MySQL群集中有三种节点:管理节点.数据节点和SQL节点.群集中的某计算机可能是某一种节点,也可能是两种或三种节点的集合.这三种节点只是在逻辑上的划分,所以它们不一定和物理计算机是一一对应的关系. 管理节点(也可以称管理服务器)主要负责管理数据节点和

mysql 集群 监控

部署mysql高可用集群(mysql-mmm+主从同步)4台数据库服务器:四个数据库之保留初始的四个库,其他库全部删除 主机158 主机137 主机99 主机67 主机102(可与其他四台ping通即可)5台主机的公共配置: 下载mysql-mmm.zip 配置yum源 service iptables stop setenforce 0 yum -y install perl perl-*主机158与主机137配置为主主结构: 主机158: mysql> grant replication s

【MySQL】容器集群支持数据库实践

京东容器数据库系统,管理1800台物理计算节点,生产1W+ 多MySQL Docker容器实例.架构简单可靠,Docker容器计算平台与MySQL集群管理平台解耦处理.为描述方便,京东容器化数据库系统命名为CDS,底层京东Docker容器计算平台命名为JDOS. 本文重点介绍JDOS如何支持CDS.CDS是更大的话题,后续数据库团队会分享相关实践. 介绍 CDS依赖京东坚实的JDOS技术,生产运行1W+个MySQL容器实例.CDS借助JDOS技术优势获得主要3个方面的技术收益: CDS借助Doc

转:讲讲Mysql的三高集群架构,所谓三高,就是“高可用”、“高负载”、“高性能”的架构方案。

from:https://www.toutiao.com/i6717521873397088780/?timestamp=1569389190&app=news_article&group_id=6717521873397088780&req_id=2019092513263001002607901724F149F2 目录 前言 主从架构 MHA架构 PXC方案 MHA与PXC 最终推荐方案 总结 前言 小伙伴们在项目开发中,无法避免的要跟数据库打交道,一般在互联网公司所采用的数据

MariaDB Galera Cluster集群企业版编译安装与配置

安装环境 系统:CentOS 6.8 x86_64 软件:MariaDB 10.1.16 节点一:192.168.11.132 4C 8GB 节点二:192.168.11.133 4C 8GB 软件获取 访问MariaDB企业版下载地址 https://mariadb.com/my_portal/download/mariadb-enterprise 登录帐号后选择 10.1.16GA版本 源代码包下载. 从MariaDB Enterprise 10.1版本开始,企业版软件包与集群功能集成到一起

通过MMM构建MYSQL高可用集群系统

本文为南非蚂蚁的书籍<循序渐进linux-第二版>-8.4的读笔记 MMM集群套件(MYSQL主主复制管理器) MMM套件主要的功能是通过下面三个脚本实现的 1)mmm_mond 这是一个监控进程,运行在管理节点上,主要负责都所有数据库的监控工作,同时决定和处理所有节点的角色切换 2)mmm_agentd 这是一个代理进程,运行在每个MYSQL服务器上,主要完成监控的测试工作以及执行简单的远端服务设置 3)mmm_control 简单的管理脚本,用来查看和管理集群运行状态,同事管理mmm_mo

corosync+pacemaker and drbd实现mysql高可用集群

DRBD:Distributed Replicated Block Device 分布式复制块设备,原理图如下 DRBD 有主双架构和双主架构的,当处于主从架构时,这个设备一定只有一个节点是可以读写的,另外的节点是不可读的,连挂载都不可能,只有一个节点是主的,其它节 点都是从的.当做为主主架构时,需要达到几个条件,1.在高可用集群中启用DRBD;  2. 启用分布式文件锁功能,即需要把磁盘格式化为集群文件系统(如GFS2,OCFS2等):3. 把DRBD做成资源. 数据的存储过程: 当某个进程存

redis演练(9) redis Cluster 集群管理&failover情况

<redis演练(8) redis Cluster 集群环境安装>,简单阐述了如何安装redis集群环境. 集群环境,主要包括2部分. 1.配置每个节点的配置信息(redis.conf),尤其开启cluster 2.创建集群redis-trib.rb创建集群. 过程非常简单,但非常繁琐,尤其配置各个集群节点的配置信息,如果有一定数量,工作量也不小. 没关系,redis提供了一款cluster工具,能快速构造集群环境.本章的主要内容是介绍redis提供的集群工具. 1.使用create-clus