nagios新增监控集群、卸载监控集群批量操作

1.一定要找应用侧确认每台节点上需要监控的进程,不要盲目以为所有hadoop集群的zk、journal啥的都一样,切记!

2.被监控节点只需要安装nagios-plugin和nrpe,依赖需要安装xinetd

3.确认被监控节点上没有安装过nagios

4.确认被监控节点间、被监控节点和nagios server间的互信

5.开始

5-1 选择一个同操作系统的集群a的一个节点an,目标集群b

ssh an

for dn in cluster{an..b1}

do

echo "$dn is configuring the nagios............................."

ssh $dn useradd nagios -d /usr/local/nagios

scp -r /usr/local/nagios/ [email protected]$dn:/usr/local/

scp /etc/xinetd.d/nrpe  [email protected]$dn:/etc/xinetd.d/nrpe

ssh $dn ‘echo "nrpe            5666/tcp                #nrpe" >>/etc/services‘

ssh $dn ‘chown -R nagios:nagios /usr/local/nagios/‘

ssh $dn ‘service xinetd restart‘

echo "$dn is end configuring  the nagios........................"

done

5-2 在集群b上批量安装

ssh b1

for dn in cluster{b2..bn}

do

echo "$dn is configuring the nagios............................."

ssh $dn useradd nagios -d /usr/local/nagios

scp -r /usr/local/nagios/ [email protected]$dn:/usr/local/

scp /etc/xinetd.d/nrpe  [email protected]$dn:/etc/xinetd.d/nrpe

ssh $dn ‘echo "nrpe            5666/tcp                #nrpe" >>/etc/services‘

ssh $dn ‘chown -R nagios:nagios /usr/local/nagios/‘

ssh $dn ‘service xinetd restart‘

echo "$dn is end configuring  the nagios........................"

done

5-3 如果配置了logcheck /var/log/messages,一定要确认下/var/log/messages的权限是不是705

5-4 在server端增加新集群的配置文件

mkdir -p /usr/local/nagios/etc/servers/b

cd /usr/local/nagios/etc/servers/a

cat an.cfg|sed ‘s/an/bn/g‘|sed ‘s/an_ip/bn_ip/g‘>/usr/local/nagios/etc/servers/b/bn.cfg

5-5 在server端增加新集群的组配置文件

vi /usr/local/nagios/etc/servers/group.cfg

define hostgroup{

hostgroup_name b

alias b

members b1,....bn

}

6.集群下线

这次只是在nagios前台下线,下线集群保留nagios软件,升级后再重新监控

只需要在server端把该集群的所有配置删掉(移走)即可

注:不要想着修改权限。。。。。修改权限的结果就是nagios起不起来。。。

时间: 2024-10-13 19:49:25

nagios新增监控集群、卸载监控集群批量操作的相关文章

脚本自动部署构架集群和监控状态

脚本自动部署构架集群和监控状态 shell脚本编写自动部署.初始配置.并启动nginx反向代理服务 1 #!/bin/bash 2 systemctl disable firewalld 3 systemctl stop firewalld 4 setenforce 0 5 #### 6 yum install epel-release -y 7 yum -y install zlib zlib-devel openssl openssl--devel pcre pcre-devel 8 yum

Xtradb+Haproxy高可用数据库集群(四)集群zabbix监控篇

xtradb cluster集群zabbix监控 监控指标 官网参考地址: https://www.percona.com/doc/percona-xtradb-cluster/5.6/manual/monitoring.html 1.报警参数 每个集群节点状态: wsrep_cluster_status != Primary wsrep_connected != ON wsrep_ready != ON 复制冲突过高 wsrep_local_cert_failures wsrep_local_

使用Turbine对集群进行监控

为什么要使用Turbine Turbine是聚合服务器发送事件流数据的一个工具,hystrix的监控中,只能监控单个节点,实际生产中都为集群,因此可以通过turbine来监控集群下hystrix的metrics情况,通过eureka来发现hystrix服务. 如何使用Turbine 前提 新建一个springboot项目springboot-turbine 引入Turbine pom.xml: <dependencies> <!-- turbine依赖 --> <depend

分布式缓存技术redis学习系列(四)——redis高级应用(集群搭建、集群分区原理、集群操作)

本文是redis学习系列的第四篇,前面我们学习了redis的数据结构和一些高级特性,点击下面链接可回看 <详细讲解redis数据结构(内存模型)以及常用命令> <redis高级应用(主从.事务与锁.持久化)> 本文我们继续学习redis的高级特性--集群.本文主要内容包括集群搭建.集群分区原理和集群操作的学习. Redis集群简介 Redis 集群是3.0之后才引入的,在3.0之前,使用哨兵(sentinel)机制(本文将不做介绍,大家可另行查阅)来监控各个节点之间的状态.Redi

Hadoop集群管理--保证集群平稳地运行

本篇介绍为了保证Hadoop集群平稳地运行,需要深入掌握的知识,以及一些管理监控的手段,日常维护的工作. HDFS 永久性数据结构 对于管理员来说,深入了解namenode,辅助namecode和datanode等HDFS组件如何在磁盘上组织永久性数据非常重要. 洞悉各文件的用法有助于进行故障诊断和故障检出. namenode的目录结构 namenode被格式化后,将在${dfs.namenode.name.dir}/current 目录下,产生如下的目录结构:VERSION.edits.fsi

redis高级应用(集群搭建、集群分区原理、集群操作)

文章主目录 Redis集群简介 Redis集群搭建 Redis集群分区原理 集群操作 参考文档 本文是redis学习系列的第四篇,前面我们学习了redis的数据结构和一些高级特性,点击下面链接可回看 <详细讲解redis数据结构(内存模型)以及常用命令> <redis高级应用(主从.事务与锁.持久化)> 本文我们继续学习redis的高级特性--集群.本文主要内容包括集群搭建.集群分区原理和集群操作的学习. 回到顶部 Redis集群简介 Redis 集群是3.0之后才引入的,在3.0

Ceph 存储集群 - 搭建存储集群

一.准备机器 本文描述如何在 CentOS 7 下搭建 Ceph 存储集群(STORAGE CLUSTER). 一共4台机器,其中1个是管理节点,其他3个是ceph节点: hostname ip role 描述 admin-node 192.168.0.130 ceph-deploy 管理节点 node1 192.168.0.131 mon.node1 ceph节点,监控节点 node2 192.168.0.132 osd.0 ceph节点,OSD节点 node3 192.168.0.133 o

老nginx集群向tengine集群的升级改造,性能提升数倍

集群服务器使用nginx+fpm(php)的结构,这种结构的性能很大程度的瓶颈在fpm这一层,随着业务发展,访问量的增加,为了保证用户体验,我们在通过各种手段去提升集群的吞吐量和服务质量--机器扩容.业务分池.MC/REDIS的local化等等,做下来看到的效果是明显的,不过量级上的提升还是迫切需要,于是想到了在web服务器上在下下功夫,集群使用的nginx版本有点历史,版本就不说了,不过一直跑的都很健壮,所以没从想过更换,一个简单的事情促使我想测试更换为tengine,那就是worker进程数

Mongodb集群部署以及集群维护命令

Mongodb集群部署以及集群维护命令 http://lipeng200819861126-126-com.iteye.com/blog/1919271 mongodb分布式集群架构及监控配置 http://freeze.blog.51cto.com/1846439/884925/ 见文中: 七.监控配置:      早在去年已经出现MongoDB和Redis的Cacti模板,使用它,你可以对你的MongoDB和Redis服务进行流量监控.cacti的模板一直在更新,若企业已经用到nosql这种

Redis集群演变和集群部署

Redis系列: Redis安装和配置 Redis基本数据结构 Redis核心原理 Redis集群演变和集群部署 Redis高可用集群之水平扩展 一.Redis集群方案比较 哨兵模式 在redis3.0以前的版本要实现集群一般是借助哨兵sentinel工具来监控master节点的状态,如果master节点异常,则会做主从切换,将某一台slave作为master,哨兵的配置略微复杂,并且性能和高可用性等各方面表现一般,特别是在主从切换的瞬间存在访问瞬断的情况,而且哨兵模式只有一个主节点对外提供服务