nagios监控dell服务器硬件

之前讲过利用omsa来监控dell服务器,但是必须通过web来访问,这次我们结合nagios+check_openmanage来实现dell服务器的硬件监控。

首先我们来看下面这张图:

由上图看出有两种方式可以实现监控:

1.nagios服务器端check_nrpe调用被监控端的check_openmanage来实现,这种方式要在被监控端安装omsa和check_openmanage

2.nagios服务器端直接通过check_openmanage来远程监控,这种方式要在nagios服务器端安装perl-Net-SNMP,在被监控端安装omsa,snmp服务;其中先安装snmp服务,再安装omsa,这样omsa会自动更改snmp的配置文件以实现监控。

个人感觉:使用第二种方式更为方便,只需要安装即可;而第一种方式还需要再配置nagios客户端;另外,check_nrpe会消耗服务器性能;因此以下就是使用snmp来实现的。

一.配置nagios服务器端

1.在nagios服务器上安装check_openmanage

 wget http://folk.uio.no/trondham/software/files/check_openmanage-3.7.12.tar.gz
 tar -xvf check_openmanage-3.7.12.tar.gz
 cd check_openmanage-3.7.12
 cp check_openmanage /usr/local/nagios/libexec
 chown nagios.nagios /usr/local/nagios/libexec/check_openmanage
 cp man/check_openmanage.8 /usr/share/man/man8
 cp man/check_openmanage.conf.5 /usr/share/man/man5

2.在nagios服务器上安装perl-Net-SNMP

 Centos5
 wget http://mirrors.zju.edu.cn/epel/5/i386/epel-release-5-4.noarch.rpm
 rpm -ivh epel-release-5-4.noarch.rpm
 Centos6
 wget http://mirrors.zju.edu.cn/epel/6/i386/epel-release-6-8.noarch.rpm
 rpm -ivh epel-release-6-8.noarch.rpm

 yum install perl-Net-SNMP perl-Config-Tiny

SNMP监控模式下check_openmanage是需要perl-Net-SNMP支持的,否则会出现如下错误:

ERROR: You need perl module Net::SNMP to run check_openmanage in SNMP mode

至此我们的nagios服务器端已经安装完毕

二.配置被监控端

1.安装snmp服务

yum -y install net-snmp net-snmp-devel net-snmp-utils

2.安装omsa

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

yum install srvadmin-all

3.启动omsa服务

/opt/dell/srvadmin/sbin/srvadmin-services.sh start

4.查看端口

netstat -ntlp |grep :1311

如果有此端口则说明我们的srvadmin安装成功,如果没有可能是安装出现问题了;另外我们安装完后首次启动用/opt/dell/srvadmin/sbin/srvadmin-services.sh start,否则用service dataeng start启动可能会有问题,导致omsa没有完全启动。

注意:

(1)一定要先安装snmp服务再安装omsa,这样omsa会自动将你的snmp服务进行配置,如果顺序颠倒则可能会导致报一下错误:

ERROR: (SNMP) OpenManage is not installed or is not working correctly

这是因为我们的/etc/snmp/snmpd.conf配置文件有漏改的地方,主要是以下几处:(改正以后如下)

view    all            included      .1

access  notConfigGroup ""      any       noauth    exact  all    none   none

smuxpeer .1.3.6.1.4.1.674.10892.1

(2)如果报一下错误“SNMP CRITICAL: No response from remote host ‘X.X.X.X‘”,则说明被监控端没有安装snmp服务

三,配置监控项

1.配置command

#检查存储设备
define command {
    command_name check_storage
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only storage -p -s -b ctrl_fw=0
}
#检查cpu
define command {
    command_name check_cpu
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only cpu -p -s -b ctrl_fw=0
}
#检查内存
define command {
    command_name check_memory
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only memory -p -s -b ctrl_fw=0
}
#检查电源
define command {
    command_name check_power
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only power -p -s -b ctrl_fw=0
}
#检查温度
define command {
    command_name check_temp
    command_line $USER1$/check_openmanage -H $HOSTADDRESS$ --only temp -p -s -w $ARG1$ -c $ARG2$ -b ctrl_fw=0
}

其中--only是指只监控某一项,-p是进行画图,-s是状态描述,-b是黑名单,由于我们的服务器固件版本低,为不影响其他监控项在此我们将其加入黑名单将其剔除。

2.配置监控服务组

define servicegroup {
    servicegroup_name dell-openmanage
    alias   Dell server health status
}

3.配置监控服务

 define service{
    use                     local-service
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_storage
    check_command           check_storage
    service_groups          dell-openmanage
    notifications_enabled   1
    }
define service{
    use                     local-service
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_cpu
    check_command           check_cpu
    service_groups          dell-openmanage
    notifications_enabled   1
    }
define service{
    use                     local-service
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_memory
    check_command           check_memory
    service_groups          dell-openmanage
    notifications_enabled   1
    }
define service{
    use                     local-service
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_power
    check_command           check_power
    service_groups          dell-openmanage
    notifications_enabled   1
    }
define service{
    use                     local-service
    host_name               usvr-131,usvr-119,usvr-70,usvr-71,usvr-72,usvr-73,usvr-82,usvr-83,usvr-84,usvr-85,usvr-86,usvr-87
    service_description     omsa_temp
    check_command           check_temp!"0=30/15"!"0=40/10"
    service_groups          dell-openmanage
    notifications_enabled   1
    } 

4.检查配置文件及重新载入配置文件

nagioscheck

service nagios reload

四,防火墙配置

由于我们使用的是SNMP来监控,因此我们需要在被监控端对nagios服务器开启snmp端口udp 161

/sbin/iptables -A INPUT -i em1 -p udp -s 10.10.5.89 --dport 161 -m comment --comment "nagios snmp" -j ACCEPT

ok,至此dell服务器硬件监控配完。

时间: 2024-10-16 18:50:00

nagios监控dell服务器硬件的相关文章

zabbix企业应用:通过SNMP和iDRAC监控DELL服务器硬件

监控DELL服务器硬件一般有两种途径:1.操作系统上安装OMSA,编写脚本调用omreport命令进行监控:2.使用iDRAC,可以不用在操作系统上安装OMSA,只需要在iDRAC上开启SNMP,zabbix通过SNMP进行监控.对于不支持OMSA的操作系统和要求不能安装额外软件的情况下,推荐使用SNMP监控,配置简单方便. 一.iDRAC开启SNMP服务 进入iDRAC的WEB界面,打开"网络"->"服务"->"SNMP代理". 启

zabbix监控dell服务器硬件信息

说明:  公司的所有的服务器都是Dell服务器.为什么做这个监控呢?是因为线上的一台DB数据库的磁盘发生损坏.结果我们运维组人员(公司只有我一名,当然出了事由我个人负责了,想想还是自己技术欠缺)没有第一时间发现.于是网络搜寻zabbix去监控Dell服务器. 1.监控工具使用dell自带的omsa工具进行监控,下载安装omsa工具,并进行安装 wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash

一步一步配置 Dell OME 监控 Dell 服务器硬件报警

本文包括以下四个部分: 下载 Dell OME 安装 Dell OME 配置 Dell OME 配置 iDRAC 下载 Dell OME 以Dell PowerEdge R730xd 为例 1.登录 Dell 官方网站 http://www.dell.com.cn/ 2.打开技术支持--查看全部技术支持 3.在浏览产品中选择“服务器.存储和联网设备” 4.选择“PowerEdge” 5.在搜索框中检索我们的服务器型号“PowerEdge R730xd” 6.之后页面将自动跳转到 730xd 的支

【硬件】DELL服务器硬件监控及DELL系统管理工具OMSA介绍

1.1.1. DELL服务器硬件监控及DELL系统管理工具OMSA介绍 本文介绍采用使用Nagios和OMSA监控DELL服务器的硬件健康状态,Nagios监控的方式是NRPE模式,需要配置check_openmanage脚本和安装DELL的OMSA工具. 使用OpenManage和Nagios监控DELL服务器硬件部署手册: http://folk.uio.no/trondham/software/check_openmanage.html 1)        OMSA是什么 OMSA是Del

nagios监控实用教程

nagios监控实用教程 Nagios作为开源网络监视工具,它不但可以有效的监控内存.流量.数据库使用情况.它还可以Windows.Linux主机状态.本专题收录了有关Nagios监控相关文章,供大家参考学习. 标签:nagios nagios监控 监控工具 阅读量:26196收藏量:8 文章标题 阅读评论 作者 nagios网卡流量监控 trffic.sh 51/0 anyue0072017-04-26 nagios搭建(二):nagios监控windows主机 1203/0 fantefei

(Nagios)-check_openmanage[Dell]

Nagios->check_openmanage[Dell R7*] 2014年11月13日 下午 07:44 需求介绍: 透过Nagios监控Dell R7系列服务器硬件状态 环境信息: Nagios监控主机:xxx.xxx.xxx.xxx Nagios使用版本:3.2.3 NagioSQL: 3.2.0 Dell R710:xxx.xxx.xxx.xxx 监控逻辑: 1.Nagios通过插件check_nrpe 调用 check_openmange接收硬件信息. 2.服务器端SNMP服务通过

使用nagios监控HP服务器RAID

背景:单位在IDC机房选用了DELL和HP两种类型的服务器.对监控服务器硬件特别是RAID方面的信息,dell可以使用自带的OMSA程序进程监控.可是HP没有此方面的监控,服务器中的磁盘是最容易出现问题的,个人研究了多日发现可以使用下面的方式进行对HP服务器监控RAID. 使用nagios监控HP服务器的RAID: 前提本地服务器已经安装好nagios-plugin和nrpe模块,如果没有安装可以搜索一下,相关教程有很多,属于nagios的使用.这里只说一下如何监控raid. 当前使用的操作系统

nagios监控ESXi硬件

普通的服务器硬件监控我们可以通过nagios+openmanage来实现,但是vsphere环境中的Esxi主机的硬件监控怎么实现呢? 这里有两种方案: 1.通过nagios插件check_esx来实现,这种方式需要安装vmware vsphere sdk for perl工具包 2.通过nagios插件check_esxi_hardware.py来实现,此插件使用python写的. 感人感觉第二种方式比较简单些,python在linux天生内置,还需要更多理由吗? 先看看官网介绍: http:

icinga2通过check_hpasm监控HP服务器硬件报警

icinga2通过check_hpasm监控HP服务器硬件报警: https://labs.consol.de/nagios/check_hpasm/#download 被监控服务器需安装hp-snmp-agents # dpkg -i hp-snmp-agents_10.40-2909.34_amd64.deb # /sbin/hpsnmpconfig 输入y (即使用已有/etc/snmp/snmpd.conf配置) # tar zxfv check_hpasm-4.7.5.4.tar.gz