使用nagios监控HP服务器RAID

背景:单位在IDC机房选用了DELL和HP两种类型的服务器。对监控服务器硬件特别是RAID方面的信息,dell可以使用自带的OMSA程序进程监控。可是HP没有此方面的监控,服务器中的磁盘是最容易出现问题的,个人研究了多日发现可以使用下面的方式进行对HP服务器监控RAID。

使用nagios监控HP服务器的RAID:

前提本地服务器已经安装好nagios-plugin和nrpe模块,如果没有安装可以搜索一下,相关教程有很多,属于nagios的使用。这里只说一下如何监控raid.

当前使用的操作系统为centos5.1

1。监控RAID:

(1)下载安装hpasmcli,此模块用来检测HP服务器的raid以及磁盘情况:

#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm

(2)安装完成后,默认生成的可执行文件为:

/usr/sbin/hpacucli

使用以下命令可以对服务器硬盘和RAID进行检测:

$ sudo /usr/sbin/hpacucli ctrl slot=0 pd all show status

physicaldrive 1I:1:1 (port 1I:box 1:bay 1, 300 GB): OK

physicaldrive 1I:1:2 (port 1I:box 1:bay 2, 300 GB): OK

physicaldrive 1I:1:3 (port 1I:box 1:bay 3, 300 GB): OK

$ sudo /usr/sbin/hpacucli ctrl slot=0 logicaldrive all show|grep RAID

logicaldrive 1 (558.7 GB, RAID 5, OK)

(3)编辑脚本,使nrpe可以调用:

#!/bin/bash

#First create date:2016/01/07

#Author:kunka

#定义nagios返回状态

STATE_OK=0

STATE_WARNING=1

STATE_CRITICAL=2

STATE_UNKNOWN=3

STATE_DEPENDENT=4

i=1

#设置变量

DISK_COM=$(sudo /usr/sbin/hpacucli ctrl slot=0 pd all show status|awk ‘{print $9}‘)

DISK_ERR=$(sudo /usr/sbin/hpacucli ctrl slot=0 pd all show status|grep -v OK)

DISK_RAID=$(sudo /usr/sbin/hpacucli ctrl slot=0 logicaldrive all show|grep RAID)

if [ $? -eq 0 ];then

for OK in $DISK_COM

do

if [ $OK = ‘OK‘ ];then

i=$(($i+1))

else

echo "Warning:" $DISK_ERR,$DISK_RAID

exit $STATE_CRITICAL

fi

done

echo "OK-RAID:" $DISK_RAID

exit $STATE_OK

else

echo ‘Unkonwn! hpacucli can not to exec.‘

exit $STATE_UNKNOWN

fi

(4)由于nrpe一般都设置为nagios用户执行,因此需要使用sudo权限,修改/etc/sudoers文件:

#vim /etc/sudoers

Defaults    requiretty   --注释掉

nagios  ALL=NOPASSWD:/usr/sbin/hpacucli

:wq

保存退出

(5)配置nrpe文件:
将上面的脚本复制到usr/local/nagios/libexec/目录下,然后编辑

#vim nrep.cfg

command[check_raid]=/usr/local/nagios/libexec/check_raid.sh

启动nrpe:

#sudo /usr/local/nagios/bin/nrpe -d /usr/local/nagios/etc/nrpe.cfg

(6)配置nagios文件:

1)添加主机文件

2)修改nagios.cfg文件

3) 检查nagios配置文件

sudo /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

3)重启nagios服务

时间: 2024-10-25 01:06:46

使用nagios监控HP服务器RAID的相关文章

Nagios监控HP硬件状态

Nagios监控HP硬件状态 一,监控思想 可以使用两种模式,check_nrpe方式和SNMP方式,这里我们采用SNMP代理方式. 两种方式都依赖HP的ProLiant Support Pack(PSP)软件包,有两种方式安装PSP包,一种tar包,一种RPM包,经过实践tar包很难安装,所以最终采用rpm包方式. 二,实施步骤 1,到 http://downloads.linux.hp.com/SDR/getting_started.html 下载 add_repo.sh 脚本,并上传到HP

通过check_ilo2_health.pl插件监控HP服务器健康状态

通过check_ilo2_health.pl插件监控HP服务器健康状态: 下载地址: https://exchange.nagios.org/directory/Plugins/Hardware/Server-Hardware/HP-(Compaq)/check_ilo2_health/details 使用示例: /usr/lib64/nagios/plugins/check_ilo2_health.pl --ilo3 -u aa -p'xxxxxx' -H 10.0.0.3 注:1.密码带特殊

监控HP服务器CPU温度的脚本

监控HP服务器CPU温度的脚本: #!/bin/bash Name=`hostname` IP=`/sbin/ifconfig eth0 | grep "inet addr" | awk -F[:" "]+ '{print $4}'` Date=`date +%m%d%y` Date2=`date +%H:%M` Num=`/usr/sbin/dmidecode | grep -i 'serial number' | head -n 1` CPU1=`/sbin/h

Nagios 监控mysql服务器详细实现过程

1.NRPE介绍 NRPE是Nagios的一个功能扩展,它可在远程Linux/Unix主机上执行插件程序.通过在远程服务器上安装NRPE插件及Nagios插件程序来向Nagios监控平台提供该服务器的本地情况,如CPU负载,内存使用,磁盘使用等.这里将Nagios监控端称为Nagios服务器端,而将远程被监控的主机称为Nagios客户端. Nagios监控远程主机的方法有多种,其方式包括SNMP,NRPE,SSH,NCSA等.这里介绍其通过NRPE监控远程Linux主机的方式. NRPE(Nag

HP服务器RAID配置

公司服务器硬盘空间不够了(HP的服务器),购买了10块硬盘,由于之前没有做过RAID,感觉很高大上的样子,就请教了HP的技术人员,技术人员发了两份文档,分别是DL380G7(DL580G7)和DL388G9创建RAID的方法,放在博客上,方便查询.废话不多说,看下面文档 : DL380G7(DL580G7): 配置过程如下: 1. 开机自检检测到HP Smart Array P410 (如果没有看到这个信息, 自检的时候会提示按任意键(当看到press any key to view rom r

check mk 监控 HP服务器

1.创建repo文件vi /etc/yum.repos.d/hp-mngmt.repo [HP-spp] name=HP Service Pack for ProLiant baseurl=http://downloads.linux.hpe.com/SDR/repo/spp/RHEL/$releasever/x86_64/current/ enabled=1 gpgcheck=0 gpgkey=file:///etc/pki/rpm-gpg/GPG-KEY-ssp [HP-mcp] name=

监控HP服务器cpu状态脚本

脚本1(如有问题则发邮件通知): # vi cpu.sh 按a或i进入编辑模式 #!/bin/bash Name=`hostname` IP=`/sbin/ifconfig eth0 | grep "inet addr" | awk -F[:" "]+ '{print $4}'` Date=`date +%m%d%y` Num=`/usr/sbin/dmidecode | grep -i 'serial number' | head -n 1` CPU=`/sbin

Zabbix通过SNMP监控HP服务器硬件信息

关于Zabbix监控服务器硬的件信息,Zabbix官方网站没有提到这方面的监控思路和方法.之前我写的博文中写过关于HP服务器硬件监控的文章,大致的思路是借助HP管理工具通过脚本的方式取出硬件的信息,然后以trapper的方式通过Zabbix监控,得到好多博友的支持,在此特别的感谢.    通过脚本的方式监控服务器硬件信息,有三个缺点1)通过agent的方式会超时,取不到值.2)通过trapper的方式需要每台机器添加crontab,部署起来麻烦.3)脚本通用型查,只适合Windows机器.4)

Linux系统搭建Nagios监控平台

一.首先在Nagios监控的服务器部署 # 安装Nagios软件及其依赖的软件 [[email protected] ~]# yum install -y httpd php gcc glibc glibc-common net-snmp nagios nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe gd gd-devel openssl openssl-devel # 定义Nagios登陆的账号与密码 [[email pro