服务器远程监控管理(四)-统一监控管理

前几章介绍了DELL服务器的远程管理功能(以DELL为例,HP,IBM等也都有类似的功能模块),当我们服务器很多的时候,我们不可能每天每台服务器都去查看一下硬件状态,因此我们希望有一个统一的平台,硬件有问题时自动给我们发一个警报邮件,或者我们每天登上统一平台扫一眼,无警报信息,我们就可以安心做其他事情去了。

DELL提供了一个这样的统一管理平台软件,而且是免费的(个别高级功能需收费,但一般免费的功能即可满足日常监控使用)。这个软件就是:OpenManage Essentials 。

先来看看界面:

红色的是严重问题,***的是警告。只要没有这两种告警,你就可以安心去做其他事了。如果有警告,双击一下就可看到详细信息。对于已经处理过的警报信息,也可以手动清除,防止每次登上来都被警报吓一跳。是不是一目了然,很方便?

软件及要求:Open Manage Essentials  (以下简称OME)

OS:Windows 2008 标准版本或企业版(32Bit Or 64Bit)及 R2 版本

数据库Microsoft SQL 企业版本 (监控设备500台以上使用)或 Express版本(监控少量使用,测试使用此版本)

以下是安装配置步骤:

A.安装(操作系统安装略,以下为OME安装过程)

1.  去DELL官网下载OME软件软件包.

2.  双击 OME 的可执行文件,显示OME安装对话框

3.  在安装OME之前需要安装部份系统组件,也可在安装OME的过程中通过软件显示安装OME需要预装组件对话框的提示进行组件安装

以下为安装各组件的对话选项

安装SNMP

安装IIS

安装.NET Runtime

安装ASP.NET

系统提示需要重启方可继续安装进程,选择OK

重启完成后继续安装Silveright

安装Visual Studio

安装IPMI (可选)

安装DRAC Tools (可选)

安装SQL Express 2008

4.  安装组件完成后进入OME安装进程

选择“Install Essentiats”

选择“Next”

选择“I accept the terms in the license agreement” 后 “Next”

选择“Typical”后“Next”

注:如选择“Custom”需要选择自定义数据库及认证用户名等操作。

最后选择“Install”进行安装操作

安装完成后的截图如下:

安装完成后,进行操作系统对组件服务及OME软件进行相应设置

设置SNMP服务

打开Server Manager中的Services,设置如下

如OME服务器也安装OMSA需要监控,则在Trap Destinations添加OME服务器自身IP,主动发送服务器信息。

PS: 在Security中“OME”为认证的团体名称,相当于Password的功能,如目标的受控端团体名称不一致,则无法对相关的服务器进行监控。

另在OMSA服务器设置如下

PS:在OMSA中设置Traps,目标为OME的IP,如默认不填的情况下,OME则会轮询OMSA客户端的服务器情况,如客户端出现故障,可能因为轮询时间的问题,导致故障信息无法及时接收,故在Trap Destinations中填上OME的IP,当在客户端发生问题时,OMSA会主动发送故障信息,而不是当OME轮询到OMSA时发现故障时才发送故障信息。

以上设置完成之后,打开OME进行搜索管理设置

B.发现与资源清单

1.  打开OME的查找门户资源

2.  在查找设备中输入目标服务器的IP

3.  在“ICMP配置”中“下一步”;

4.  在“SNMP 配置”中输入“OME”如下图;

5.  在“WMI”中默认,下一步;

6.  在“存储配置”保持默认下一步;

7.  在“WS-Man 凭证”中默认下一步;

8.  在“IPMI 配置”中保存默认下一步;

9.  在“查找范围操作”中默认下一步;

10.完成以上设置后单击“完成”;

11.在完成上图的步骤后,在查找范围中右键要搜索的IP选择“立即执行查找和资源清册”

12.搜索完成在管理的设备中可看到目标服务器的信息

13.查看服务器硬件日志

14.查看服务器警报日志

C.管理监控

 

1.在OME的首选项中设置邮件SMTP及认证用户名密码设置

2.在“警报”中的电子邮件右键“新建邮件通知”

3.在名称中输入“OME”选择“下一步”

4.输入发件者和目标收件者邮件地址,并单击“检测措施”

在完成的窗口中选择“确定”

5.在目标收件者邮件中发现发送的测试邮件,说明邮件设置正确;

6.在邮件通知中选择通知的事件程度

7.全选类别和源关联

8.在设备关联中选择所要监控的设置,本例选择“Servers”

9.在通知日期上,可以不选默认所有时间,也可以根据需要选择时间;

10.设置摘要,完成即可

11.测试禁用网卡后的监控报警情况;

12.目标收件者收到由于禁用网卡后的报警邮件;

13.恢复启用网卡;

14.目标收件者收到网卡恢复邮件

15.以上为测试是在OME轮询的情况下检测服务器不在线时把警报邮件为关机的情况,根据轮询的情况,警报邮件可能会较迟发送,对服务器在线情况下OMSA主动将服务器故障等事件信息实时通过OME发送邮件警报

16.服务器在线情况下见通过对服务器硬盘进行“闪烁”测试,OME警报邮件比轮询的情况下快

16.1.在受控服务器OMSA中对物理磁盘进行“闪烁”操作

16.2.目标收件人收到因“闪烁”事件邮件

16.3.在受控服务器的OMSA中“取消闪烁”操作

16.4.目标收件人收到警报日志恢复操作

17.以上的“闪烁”操作,发出的警报日志较实时,故在实际的环境中,务必在SNMP Trap Destinations设置OME的服务器IP。

配置完毕。

时间: 2024-10-16 15:21:02

服务器远程监控管理(四)-统一监控管理的相关文章

zabbix管理四之监控cpu的负载

监控cpu的负载 分析: 安装完zabbix后,在Template OS Linux这个模板下面默认有监控cpu负载的触发器,但是这个默认的触发器是以cpu负载的个数为触发值的,由于agent客户机每台的cpu核数是不一样的,所以,以负载的个数为触发值不是很好,下面我设置的触发值是cpu负载占cpu核数的百分比 步骤: 1.(agent端) mkdir -p /etc/zabbix/itemscripts         (创建一个脚本目录,所有的zabbix agent的脚本都放在这里,方便管

统一身份管理中的权限管理设计

关注嘉为科技,获取运维新知 权限集中管理是统一身份管理关注的主要内容之一,由于企业应用建设的自身历程不同,权限设计与实现也必然存在差异,针对集中权限管理的设计和实现带来了不小的挑战,本文根据多年的实践经验,就统一身份管理的集中权限管理的设计与实现给予设计建议. 一 问题背景 随着信息技术和网络技术的迅猛发展,企业内部的应用系统越来越多,为此,为减少用户访问的麻烦,提升访问的便利性和体验,众多企业采用了统一身份管理的方案来解决该问题. 就企业的统一身份管理,业界提出了相应的标准,即4A标准,分别是

五项管理 (目标管理,行动管理,心态管理,时间管理,学习管理)小册子总结

一.目标管理 有目标者自有千计万计,无目标者只感千难万难 目标不明确,努力再多也是劳而无功 方向不对,努力白费 做对的事情,比把事情做对还重要 人之所以伟大,是因为目标而伟大 世界上没有懒惰的人,只有没有目标的人,没有目标就没有动力 没有目标的航船,所有的风就是逆风 完成你该做的事情,才能做你想做的事情 利润是检验企业成功的唯一标准 有5%的目标,有要付出100%的努力 猎人眼里应该只有奔跑的兔子,而不是其他的什么东西 目标聚集原则,目标要单一,专注 万人操弓,只射一招,招无不中.——吕氏春秋

服务器远程监控管理(二)-系统安装报错0xc0000001

故障现象:新购的DELL服务器,新的光驱,新刻录的光盘.安装操作系统,报0xc0000001错误,如下图:  (这么多年的老IT竟被安装系统给绊住了,真想骂娘) 故障测试:更换光驱.光盘,反复重起安装,问题依旧. 故障处理: 1. 经和DELL厂商沟通,产生此错误的原因就是光驱或光盘原因导致读盘有问题,因而无法继续安装. 2. 厂商建议1)更换光盘光驱再试    2)采用远程管理卡(IDRAC卡)网络安装操作系统. 解决方法: 1. 对于厂商给的建议1,因为已试过多次,没有再试. 2. 采用厂商

JITStack统一监控平台与事态管理

事态管理(Event Management),原来称作事件管理,是ITIL运营管理体系中的一个主要流程之一.所谓Event(事态)是指对于配置项或IT服务有重要意义的状态变化.比如IT系统中的服务器.从启动状态变为关机状态.一个应用服务状态从Up到down的状态变化等等.Event一词还用于表示任何 IT 服务.配置项或监视工具创建通知.事态通常需要 IT 运营人员采取行动,并且通常导致事件记入日志.在ITIL V4中事态管理已经更新为监控与事态管理. 高效的IT服务运营有赖于对于基础设施.操作

Oracle数据库精讲课程之Rac管理(集群组件、性能监控及调整、节点管理、备份和恢复)

对这个课程有兴趣的朋友可以加我的QQ2059055336和我联系 本课程主要是介绍Oracle RAC体系结构与工作机制,了解并掌握RAC数据库下的相关技术,如:cache Fusion. Failover.load balance.FAN.OCR和Voting disk等,通过VMWARE虚拟环境,实践演练RAC数据库的安装部署.RAC数据库日常性能监控.备份和恢复.实例增加和删除以及补丁安装等操作,通过本课程的学习,学员在掌握RAC理论知识基础上,能够熟练掌握RAC数据库的日常管理操作. 课

服务器远程管理工具 好用的Windows远程桌面工具分享给你

IIS7远程桌面程序截图更新日志:2020版远程桌面截图于2020年1月8日更新IIS7远程桌面管理主要用于企业远程管理和远程办公,可以连接多台电脑,进行远程控制,能够快速连接.支持批量控制多台电脑.分组查询......1.批量管理WIN系列服务器,VPS,电脑.        2.批量导入服务器的IP,端口,账号和密码3.批量打开N个服务器的远程桌面                    4.远程桌面后,远程窗口右上角会出现 服务器备注的信息5.远程桌面后,不影响任务栏显示可以及时看其他窗口.

【运维监控】四款云服务监控工具介绍:Nagios 、 ganglia、zabbix、onealert

在我们日常的工作中,有时候需要监控和管理平台的运行状况,而服务运行是否存在异常,是否有软硬件bug等,均需要第一时间知道.对服务状态了如指掌,是一个很重要的事情.那么这个如何做到呢,我们之前在进行私有云平台研发过程中,曾经用过一些工具,在一定程度上能帮到大家,这里记录一下,希望对有需要的同学有帮助. 一些常见的监控.告警工具:Nagios . ganglia.zabbix.onealert 一.Nagios: Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Uni

zabbix实现mysql数据库的监控(四)

前面介绍的内容都是用第三方开发好的插件进行mysql监控的,可能有些我们关心的监控内容并不在其中,这时一种常用的方法就是定义我们自己的脚本并将它整合到zabbix中,从而在原有监控的基础上进行有力的补充.下面通过使用脚本来监控主从复制状态并进行报警通知. 先来介绍zabbix中几个常用的术语: 主机(host): 要监控的网络设备,可由ip或DNS名称指定. 主机组(host group): 主机的逻辑容器,可以包含主机和模板,但同一个组内的主机和模版不能互相链接,主机组通常在组用户或用户组指派

软件项目开发环境构建之五:Confluence、Jira、Bitbucket统一账户管理

在多个系统中,用一个账户能够登陆多个系统并具备角色授予的权限(所谓的单点登陆),无疑是最受人欢迎的,Atlassian软件家族可以通过多种方式来整合各系统的用户,常用的有: 1.通过统一使用外部数据库统一用户管理. 2.通过LDAP服务器进行统一用户管理. 3.通过微软活动目录统一用户管理. 4.通过Jira或Crowd的用户服务器来统一用户管理. 实际上还支持更多的统一用户管理方式,但最方便快捷的要属通过Jira的用户服务器来统一用户管理. Atlassian各软件可以通过一个JIRA用户服器