HP Gen9系列 服务器健康监控灯报警,系统诊断无错

原服务器标机自带一个服务器电源,后加了一个电源,进F10诊断,监控灯亮琥珀色

解决过程:1、进行对调测试,PS1与PS2位电源进行位置对调,检测失败

2、进行单电源测试,检测OK,电源正常

3、更换电源,单电源测试OK

4、新换与原电源进行搭组测试,一组OK,一组失败

故障原因:原服务器PS2位电源,兼容性错误,更换OK

时间: 2024-10-04 13:20:43

HP Gen9系列 服务器健康监控灯报警,系统诊断无错的相关文章

如何配置服务器自动监控并报警

作者:一个懂技术的运营 链接:https://www.zhihu.com/question/21073555/answer/106131463 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 如果是初创型公司,机器规模和工作流转没有那么复杂的情况下.运维监控和报警,都利用 Zabbix 和一些报警聚合服务. 先来说说,我们公司如何利用 Zabbix 监控和报警的吧. Zabbix 配置报警 其实线上的教程很多:Zabbix 的图文安装教程 . 下面自己 Zabb

通过check_ilo2_health.pl插件监控HP服务器健康状态

通过check_ilo2_health.pl插件监控HP服务器健康状态: 下载地址: https://exchange.nagios.org/directory/Plugins/Hardware/Server-Hardware/HP-(Compaq)/check_ilo2_health/details 使用示例: /usr/lib64/nagios/plugins/check_ilo2_health.pl --ilo3 -u aa -p'xxxxxx' -H 10.0.0.3 注:1.密码带特殊

如何配置nagios监控SUN(富士通)MX000系列服务器的XSCF

配置环境说明 192.168.3.80-XSCF地址 192.168.2.80-solaris操作系统IP地址 (nagios客户端) 192.168.2.120-nagios服务器端 check_xscf.pl-检查xscf的执行脚本,放在nagios客户端上. check_xscf.cfg-检查xscf的配置文件,主要用于设置温度和电压的阈值,放在nagios客户端上. 脚本下载地址:http://exchange.nagios.org/directory/Plugins/Uncategor

使用云监控实现GPU云服务器的GPU监控和报警(下)-云监控插件监控

摘要: 目录 使用云监控实现GPU云服务器的GPU监控和报警(上) - 自定义监控 使用云监控实现GPU云服务器的GPU监控和报警(下)-云监控插件监控 1 背景 上一篇文章我们介绍了如何使用阿里云云监控服务提供的自定义监控功能,利用自定义监控提供的API或者SDK,通过自定义脚本可以将GP. 1 背景上一篇文章我们介绍了如何使用阿里云云监控服务提供的自定义监控功能,利用自定义监控提供的API或者SDK,通过自定义脚本可以将GPU云主机内采集的GPU数据上报,在云监控控制台上添加相应的GPU监控

服务器远程监控管理(四)-统一监控管理

前几章介绍了DELL服务器的远程管理功能(以DELL为例,HP,IBM等也都有类似的功能模块),当我们服务器很多的时候,我们不可能每天每台服务器都去查看一下硬件状态,因此我们希望有一个统一的平台,硬件有问题时自动给我们发一个警报邮件,或者我们每天登上统一平台扫一眼,无警报信息,我们就可以安心做其他事情去了. DELL提供了一个这样的统一管理平台软件,而且是免费的(个别高级功能需收费,但一般免费的功能即可满足日常监控使用).这个软件就是:OpenManage Essentials . 先来看看界面

服务器状态监控之snmp&ipmi

一.ipmi 1.简介 IPMI(Intelligent Platform Management Interface)即智能平台管理接口是使硬件管理具备"智能化"的新一代通用接口标准 开源的免费标准.跨不同操作系统 监视服务器的物理健康特征,如温度.电压.风扇工作状态.电源供应及机箱入侵等 核心部件:BMC(Baseboard Management Controller),一种嵌入式微控制器,整个平台管理的大脑, ipmi所有功能都是通过BMC发送命令来完成,BMC接受并在系统事件日志

我的前端故事----来聊聊react-native应用的健康监控

监控什么 今天我们来聊聊如何监控你的应用程序,这里的监控说的不是让我们去监控用户,而是监控应用的健康状态,什么是健康状态呢?对于后端的同学来说,在微服务的架构下,每个子服务是否正常工作.返回的结果是否满足预期,这些就算是健康状态,再举个例子,你的台式机,对于操作系统来说,每个硬件是否能正常的工作.工作的稳定性,这些都是需要关注的健康状态. 既然我们关心健康状态,那么我们该如何衡量一个"设备"的健康状态呢?对于上面的例子,CPU运行的温度.硬盘读取的速度.子服务执行的效率,这些都可以作为

支持万台服务器分布式监控系统原始手稿

作者:付炜超 如果你本来打算做一个特别牛的东西,最终不管什么原因没做到,但是你实现的也够cool了! 需求分析: 随着现在的企业不断的发展壮大,大多数的企业都出现了分公司.办事处这类的分支机构,由于总公司还要求对下面子公司的网络设备.主机等资源的状态有着相关的了解,所以就要求IT运维部门对不在同一地域的网络.主机等资源都要进行监控. 功能分析: 1.一个监控系统往往需要集成资产管理,可以从逻辑上展示业务和功能的信息,通过对其进行数据分析,做到对投资与回报的一个反馈展示,为资产的合理规划与使用提供

后端线上服务监控与报警方案

一.背景 1.上线期间服务稳定性观察较困难 一个功能上线后,其实研发心里根本没底儿,不知道这个功能上线以后是不是真的没问题:有经验一些老同学还知道直接登录线上机器去tail -f php.error.log,但是对于新同学来说,基本就只能等着被通知服务故障. 退一步说,即便是能去线上去tail -f查看错误日志,但是线上是多集群部署的,服务器都特别多,研发不可能在每一台机器上都能看到日志:即便是有日志收集机器,也得在各个集群下分别tail -f,定位问题很不方便! 再退一步说,即便是在线上机器看