运维监控基础

一、运维监控基础
1.报告网路/系统/业务运行状况
2.提前发现被监控设备的问题

二、监控的资源类别
硬件监控:CPU、内存、磁盘I/O
系统监控:存活状态、进程数、用户数、磁盘使用率
网络监控:故障点监测、出站流量、入站流量
应用监控:Web/FTP等服务、TCP/UDP端口检测

三、监控服务平台
Cacti---------基于SNMP协议的监控软件,强大的绘图能力
Nagios-------基于Agent监控,强大的报警机制。插件扩展
Zzbbix-------基于Agent+SNMP多种监控手段,模板丰富

四、zabbix体系架构

五、linux系统人为监控
linux服务器检测:
cpu负载:uptime
用户登录:who | wc -l、/var/log/secure
进程数: pgrep -c
网络: ping、netstat、iptraf-ng

六、部署监控平台
1.查看网卡,设置网络参数
[[email protected] ~]# nmcli device status
DEVICE TYPE STATE CONNECTION
virbr0 bridge 连接的 virbr0
ens33 ethernet 已断开 --
lo loopback 未托管 --
virbr0-nic tun 未托管 -

[[email protected] ~]# nmcli connection modify ens33 ipv4.method manual ipv4.addresses 192.168.10.120/24 ipv4.gateway 192.168.10.254 ipv4.dns 8.8.8.8
[[email protected] ~]# nmcli connection up ens33
连接已成功激活(D-Bus 活动路径:/org/freedesktop/NetworkManager/ActiveConnection/3)
[[email protected] ~]# hostnamectl set-hostname zbx.tedu.cn
[[email protected] ~]# hostname
zbx.tedu.cn

2.部署环境添加本地域名记录
[[email protected] ~]# vim /etc/hosts

3.装包,安装并启用LAMP网站平台
[[email protected] ~]# yum -y install httpd mariadb-server mariadb php php-mysql
已加载插件:fastestmirror, langpacks
Loading mirror speeds from cached hostfile
软件包 httpd-2.4.6-80.el7.centos.x86_64 已安装并且是最新版本
软件包 1:mariadb-server-5.5.56-2.el7.x86_64 已安装并且是最新版本
软件包 1:mariadb-5.5.56-2.el7.x86_64 已安装并且是最新版本
正在解决依赖关系
--> 正在检查事务
---> 软件包 php.x86_64.0.5.4.16-45.el7 将被 安装
--> 正在处理依赖关系 php-common(x86-64) = 5.4.16-45.el7,它被软件包 php-5.4.16-45.el7.x86_64 需要
--> 正在处理依赖关系 php-cli(x86-64) = 5.4.16-45.el7,它被软件包 php-5.4.16-45.el7.x86_64 需要
---> 软件包 php-mysql.x86_64.0.5.4.16-45.el7 将被 安装
--> 正在处理依赖关系 php-pdo(x86-64) = 5.4.16-45.el7,它被软件包 php-mysql-5.4.16-45.el7.x86_64 需要
--> 正在检查事务
---> 软件包 php-cli.x86_64.0.5.4.16-45.el7 将被 安装
---> 软件包 php-common.x86_64.0.5.4.16-45.el7 将被 安装
--> 正在处理依赖关系 libzip.so.2()(64bit),它被软件包 php-common-5.4.16-45.el7.x86_64 需要
---> 软件包 php-pdo.x86_64.0.5.4.16-45.el7 将被 安装
--> 正在检查事务
---> 软件包 libzip.x86_64.0.0.10.1-8.el7 将被 安装
--> 解决依赖关系完成
………..
已安装:
php.x86_64 0:5.4.16-45.el7 php-mysql.x86_64 0:5.4.16-45.el7

作为依赖被安装:
libzip.x86_64 0:0.10.1-8.el7 php-cli.x86_64 0:5.4.16-45.el7
php-common.x86_64 0:5.4.16-45.el7 php-pdo.x86_64 0:5.4.16-45.el7

4.开启服务并设置开机自运行
[[email protected] ~]# systemctl restart httpd mariadb
[[email protected] ~]# systemctl enable httpd mariadb
Created symlink from /etc/systemd/system/multi-user.target.wants/httpd.service to /usr/lib/systemd/system/httpd.service.
Created symlink from /etc/systemd/system/multi-user.target.wants/mariadb.service to /usr/lib/systemd/system/mariadb.service.

5.关闭防火墙、禁用SElinux机制
[[email protected] ~]# systemctl stop firewalld.service
[[email protected] ~]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
[[email protected] ~]# setenforce 0
[[email protected] ~]# vim /etc/selinux/config


6.zabbix软件安装
(1)在线装(能访问英特网)


(2)离线安装(下载必要的软件包)
使用yum本地安装
[[email protected] ~]# yum -y install zabbix-server/*.rpm
已加载插件:fastestmirror, langpacks
正在检查 zabbix-server/fping-3.10-1.el7.x86_64.rpm: fping-3.10-1.el7.x86_64
zabbix-server/fping-3.10-1.el7.x86_64.rpm 将被安装
正在检查 zabbix-server/iksemel-1.4-2.el7.centos.x86_64.rpm: iksemel-1.4-2.el7.centos.x86_64
zabbix-server/iksemel-1.4-2.el7.centos.x86_64.rpm 将被安装
正在检查 zabbix-server/php-bcmath-5.4.16-45.el7.x86_64.rpm: php-bcmath-5.4.16-45.el7.x86_64
……..
已安装:
fping.x86_64 0:3.10-1.el7 iksemel.x86_64 0:1.4-2.el7.centos
php-bcmath.x86_64 0:5.4.16-45.el7 php-mbstring.x86_64 0:5.4.16-45.el7
zabbix-agent.x86_64 0:3.4.14-1.el7 zabbix-get.x86_64 0:3.4.14-1.el7
zabbix-server-mysql.x86_64 0:3.4.14-1.el7 zabbix-web.noarch 0:3.4.14-1.el7
zabbix-web-mysql.noarch 0:3.4.14-1.el7

作为依赖被安装:
OpenIPMI-libs.x86_64 0:2.0.23-2.el7 OpenIPMI-modalias.x86_64 0:2.0.23-2.el7
php-gd.x86_64 0:5.4.16-45.el7 php-ldap.x86_64 0:5.4.16-45.el7
php-xml.x86_64 0:5.4.16-45.el7 t1lib.x86_64 0:5.1.2-14.el7
unixODBC.x86_64 0:2.3.1-11.el7

7.配置php解析环境
[[email protected] ~]# vim /etc/httpd/conf.d/zabbix.conf


改时区环境保存退出

8.重启httpd
[[email protected] ~]# systemctl restart httpd

9.初始化数据库
创建新库zabbix 支持UTF8字符集
授权用户zabbix 密码123 允许从本机访问
[[email protected] ~]# mysql -u root
Welcome to the MariaDB monitor. Commands end with ; or \g.
Your MariaDB connection id is 2
Server version: 5.5.56-MariaDB MariaDB Server

Copyright (c) 2000, 2017, Oracle, MariaDB Corporation Ab and others.

Type ‘help;‘ or ‘\h‘ for help. Type ‘\c‘ to clear the current input statement.

MariaDB [(none)]> create database zabbix character set utf8 collate utf8_bin;
Query OK, 1 row affected (0.00 sec)

MariaDB [(none)]> grant all on zabbix.* to [email protected] identified by ‘[email protected]‘;

MariaDB [(none)]> quit

Bye
[[email protected] ~]#

导入zabbix服务包提供的初始库
[[email protected] ~]# zcat /usr/share/doc/zabbix-server-mysql*/create.sql.gz | mysql -uzabbix [email protected] zabbix

10.设置好数据库连接
[[email protected] ~]# vim /etc/zabbix/zabbix_server.conf

往下 修改
DBName=zabbix //数据库名
DBUser=zabbix //数据库用户
[email protected] //数据库密码



保存退出

七、开启zabbix相关服务
1)启动zabbix-server、zabbix-agent
[[email protected] ~]# vim /etc/zabbix/zabbix_server.conf
[[email protected] ~]# systemctl restart zabbix-server zabbix-agent.service
[[email protected] ~]# systemctl enable zabbix-server.service zabbix-agent.service
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-server.service to /usr/lib/systemd/system/zabbix-server.service.
Created symlink from /etc/systemd/system/multi-user.target.wants/zabbix-agent.service to /usr/lib/systemd/system/zabbix-agent.service.
2)确认httpd网站服务已开启
[[email protected] ~]# systemctl restart httpd

十一、访问Web界面,按照提示完成初始设置
1)访问部署好的zabbix监控系统页面
在浏览器中访问http://192.168.10.7/zabbix/,首次访问时会自动跳转到初始化设置页面 图
单击右下方的“Next step”按钮,下一个页面会检查PHP环境,确认所有条件都是“OK”

2)设置好数据库连接
比如库名zabbix、用户名zabbix、密码[email protected]点击next step
点击next step
点击next step

点击finish



以默认管理员Admin登录Zabbix平台,zabbix默认管理员为Admin(注意第一个A为大写),密码为zabbix


登录成功以后,可以看到英文版的zabbix监控网页


单击zabbix监控页面右上方的头像标识,可以打开当前用户的属性设置页面
将界面语言更改为“Chinese(zh_CN)”点击updata


更新成功后,zabbix监控页面就会变成中文

十二、启用将Zabbix Server本机作为被监控主机
单击zabbix监控页面上的“配置”-->“主机”,可以列出被监控主机。Zabbix平台默认已将本机添加为被监控对象,但是并没有启用


需要勾选Zabbix server主机项,然后单击底部的“启用”以开启监控。等待几分钟后按F5刷新网页,在“可用性”一栏下的ZBX项将会被点亮为绿色

十三、确认监控项:主机可用性、可用内存、CPU负载、登录用户数、运行进程数
单击zabbix监控页面上的“配置”-->“主机”,找到被监控的主机条目,单击右侧的“监控项”可以列出所有监控项

确认主机可用性监控项
监控项 Agent ping用来检查zabbix客户端的可用性


确认可用内存监控项
监控项 Available memory用来检查可用内存


确认CPU负载监控项
监控项 Processor load相关的用来检查CPU负载情况


确认登录用户数监控项
监控项 Number of logged in users用来检查已登录用户数

确认运行进程数监控项
监控项 Number of processes用来检查运行的进程数


添加入站流量、出站流量监控
对于模板中没有、也没能通过自动发现创建的监控项,还可以由管理员手动添加新的监控项。单击zabbix监控页面上的“配置”-->“主机”,找到被监控的主机条目,单击右侧的“监控项”打开监控项管理页面,单击右上方的创建监控项按钮,可以配置新监控项。
1)添加入站流量监控
需要指定监控项名称、监控键值(获取监控结果的预设方法)。比如,添加对网卡ens33的入站(从此网卡进入主机)流量,对应的键值为net.if.in[ens33]



注意:网卡流量监控项可能会由zabbix服务端自动发现并添加,若已经完成自动发现,则此项会因为键值冲突而无法添加,也无需重复添加。
2)添加出站流量监控
添加对网卡ens33的出站(从此网卡发出)流量,对应的键值为net.if.out[ens33]

3)确认新增加的监控项
返回监控项页面,可以在最后两条找到新增的监控项


列出主机的监控图形
单击zabbix监控页中的“配置”-->“主机”-->选中被监控主机-->“图形”,可以看到已经创建的监控图形(默认都是从模板创建的)


创建监控图形
1)添加“CPU负载分析”图形
创建新的监控图形时,需要指定名称、监控项



确认设置无误,单击下方的“添加”就完成了
2)添加“网卡流量分析”图形
为入站流量、出站流量两个监控项创建“网卡流量分析”监控图形


查看监控图形
1)选择指定图形并查看
单击zabbix监控页的“监测中”-->“图形”-->选择XX图形查看,比如查看Zabbix server的CPU负载分析,如图-33所示。默认情况下,zabbix所绘制图形中的汉字会显示为方框,需要修正绘图所使用的字体

2)修正图形中的中文显示
需要使用能正常支持汉字的中文字体文件,替换zabbix默认的绘图字体
[[email protected] ~]# cp /usr/share/fonts/wqy-zenhei/wqy-zenhei.ttc /usr/share/zabbix/fonts/graphfont.ttf
cp:是否覆盖"/usr/share/zabbix/fonts/graphfont.ttf"? y
[[email protected] ~]#
然后按F5键刷新“CPU负载分析”网页,可以看到监控图形中的汉字可以正常显示了


3)查看“网卡流量分析”图形
单击zabbix监控页的“监测中”-->“图形”-->选择XX图形查看,比如查看Zabbix server的网卡流量分析

原文地址:https://blog.51cto.com/14312470/2406506

时间: 2024-10-08 00:33:34

运维监控基础的相关文章

江西畅行高速IT运维监控平台--PIGOSS BSM

案例所属行业:高速公路行业 项目实施时间:2014年 1.1    项目背景     江西畅行高速工程(以下简称"畅行高速")与高速公路周边系统的建设基于用户的消费账户支付系统和结算系统.既包括高速公路的收费,也包括高速公路周边的连锁超市的消费,互联网业务为江西畅行高速周边服务. 目前,江西畅行高速进行网络建设和核心生产平台应用系统的建设.随着江西畅行高速信息化应用的不断推广,核心生产平台的稳定运行对项目的影响越来越大.随 着更多江西畅行高速业务系统上线运行和日常办公对业务系统的日益依

【解决方案】IDC、MA服务商IT运维监控解决方案

       文章摘自 pigoss 官网 http://www.netistate.com  如需转载,请标明出处! IDC与MA服务商现状 目前,大部分传统IDC服务商仍然处于卖场地.卖资源的阶段,通过租赁有限的场地和资源,同质化竞争和低价竞争愈演愈烈严重.如何为用户提供差异化增值IT运维服务成为新一代IDC的竞争目标. 同 样,大部分传统MA服务商的经营模式为提供维保服务,成熟.有经验的工程师便成为了众多MA服务商的重点争夺人才,人力成本不断攀升.技术人员巨大的人才 缺口,注定了专家级工程

全新SaaS运维监控平台构建书

第一部分 引言 伴随的IT服务的发展,IT服务的概念也在发生着巨大的变化.IT运维服务已经由原来局限在用户自身环境下的IT服务,延伸到覆盖公用云.私有云.外包服务商等多纬度.全天候的SaaS运维模式, 从狭义理解,IT服务仅仅是为了解决信息系统出现的故障,在系统出现停顿的时候可以快速的恢复.而目前的IT服务已经包含了更多的内容,IT服务渗透在信息系统的整个生命周期之中.本文基于该理念,对IT服务系统的实现进行分析研究.文章基于网脊运维通SaaS(Software as aService)模式理念

运维监控系统 PIGOSS BSM 为银行运维监控提供全力保障

IT运维服务在银行信息化建设和运行中的核心地位,而定量.实时的交易数据.事件和性能指标成为判断信息系统安全运行状态的主要依据.因此,进行银行业IT运维监控指标体系研究与构建,建立IT统一运维监控指标体系至关重要. 从信息系统期理论出发,信息系统大致分为规划与设计.开发与测试(或购买).实施.运维管理与持续改进五个阶段.而前三个阶段从时间角度看,只占整个周期的20%,其余时间基本上是对其进行运行维护.这就决定了IT运维服务在银行信息化建设和运行中的核心地位,而定量.实时的交易数据.事件和性能指标成

【IT运维监控】集团宕机引发对运维人员的思考 

前不久某大型集团官网和APP突然无法正常使用引发热议,不少人幸灾乐祸,也引发出了各种的谣言和段子,根本难以体会集团内部所受的压力,特别是作为一个大集团内部的运维人员所承受的各种压力和不安. 后 来,原支付宝运维团队负责人针对此事发表了一篇文章,让不少的运维人员深有感触,作为肩负运维监控使命的运维监控工具--PIGOSS BSM 也同样感同身受.面对层出不穷的运维安全隐患,当下运维人员急需一套高效的7*24小时都能担负监控任务的工具,为自身的运维工作减负,告别之前加班熬夜 但没有工作成绩的"怪现像

【IT运维监控】讨论哪种运维监控工具才是IT运维人员的最爱?

选择运维工具的几大要素:一是看我哪些指标需要监控,二是看我监控到什么 三是看这种运维监控工具能监控到什么程度 有可能,这几个问题IT运维人员自己都没有弄的很明白,那么我们先看一下整个运维行业目前的现状: 目前来说,传统企业的IT运维大部分还是用户在使用过程中发现故障,然后通知运维人员,再邮运维人员确定是什么问题,采用哪种方式可以解决.大部分的运维人员目前还是充当的只是一个救火员的身份,没有起到真正的IT运维监控的作用.运维人员的大部分时间和经历都花在了处理简单而重复的问题上,导致同事及领导的不满

最简单也最难:运维监控的最后1公里

谈运维我们不得不提监控,监控是运维的起点,也是难点.随着IT架构逐渐复杂化,从前端到IT底层,中间涉及浏览器.网络.服务器.操作系统.中间件.应用.数据库等,每个环节厂商不尽相同.当出现异常需要定位哪个环节出了问题的时候,排查就耗时耗力,若使用优云监控产品,以上难题不再是问题.优云全栈运维监控覆盖了所有环节的监控,真正做到监控无盲区,运维无隐患. 运维最后一公里是指高度可视化.优云除了提升监控能力还注重可视化,深知可视化是运维的亮点更是本质,为了让每个环节监控的数据更好的展现出来,优云拥有一批在

Storm流计算从入门到精通之技术篇(高并发策略、批处理事务、Trident精解、运维监控、企业场景)

对这个课程有兴趣的可以加我qq2059055336和我联系 Storm是什么? 为什么学习Storm? Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop. 随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,比如网站统计.推荐系统.预警系统.金融系统(高频交易.股票)等等, 大数据实时处理解决方案(流计算)的应用日趋广泛,目前已是分布式技术领域最新爆发点,而Storm更是流计算技术中的佼佼者和主流. 按照storm作者的说法,Storm对于实

企业运维监控平台架构设计与实现(ganglia篇)

一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简单的说Cacti 就是一个PHP 程序.它通过使用SNMP 协议获取远端网络设备和相关信息,(其实就是使用Net-SNMP 软件包的snmpget 和snmpwalk 命令获取)并通过RRDTOOL 工具绘图,通过PHP 程序展现出来.我们使用它可以展现出监控对象一段时间内的状态或者性能趋势图. 2