zabbix自动发现oracle表空间并监控其使用率

监控需求

Oracle表空间使用率实时监控,当表空间使用率达到95%时触发告警机制。Oracle表空间分为系统默认表空间和用户创建的表空间,而表空间又有自动扩展和非自动扩展两种类型,用户(DBA)在创建表空间时可以根据应用需求指定是否开启表空间自动扩展。那么在这里我们需要分析一个监控策略,就是当zabbix监控到某个表空间使用率达到95%,那么就让触发器触发警告(Warning)信息,并发送邮件给DBA或管理者。当检测到表空间没有开启自动扩展时,则触发Information信息。说明一下:oracle表空间是否开启自动扩展以及最大能扩展到多少在最初应该规划好的,有时在创建表空间时指定初始容量和最大能扩展的容量一致的话,那么就会让这个表空间立即拥有最大能扩展的容量,而不是随着表空间的消耗而慢慢增加。所以即使我们检测到该表空间开启了自动扩展功能,实际上也不会继续扩展了。当然在大多数业务场景下一般是不建议开启表空间自动扩展功能的,除非你的业务是非关键的。回到监控这里,当我们同时收到这两个告警信息时,那么就要及时处理oracle表空间使用率大于95%的问题了。

监控方式

有了zabbix监控系统,我们可以定制任何需要的监控项目,首先通过自动发现脚本发现oracle表空间,然后再制定额外的属于oracle表空间的监控项目,配置告警触发器,最后在zabbix的Web页面端展示oracle表空间的使用率和剩余量。

获取oracle数据库表空间信息的原始脚本和自动发现脚本

Oracle表空间的信息需要SQL语句查询得到,因此,我们首先创建一个获取表空间信息的原始脚本/home/oracle/bin/check_tablespace.sh,这个脚本由oracle用户去执行,脚本编写如下:

[email protected]:~/bin> cat check_tablespace.sh 
#!/bin/bash
# tablespace usagep check
source ~/.bash_profile
function check {
sqlplus -S "/ as sysdba" <<  EOF
set linesize 200
set pagesize 200
spool /tmp/ora_tablespace.txt
select a.tablespace_name, total, free,(total-free) as usage from 
(select tablespace_name, sum(bytes)/1024/1024 as total from dba_data_files group by tablespace_name) a, 
(select tablespace_name, sum(bytes)/1024/1024 as free from dba_free_space group by tablespace_name) b
where a.tablespace_name = b.tablespace_name;
spool off
set linesize 100
set pagesize 100
spool /tmp/ora_autex.txt
select tablespace_name,autoextensible from dba_data_files;
spool off
quit
EOF
};check &>/dev/null

执行这个脚本,并生成两个保存有oracle表空间名称信息的文件:/tmp/ora_tablespace.txt和/tmp/ora_autex.txt

[email protected]:~/bin> ls -l /tmp/ora_*
-rw-r--r-- 1 oracle oinstall 1030 Mar 23 20:50 /tmp/ora_autex.txt
-rw-r--r-- 1 oracle oinstall  929 Mar 23 20:50 /tmp/ora_tablespace.txt
 
[email protected]:~/bin> cat /tmp/ora_tablespace.txt
TABLESPACE_NAME                                                   TOTAL       FREE      USAGE    
------------------------------------------------------------ ---------- ---------- ----------    
TEST11                                                               50         49          1    
SYSAUX                                                             2048       1197        851    
UNDOTBS1                                                           2048  2036.3125    11.6875    
USERS                                                              1024       1023          1    
SYSTEM                                                             2048   1358.375    689.625    
UDB_SPACE                                                         40960  31673.875   9286.125    
UNDOTBS2                                                           2048  2035.1875    12.8125    
 
7 rows selected.
 
 
[email protected]:~/bin> cat /tmp/ora_autex.txt
TABLESPACE_NAME                                              AUTOEX                              
------------------------------------------------------------ ------                              
SYSTEM                                                       YES                                 
SYSAUX                                                       YES                                 
UNDOTBS1                                                     YES                                 
UNDOTBS2                                                     YES                                 
USERS                                                        YES                                 
UDB_SPACE                                                    YES                                 
UDB_SPACE                                                    YES                                 
TEST11                                                       YES                                 
8 rows selected.

我们需要把脚本放到oracle用户的crontab计划任务表中,让脚本在后台每5分钟执行一次,一定要保证计划任务能正常按计划执行,否则这可能会被监控欺骗(监控端获取到的数据一直保持不变)。

hmracdb1:~ # crontab -u oracle -l
# DO NOT EDIT THIS FILE - edit the master and reinstall.
# (/tmp/crontab.XXXXj0XHiH installed on Thu Mar 23 11:38:37 2017)
# (Cron version V5.0 -- $Id: crontab.c,v 1.12 2004/01/23 18:56:42 vixie Exp $)
*/5 * * * * /home/oracle/bin/check_tablespace.sh

手动执行SQL语句获取表空间使用率

SQL> set linesize 200
select ff.s tablespace_name,
ff.b total,
              (ff.b - fr.b)usage,
fr.b free,
              round((ff.b - fr.b) / ff.b * 100) || ‘% ‘ usagep
from (select tablespace_name s, sum(bytes) / 1024 / 1024 b
                    from dba_data_files
                  group by tablespace_name) ff,
              (select tablespace_name s, sum(bytes) / 1024 / 1024 b
                    from dba_free_space
                  group by tablespace_name) fr
 12  where ff.s = fr.s;
 
TABLESPACE_NAME                                                   TOTAL      USAGE       FREE USAGEP
------------------------------------------------------------ ---------- ---------- ---------- ------------------------------------------------------------------------------------
TEST11                                                               50          1         49 2%
SYSAUX                                                             2048    851.375   1196.625 42%
UNDOTBS1                                                           2048    12.6875  2035.3125 1%
USERS                                                              1024          1       1023 0%
SYSTEM                                                             2048    689.625   1358.375 34%
UDB_SPACE                                                         40960   9286.125  31673.875 23%
UNDOTBS2                                                           2048    12.8125  2035.1875 1%
 
7 rows selected.

下面编写一个zabbix自动发现oracle表空间的脚本discovery_oracle_tablespace.sh

hmracdb1:~ # cat discovery_oracle_tablespace.sh
#!/bin/bash
#zabbix discovery oracle tablespace
table_spaces=(`cat /tmp/ora_tablespace.txt | sed -e "1,3d" -e "/^$/d" -e "/selected/d" | awk ‘{print $1}‘`)
length=${#table_spaces[@]}
 
printf "{\n"
printf ‘\t‘"\"data\":["
for ((i=0;i<$length;i++))
do
    printf "\n\t\t{"
    printf "\"{#TABLESPACE_NAME}\":\"${table_spaces[$i]}\"}"
    if [ $i -lt $[$length-1] ];then
        printf ","
    fi
done
    printf "\n\t]\n"
printf "}\n"

赋予脚本执行权限,并放到$ZABBIX_HOME/scripts/目录下,下面是执行该脚本输出为json格式的oracle表空间的信息

hmracdb1:/opt/zabbix/scripts # ./discovery_oracle_tablespace.sh 
{
    "data":[
        {"{#PROCESS_NAME}":"TEST11"},
        {"{#PROCESS_NAME}":"SYSAUX"},
        {"{#PROCESS_NAME}":"UNDOTBS1"},
        {"{#PROCESS_NAME}":"USERS"},
        {"{#PROCESS_NAME}":"SYSTEM"},
        {"{#PROCESS_NAME}":"UDB_SPACE"},
        {"{#PROCESS_NAME}":"UNDOTBS2"}
    ]
}

监控项目检测脚本tablespace_check.sh用于zabbix获取oracle表空间使用率、剩余量和检查是否开启自动扩展。

hmracdb1:~ # cat tablespace_check.sh 
#!/bin/bash
# oracle tablespace check
CEHCK_TYPE=$1
TABLESPACE_NAME=$2
 
function usagepre {
    grep "\b$TABLESPACE_NAME\b" /tmp/ora_tablespace.txt | awk ‘{printf "%.f\n",($2-$3)/$2*100}‘
}
 
function available {
    grep "\b$TABLESPACE_NAME\b" /tmp/ora_tablespace.txt | awk ‘{printf $3*1024*1024}‘
}
 
function check {
    if grep "\b$TABLESPACE_NAME\b" /tmp/ora_autex.txt | awk ‘{print $2}‘ | uniq | grep "YES" &>/dev/null;then
        echo 1
    else
        echo 0
    fi
}
 
case $CEHCK_TYPE in
    pre)
        usagepre ;;
    fre)
        available ;;
    check)
        check ;;
    *)
        echo -e "Usage: $0 [pre|fre|check] [TABLESPACE_NAME]"
esac

确认脚本输出的值为zabbix监控所取的数值

hmracdb1:~ # ./tablespace_check.sh pre SYSTEM
34
hmracdb1:~ # ./tablespace_check.sh fre SYSTEM
1424359424hmracdb1:~ # ./tablespace_check.sh check SYSTEM
1

将脚本都保存到$ZABBIX_HOME/scpirts目录下,然后配置UserParameter参数,增加监控key,key名称分别为discovery.oracle.tablespace、tablespace.check,在以下配置文件末尾增加两行

hmracdb1:/opt/zabbix/scripts # vim ../etc/zabbix_agentd.conf.d/userparameter_script.conf
UserParameter=discovery.oracle.tablespace[*],/opt/zabbix/scripts/discovery_oracle_tablespace.sh
UserParameter=tablespace.check[*],/opt/zabbix/scripts/tablespace_check.sh $1 $2

重启zabbix_ahgentd

在zabbix服务端获取oracle表空间和监控数值

[[email protected]_19F ~]# zabbix_get -p10050 -k ‘tablespace.check[pre,SYSTEM]‘ -s 10.xxx.xxx.xxx
34
[[email protected]_19F ~]# zabbix_get -p10050 -k ‘tablespace.check[fre,SYSTEM]‘ -s 10.xxx.xxx.xxx
1424359424
[[email protected]_19F ~]# zabbix_get -p10050 -k ‘tablespace.check[check,SYSTEM]‘ -s 10.xxx.xxx.xxx
1

Zabbix Web端配置

新建oracle表空间模版My_Templates_Linux_Discovery_oracle_tablespace,添加自动发现规则,10分钟更新一次

添加Item prototypes监控项目,第一个表空间使用率

第二个表空间剩余容量

第三个检查表空间是否开启自动扩展

创建告警触发器

首先创建检测表空间使用率是否大于95%的触发器

创建检测是否开启自动扩展的触发器

查看监控数据

到这里,zabbix监控oracle表空间使用率就完成了

时间: 2024-12-24 08:55:31

zabbix自动发现oracle表空间并监控其使用率的相关文章

zabbix自动发现规则之磁盘IO监控

本文章介绍zabbix自动发现规则之磁盘IO监控的案例实践. 主机名:mysql-slave 首先在zabbix_agent下定义一个获取磁盘IO信息的脚本: cat /etc/zabbix/scripts/disk_io.sh #!/bin/bash Disk=$1 Option=$2 case $Option in rrqm) iostat -dxk 1 2|grep "\b$Disk\b" |tail -1|awk '{print $2}' ;; wrqm) iostat -dx

zabbix自动发现和自动注册

zabbix自动发现和自动注册 熟练通过Zabbix监控平台监控单台客户端之后,企业中有成千上万台服务器,如果手工添加会非常耗时间,造成大量的人力成本的浪费,有没有什么好的自动化添加客户端的方法呢? Zabbix自动发现就是为了解决批量监控而设计的功能之一,什么是自动发现呢,简单来说就是Zabbix Server端可以基于设定的规则,自动批量的去发现局域网若干服务器,并自动把服务器添加至Zabbix监控平台,省去人工手动频繁的添加,节省大量的人力成本. 一. 自动发现: Zabbix最大的特点之

Orabbix 监控oracle表空间 Low Level Discovery

在被监控端创建脚本,此脚本用于获取表空间及空间使用信息,此脚本由oracle用户下创建 vim mornitor_tbs.sh #!/bin/bash source /home/oracle/.bash_profile sqlplus -s zabbix/zabbix > /tmp/tablespace.log<<EOF set linesize 140 pagesize 10000 col "Status" for a10 col "Name" 

zabbix自动发现与监控内存和CPU使用率最高的进程

监控需求 某项目的应用服务器CPU和内存使用率的监控,通过zabbix系统监控记录应用服务器上进程的CPU和内存的使用情况,并以图表的形式实时展现,以便于我们分析服务器的性能瓶颈. 监控方式 利用zabbix监控系统的自动发现功能,首先编写shell脚本获取服务器的CPU和内存资源使用率最大的进程,以json的格式输出,然后对这些进程的CPU和内存资源使用情况进行监控.(本文监控的进程为Linux服务器中资源使用率最高的10个进程.) 缺点 不适用于监控固定的进程 首先使用top命令查看进程状态

zabbix自动发现监控mongo

1: zabbix自动发现mongo监控的端口,并返回zabbix_server需要的格式,脚本部署在zabbix_agent上,路径为/usr/local/zabbix/zabbix_discover_mongo.sh,脚本内容如下: #!/bin/sh #zhuangweihong 20160419 zabbix discover mysql res=`sudo ss -tulnp|grep mongo|grep -v 28107|awk '{print $(NF-2)}'|awk -F':

oracle 表空间自动扩展大小

select a.FILE_NAME,a.AUTOEXTENSIBLE,a.MAXBYTES,a.INCREMENT_BY  from  dba_data_files a; --AUTOEXTENSIBLE  是否自动扩展 --MAXBYTES 最大 --INCREMENT_BY 自动扩展块数 SQL> show parameter db_block NAME                                 TYPE        VALUE ------------------

zabbix自动发现结合shell实现自动发现占用内存最大top10进程并监控其资源

最近在想一个问题,线上服务器跑的服务五花八门,可能这台跑的是nginx,另一台跑的是mysql,其他的跑的是nfs或者其他服务等等,通过某一个脚本中固定的写入一些服务来实现监控所有的服务器的进程占用资源情况占用zabbix服务器资源不说,假如该服务器跑的服务不在固定列表中,监控服务获取不到相应数据. 为了解决这个问题,最近在想通过zabbix的自动发现功能能不能实现自动发现占用服务器内存最大的N个进程,然后对这些进程占用内存和CPU的资源情况进行监控获取数据呢?于是就有了本篇文章的诞生. 首先,

zabbix自动发现监控多台mysql

1: 前言 由于前面写的博客,zabbix自动发现监控redis.zabbix自动发现监控mongo这两篇博客虽然都能自动发现并监控,但是由于每个zabbix_agentd都得配置,监控起来非常不方便,因此,再做了个模板,能够自动发现并监控多台mysql.这个方法在监控mongo.redis或者mysql主从等时候也都适用. 2: 在zabbix_agentd下编写自动发现并监控多台mysql的脚本,脚本如下: #!/bin/sh #zhuangweihong 20160512 zabbix d

zabbix自动发现window(阿里云),去除多余的监控项

1.问题点: 由于使用zabbix 自动发现去批量添加500台阿里云主机, 导致监控项多大120多项, 其中有大量的报警信息, 都是我不想要的,前期由于量太多, 不敢轻易的去删除,只做个在模板里面删除, 但是发现不管用.2.在模板里面删除不要监控项是多的,想法是对的, 但是操作过程有点问题3.正确的方式是:模板 4.将自动发现服务这个去掉, 应该他会自动发现windows(阿里云) 主机多余的监控项5.刚才我们已经禁用了多余监控项了, 现在需要把之前就已经加好的监控项都去掉(关键)6.批量去掉当