Linux/Unix shell 监控Oracle告警日志(monitor alter log file)

使用shell脚本实现对Oracle数据库的监控与管理将大大简化DBA的工作负担,如常见的对实例的监控,监听的监控,告警日志的监控,以及数据库的备份,AWR report的自动邮件等。本文给出Linux 下使用 shell 脚本来监控 Oracle 告警日志(monitor alter log file)。

Linux Shell的相关参考:
        Linux/Unix shell 脚本中调用SQL,RMAN脚本        Linux/Unix shell sql 之间传递变量        Linux/Unix shell 调用 PL/SQL        Linux/Unix shell 监控Oracle实例(monitor instance) 
        Linux/Unix shell 监控Oracle监听器(monitor listener)

1、监控Oracle告警日志脚本

[python] view plain copy

print?

  1. [email protected]:~/dba_scripts/custom/bin> more ck_alert.sh
  2. #!/bin/bash
  3. # --------------------------------------------------------------------------+
  4. #                  CHECK ALERT LOG FILE                                     |
  5. #   Filename: ck_alert.sh                                                   |
  6. #   Desc:                                                                   |
  7. #       The script use to check alert log file.                             |
  8. #       Once any error was caught, a mail alert will be sent.               |
  9. #       Deploy it by crontab. e.g. per 15 min                               |
  10. #   Usage:                                                                  |
  11. #       ./ck_alert.sh $ORACLE_SID                                           |
  12. #                                                                           |
  13. #   Author : Robinson                                                       |
  14. #   Blog   : http://blog.csdn.net/robinson_0612                             |
  15. # --------------------------------------------------------------------------+
  16. #
  17. # --------------------------
  18. #   Check SID
  19. # --------------------------
  20. if [ -z "${1}" ];then
  21. echo "Usage: "
  22. echo "      `basename $0` ORACLE_SID"
  23. exit 1
  24. fi
  25. # -------------------------------
  26. #  Set environment here
  27. # ------------------------------
  28. if [ -f ~/.bash_profile ]; then
  29. . ~/.bash_profile
  30. fi
  31. export ORACLE_SID=$1
  32. export MACHINE=`hostname`
  33. export MAIL_DIR=/users/robin/dba_scripts/sendEmail-v1.56
  34. export MAIL_LIST=‘[email protected]‘
  35. export MAIL_FM=‘[email protected]‘
  36. # ----------------------------------------------
  37. # check the database is running, if not exit
  38. # ----------------------------------------------
  39. db_stat=`ps -ef | grep pmon_$ORACLE_SID | grep -v grep| cut -f3 -d_`
  40. if [ -z "$db_stat" ]; then
  41. date >/tmp/db_${ORACLE_SID}_stauts.log
  42. echo " $ORACLE_SID is not available on ${MACHINE} !!!" >>/tmp/db_${ORACLE_SID}_stauts.log
  43. MAIL_SUB=" $ORACLE_SID is not available on ${MACHINE} !!!"
  44. $MAIL_DIR/sendEmail -u $MAIL_SUB -f $MAIL_FM -t $MAIL_LIST -o message-file=/tmp/db_${ORACLE_SID}_stauts.log
  45. exit 1
  46. fi;
  47. # --------------------------------------
  48. #  Get the location of alert log file
  49. # --------------------------------------
  50. sqlplus ‘/ as sysdba‘ << EOF > /tmp/${ORACLE_SID}_monitor_temp.txt
  51. column xxxx format a10
  52. column value format a80
  53. set lines 132
  54. SELECT ‘xxxx‘ ,value FROM  v\$parameter WHERE  name = ‘background_dump_dest‘
  55. /
  56. exit
  57. EOF
  58. cat /tmp/${ORACLE_SID}_monitor_temp.txt | awk ‘$1 ~ /xxxx/ {print $2}‘ > /tmp/${ORACLE_SID}_monitor_location.txt
  59. read ALERT_DIR < /tmp/${ORACLE_SID}_monitor_location.txt
  60. rm /tmp/${ORACLE_SID}_monitor_temp.txt 2>/dev/null
  61. # ----------------------------------------
  62. #  Define archive directory and log file
  63. # ----------------------------------------
  64. DT=`date +%Y%m%d`
  65. DT_DIR=`date +%Y%m`
  66. ARCH_DIR=${ALERT_DIR}/${DT_DIR}
  67. if [ ! -d "${ARCH_DIR}" ] ; then
  68. mkdir $ARCH_DIR
  69. fi
  70. ORIG_ALERT_LOG=${ALERT_DIR}/alert_${ORACLE_SID}.log
  71. NEW_ALERT_LOG=${ARCH_DIR}/alert_${ORACLE_SID}.log.${DT}
  72. TEMP_ALERT_LOG=${ORIG_ALERT_LOG}.temp
  73. AWK_DIR=/users/robin/dba_scripts/custom/bin
  74. # -------------------------------------
  75. #  Check alert log file and send email
  76. # -------------------------------------
  77. cat ${ORIG_ALERT_LOG} | awk -f $AWK_DIR/check_alert.awk > /tmp/${ORACLE_SID}_check_monitor_log.log
  78. if [ -s "/tmp/${ORACLE_SID}_check_monitor_log.log" ];
  79. then
  80. echo "Found errors in sid ${ORACLE_SID}, mailed errors"
  81. echo -e "The following errors were found in the alert log for ${ORACLE_SID} \n" > /tmp/${ORACLE_SID}_check_monitor_log.mail
  82. echo -e "Alert log was copied into ${NEW_ALERT_LOG} \n">> /tmp/${ORACLE_SID}_check_monitor_log.mail
  83. date >> /tmp/${ORACLE_SID}_check_monitor_log.mail
  84. echo "--------------------------------------------------------------">>/tmp/${ORACLE_SID}_check_monitor_log.mail
  85. echo " "
  86. echo " " >> /tmp/${ORACLE_SID}_check_monitor_log.mail
  87. echo " " >> /tmp/${ORACLE_SID}_check_monitor_log.mail
  88. cat /tmp/${ORACLE_SID}_check_monitor_log.log >>  /tmp/${ORACLE_SID}_check_monitor_log.mail
  89. MAIL_SUB="Found errors in ${ORACLE_SID} on ${MACHINE}"
  90. $MAIL_DIR/sendEmail -u $MAIL_SUB -f $MAIL_FM -t $MAIL_LIST -o message-file=/tmp/${ORACLE_SID}_check_monitor_log.mail
  91. # --------------------------------
  92. #  Backup current alert log file
  93. # --------------------------------
  94. mv ${ORIG_ALERT_LOG} ${TEMP_ALERT_LOG}
  95. cat ${TEMP_ALERT_LOG} >> ${NEW_ALERT_LOG}
  96. #touch ${ORIG_ALERT_LOG}
  97. cat /dev/null > ${ORIG_ALERT_LOG}
  98. rm /tmp/${ORACLE_SID}_check_monitor_log.log
  99. rm /tmp/${ORACLE_SID}_check_monitor_log.mail
  100. rm ${TEMP_ALERT_LOG} > /dev/null
  101. exit
  102. fi
  103. rm /tmp/${ORACLE_SID}_check_monitor_log.log > /dev/null
  104. rm /tmp/${ORACLE_SID}_monitor_location.txt > /dev/null
  105. exit

2、过滤Oracle告警日志错误信息

[python] view plain copy

print?

  1. [email protected]:~/dba_scripts/custom/bin> more check_alert.awk
  2. $0 ~ /Errors in file/ {print $0}
  3. $0 ~ /PMON: terminating instance due to error 600/ {print $0}
  4. $0 ~ /Started recovery/{print $0}
  5. $0 ~ /Archival required/{print $0}
  6. $0 ~ /Instance terminated/ {print $0}
  7. $0 ~ /Checkpoint not complete/ {print $0}
  8. $1 ~ /ORA-/ { print $0; flag=1 }
  9. $0 !~ /ORA-/ {if (flag==1){print $0; flag=0;print " "} }
  10. $0 ~ /ERROR_AUDIT/ {print $0}

3、老化Oracle告警日志脚本

[python] view plain copy

print?

  1. [email protected]:~/dba_scripts/custom/bin> more age_alert.sh
  2. #!/bin/bash
  3. # ------------------------------------------------------------+
  4. #                 Age the alert log file                      |
  5. #   FileName: age_alert.sh                                    |
  6. #   Desc:                                                     |
  7. #        The script use to age the alert log file             |
  8. #   Usage:                                                    |
  9. #        ./age_alert.sh $ORACLE_SID                           |
  10. #                                                             |
  11. #   Authror : Robinson                                        |
  12. #   Blog    : http://blog.csdn.net/robinson_0612              |
  13. # ------------------------------------------------------------+
  14. # --------------------------
  15. #   Check SID
  16. # --------------------------
  17. if [ -z "${1}" ];then
  18. echo "Usage: "
  19. echo "      `basename $0` ORACLE_SID"
  20. exit 1
  21. fi
  22. # -------------------------------
  23. #  Set environment here
  24. # ------------------------------
  25. if [ -f ~/.bash_profile ]; then
  26. . ~/.bash_profile
  27. fi
  28. export MAIL_DIR=/users/robin/dba_scripts/sendEmail-v1.56
  29. export MAIL_LIST=‘[email protected]‘
  30. export MAIL_FM=‘[email protected]‘
  31. ORACLE_SID=$1;  export ORACLE_SID
  32. # ----------------------------------------------
  33. # check if the database is running, if not exit
  34. # ----------------------------------------------
  35. db_stat=`ps -ef | grep pmon_$ORACLE_SID | grep -v grep| cut -f3 -d_`
  36. if [ -z "$db_stat" ]; then
  37. echo " $ORACLE_SID is not available on `hostname` !!!"
  38. MAIL_SUB=" $ORACLE_SID is not available on `hostname` !!!"
  39. MAIL_MSG="$ORACLE_SID is not available on `hostname` before age alert log file, exit, please check !"
  40. $MAIL_DIR/sendEmail -u $MAIL_SUB -f $MAIL_FM -t $MAIL_LIST -m $MAIL_MSG
  41. exit 1
  42. fi
  43. # -----------------------------------
  44. # Find bdump directory for database
  45. # -----------------------------------
  46. DUMP_DIR=`sqlplus -S ‘/ as sysdba‘ << EOF
  47. set pagesize 0 feedback off verify off heading off echo off
  48. SELECT value FROM  v\\$parameter WHERE  name = ‘background_dump_dest‘;
  49. exit
  50. EOF`
  51. if [ -z ${DUMP_DIR} ]; then
  52. echo "The bdump directory was not found for ${ORACLE_SID}"
  53. MAIL_SUB="The bdump directory was not found for ${ORACLE_SID}"
  54. MAIL_MSG="The bdump directory was not found for ${ORACLE_SID} on `hostname` before age log file,exit,please check !"
  55. $MAIL_DIR/sendEmail -u $MAIL_SUB -f $MAIL_FM -t $MAIL_LIST -m $MAIL_MSG
  56. exit 1
  57. else
  58. echo ${DUMP_DIR}
  59. fi
  60. # -------------------------------
  61. #  Archive alert log file
  62. # -------------------------------
  63. DT=`date +%Y%m%d -d ‘-1 day‘`
  64. OLD_DIR=${DT:0:6}
  65. NEW_DIR=`date +%Y%m`
  66. ORIG_ALERT_LOG=${DUMP_DIR}/alert_${ORACLE_SID}.log
  67. OLD_ARC_DIR=${DUMP_DIR}/${OLD_DIR}
  68. NEW_ARC_DIR=${DUMP_DIR}/${NEW_DIR}
  69. if [ ! -d "${NEW_ARC_DIR}" ] ; then
  70. mkdir ${NEW_ARC_DIR}
  71. fi
  72. if [ "${OLD_DIR}" \< "${NEW_DIR}" ];then
  73. ARC_LOG=${OLD_ARC_DIR}/alert_${ORACLE_SID}.log.${DT}
  74. else
  75. ARC_LOG=${NEW_ARC_DIR}/alert_${ORACLE_SID}.log.${DT}
  76. fi
  77. cat ${ORIG_ALERT_LOG} >>${ARC_LOG}
  78. cat /dev/null>${ORIG_ALERT_LOG}
  79. exit

4、部署脚本到crontab

[python] view plain copy

print?

  1. */15 * * * * /users/robin/dba_scripts/custom/bin/ck_alert.sh MMBOTST
  2. 0 0 * * * /users/robin/dba_scripts/custom/bin/age_alert.sh MMBOTST

5、补充
  a、上面脚本用于实时监控Oracle告警日志,一旦检测到错误,将发送邮件。
  b、对于已经检查过且发现错误的日志将被移动作为归档,也就是Oracle错误不会被重复检测。
  c、所有有关错误检测的过滤条件被放置到过滤文件check_alert.awk中。
  d、第3个脚本用于老化告警日志,建议设置老化的时间为每天0点,这样子,每天将会保留当天的告警日志。
  e、对于老化的告警日值,按年月来存放,也即是以年月命名文件夹,当天告警日志会存放在当月文件夹。
  f、使用了sendEmail邮件发送程序来发送邮件。参阅:不可或缺的 sendEmail  g、该脚本仅在Oracle 10g测试可用,Oracle 11g应做相应修改。

转:http://blog.csdn.net/leshami/article/details/8569759

时间: 2024-09-30 09:18:32

Linux/Unix shell 监控Oracle告警日志(monitor alter log file)的相关文章

Linux/Unix shell 监控Oracle监听器(monitor listener)

使用shell脚本实现对Oracle数据库的监控与管理将大大简化DBA的工作负担,如常见的对实例的监控,监听的监控,告警日志的监控,以及数据库的备份,AWR report的自动邮件等.本文给出Linux 下使用 shell 脚本来监控 Oracle 监听器. Linux Shell的相关参考:        Linux/Unix shell 脚本中调用SQL,RMAN脚本        Linux/Unix shell sql 之间传递变量        Linux/Unix shell 调用

Linux/Unix shell 监控Oracle实例(monitor instance)

使用shell脚本实现对Oracle数据库的监控与管理将大大简化DBA的工作负担,如常见的对实例的监控,监听的监控,告警日志的监控,以及数据库的备份,AWR report的自动邮件等.本文给出Linux 下使用 shell 脚本来监控 Oracle 实例. Linux Shell的相关参考:        Linux/Unix shell 脚本中调用SQL,RMAN脚本        Linux/Unix shell sql 之间传递变量        Linux/Unix shell 调用 P

Linux/Unix shell 脚本中调用SQL,RMAN脚本

Linux/Unix shell脚本中调用或执行SQL,RMAN 等为自动化作业以及多次反复执行提供了极大的便利,因此通过Linux/Unix shell来完成Oracle的相关工作,也是DBA必不可少的技能之一.本文针对Linux/Unix shell脚本调用sql, rman 脚本给出了相关示例. 一.由shell脚本调用sql,rman脚本 [python] view plain copy print? 1.shell脚本调用sql脚本 #首先编辑sql文件 [email protecte

ORACLE告警日志文件

告警日志介绍 告警日志文件是一类特殊的跟踪文件(trace file).告警日志文件命名一般为alert_<SID>.log,其中SID为ORACLE数据库实例名称.数据库告警日志是按时间顺序记录message和错误信息. 告警日志位置 在ORACLE 10g中,BACKGROUND_DUMP_DEST参数确定了告警日志的位置,但是告警日志的文件名无法修改,告警日志的名称为:alert_<SID>.log ,其中<SID>是实例的名称.BACKGROUND_DUMP_D

Linux/Unix shell 自动发送AWR report(二)

观察Oracle数据库性能,Oracle自带的awr 功能为我们提供了一个近乎完美的解决方案,通过awr特性我们可以随时从数据库提取awr报告.不过awrrpt.sql脚本执行时需要我们提供一些交互信息,因此可以将其整合到shell脚本中来实现自动产生指定时段的awr报告并发送给相关人员.本文对Linux/Unix shell 自动发送AWR report的功能进行了完善和补充. 1.shell脚本 [python] view plain copy print? [email protected

Linux/Unix shell sql 之间传递变量

灵活结合Linux/Unix Shell 与SQL 之间的变量传输,极大程度的提高了DBA的工作效率,本文针对Linux/Unix shell sql 之间传递变量给出几个简单的示例以供参考. Linux/Unix 下调用SQL,RAMN 请参考:Linux/Unix shell 脚本中调用SQL,RMAN脚本 一.示例 [python] view plain copy print? 1.shell变量接受sql返回值之方式一 [email protected]:~> more ./retval

Oracle 联机重做日志文件(ONLINE LOG FILE)

--========================================= -- Oracle 联机重做日志文件(ONLINE LOG FILE) --========================================= 一.Oracle中的几类日志文件 Redo log files      -->联机重做日志 Archive log files   -->归档日志 Alert log files     -->告警日志 Trace files        

Linux Unix shell 编程指南学习笔记(第一部分)

第一章:文件安全与权限: 1.文件和目录的权限 创建文件时系统保存了文件所有相关的信息,包括 文件的位置 . 文件类型 . 文件长度 . 哪位用户拥有该文件,哪些用户可以访问该文件 . i 节点 . 文件的修改时间 . 文件的权限位 . 文件类型: d: 目录 l : 符号链接(指向另一个文件) s: 套接字文件 b: 块设备文件 c: 字符设备文件 p: 命名管道文件 -: 不属于上述类型的文件 文件权限 XXX       XXX        XXX 最左边 XXX : 文件属主 权限位

Linux/Unix shell 自动发送AWR report

观察Oracle数据库性能,Oracle自带的awr 功能为我们提供了一个近乎完美的解决方案,通过awr特性我们可以随时从数据库提取awr报告.不过awrrpt.sql脚本执行时需要我们提供一些交互信息,因此可以将其整合到shell脚本中来实现自动产生指定时段的awr报告并发送给相关人员.本文即是描述linux shell脚本来实现此功能.        1.shell脚本 [python] view plain copy print? [email protected]:~/dba_scrip