使用paramiko监控Oracle alert日志

上节我们讲了如何连接linux/Unix服务器

这节我们将其应用在我们的Oracle运维中,用它来监控Oracle alert日志

环境设置

Linux系统为 Centos 6.8

Python环境为 Python 3.6

连接Unix类服务器模块: paramiko

使用的命令

我们使用grep命令来判断alert日志中是否有ORA Error及Checkpoint报警

监控alert日志程序

如下程序使用paramiko连接linux/Unix服务器后查看alert日志查看报警关键字,当发现错误时输入结果

我们可以for循环批量监控并发送结果到指定的邮箱,这部分就让大家自己写了,可参照我以前的文章

这样即可做到自动化监控了,可大幅减少DBA日常的工作

自动化监控多个Oracle表空间

使用Python发送邮件

程序名称为:checkoraclelog.py

#!/usr/bin/python
#coding=utf8
import paramiko

def oraclelog(ssh,path):
        alert_log=[]
        command='grep  -E \'ORA-|Checkpoint|Error\' '+path
        stdin,stdout,stderr=ssh.exec_command(command)
        err=stderr.readlines()
        if len(err) != 0:
            print (err)
            return False
        else:
            stdout_content=stdout.readlines()
        if len(stdout_content)!=0:
            result='\n'.join(stdout_content)
            result= 'Oralce log on '+hostname+ ' have errors\n'+'The log path is '+path+'\n'+result
            alert_log.append(result)
            return alert_log
        else:
            return 'noerror'

if __name__ == '__main__':
    hostname='10.60.14.60'
    username='root'
    password='password'
    try:
        #使用SSHClient方法定义ssh变量
        ssh = paramiko.SSHClient()
        ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
        #连接目标服务器
        ssh.connect(hostname=hostname,port=22,username=username,password=password)
        path='/oracle/NP1/saptrace/background/alert_NP1.log'
        alert_log=oraclelog(ssh,path)
        ssh.close()
        if alert_log:
            if alert_log !='noerror':
                for i in alert_log:
                    print (i)
            else:
                print ('There is no ORA- error on '+hostname)
    except Exception as e:
        print (hostname+' '+str(e))

验证结果

Alt text

Alt text

正常情况下如果有ORA等错误会输出结果

如不正常,代码中大量的异常处理可以帮助大家快速定位异常点

源码位置

全部代码请查看我的Github主页

https://github.com/bsbforever/wechat_oms

今天就讲到这,下节将是一个总结。