当前位置:Gxlcms > 数据库问题 > 如何实时检测mysql主从状态,并做邮件告警?

如何实时检测mysql主从状态,并做邮件告警?

时间:2021-07-01 10:21:17 帮助过:15人阅读

                                                      实时检测mysql主从状态,并做邮件告警

 需求分析:

    当我们做完主从后,主从成功的话,Slave_IO_Running和Slave_SQL_Running两个进程的状态就为yes,但是在做主从同步时也不排除,会发生一些意外的情况,所以我们需要写个脚本来实时检测Slave_IO_Running和Slave_SQL_Running的状态,一旦mysql主从状态出现了状况,就通过邮件发送告警,然后再做维护。

 

 脚本思路:

   定时检测mysql主从状态,说白的了就是通过脚本让系统去自我检测主从状态,如果是主从状态是正常的,那就不做告警出来,但一旦发生状态异常,就通过发送邮件给运维人员,运维人员收到告警邮件后,然后就做相关的维护处理

 

 1、邮件告警,我直接用的是Python写的脚本做邮件信息发送,你也可以yum装个sendmail包,做信息发送,脚本如下。

[root@mysqlslave ~]# cd /python/send_mail.py
#!/usr/bin/python
#coding: utf-8
import smtplib
import sys
from email.mime.text import MIMEText
_user = "847536**@qq.com"    ##这里填写你的邮件号
_pwd  = "ilbsly******"   
##这里填写你邮件的密码 ,我这里使用的是qq邮箱(其他邮箱也可以),qq邮箱密码是要到QQ邮箱里面申请的,然后它会生成一个密码的
#_to   = "dsf@163.com"    ##这里是发送给谁,这个一般注释掉,在执行脚本的时候指定发给谁就可以了
def send_mail(to,subject,contain):
    msg = MIMEText(contain)
    msg["Subject"] = subject
    msg["From"]    = _user
    msg["To"]      = to
    try:
        s = smtplib.SMTP_SSL("smtp.qq.com", 465)
        s.login(_user, _pwd)
        s.sendmail(_user, to, msg.as_string())
        s.quit()
        with open('/tmp/zabbix.log', 'w') as f:
            f.write("%s\n%s\n%s\n"%(to,subject,contain))
#        print "Success!"
    except smtplib.SMTPException,e:
        print "Falied,%s"%e
if __name__ == "__main__":
    send_mail(sys.argv[1], sys.argv[2], sys.argv[3])


2、检测脚本编写

   接下来,写个检测主从脚本,按照我们的思路来说,首先是把Slave_IO_Running和Slave_SQL_Running的状态获取,然后利用if语句判断,如果状态为NO就通过Python脚本来发送邮件,严重一点的,如果从服务器的MySQL服务down了,我们也发送邮件告警,把整个过程执行过程,写的时间任务里面,这里我们需要使用函数来实现,这个方便快捷,接下来我详细解析。

[root@mysqlslave ~]# cd /python/checkslave.sh 
#!/bin/bash   
send_mail (){            ##定义一个函数,用来做整合检测MySQL状态内容。

ip=`ifconfig eth0 | sed -n 2p | awk '{print $2}' | cut -d: -f2`   
##获取本地的ip,我的本地网卡为eth0,使用sed、awk、cut命令获取IP地址

hostname=`hostname`      ##获取本地的主机名

status=(`mysql -uroot -pmichael123456  -e "show slave status\G"|grep "Running" |awk '{print $2}'`)   
##通过MySQL命令获取Slave_IO_Running和Slave_SQL_Running的状态,获取出来的结果是(Yes、Yes、slave),因为有三个元素,所以我们可以使用元组来实现

netstat -ntpl | grep 3306  ##查看3306是否存在,用来做检测MySQL的状态
  
if [ $? -eq 0 ];then    
##写一个判断语句如果netstat命令执行成功话,输出$?是0,不存在$?输出结果大于0

     if [ "${status[0]}" == "Yes" ] || [ "${status[1]}" == "Yes" ] ;then 
      ##获取元组的第零个元素数和第一个元素,使用if判断,采用并集。
            echo "主从复制成功" 
     else    ##做个判断
            python /python/send_mail.py "847536944@qq.com" "$hostname:$ip-主从复制失败" "$hostname:$ip- Slave_IO_Running 或者 Slave_SQL_Running已经为NO请尽快:做维护处理"
             ##当输出的元组的结果不为Yes,然后就执行,邮件发送告警$hostname 、$ip为获取的参数
            
            sed  -i 's/^*\/10/#&/g' /etc/crontab   
            ##为了防止,它一直在邮件告警,我们需要用sed注释掉,计划任务,这个的作用就是只允许发送故障后,
            #脚本只执行一次,当然,如果你想发两封的邮件,你也可以添加发送邮件命令两遍。
     fi
else
     python /python/send_mail.py "847536944@qq.com" "$hostname:$ip-slave主机mysql服务已经关闭" "$hostname:$ip-主机已经停止运行请尽快做维护"
     ##netstat输出$?的结果不为0,发送告警。
fi
}
$1   ##添加函数的参数,让自己决定是否执行该函数
crontab () {
  cat /etc/crontab | grep "bash $0 send_mail "   ##查找是否有计划任务
  if [ $? -eq 0 ]; then    ##做判断,有就输出有,没有就写入
     echo "The port test has been written to the time task"
  else
     echo "*/10 * * * *  root  bash $0 send_mail " >> /etc/crontab ##定义每十分钟,执行一次
  fi   
} 
crontab




3、执行结果

[root@mysqlslave ~]# bash /python/checkslave.sh   #执行第一次,查看不了效果

##通过函数来执行,可以发现,已经有效果了,

[root@mysqlslave ~]# bash /python/checkslave.sh send_mail  
Warning: Using a password on the command line interface can be insecure.
tcp        0      0 :::3306                 :::*                    LISTEN      27684/mysqld
主从复制成功
*/10 * * * *  root  bash /python/checkslave.sh send_mail 
The port test has been written to the time task

4、模拟故障

我把slave停掉了,等了几分钟后,已经可以收到邮件了,结果如下:

技术分享图片



5、总结

  感觉写了个脚本后,发现已经不用每隔一段时刻要自己检测slave的状态了。方便了很多,当然,还有别的方法,也同样可以的做主从复制状态监控。

  

如何实时检测mysql主从状态,并做邮件告警?

标签:command   一个   awk   模拟   exce   cat   name   一段   排除   

人气教程排行