文档章节

告警系统邮件引擎 运行告警系统

lyy549745
 lyy549745
发布于 07/18 21:03
字数 554
阅读 19
收藏 1

告警系统邮件引擎

  • 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。
  • 但是告警邮件引擎核心,conf主配置文件调用到的都是mail.sh ,所以这里需要定义调用mail.py的sh脚本
  • mail.sh目的是做告警收敛,如果不想做告警收敛,在发现问题的时候直接告警就好,但是,可能会发生1分钟前发现问题,1分钟户问题解决,这样就会变成误报,这样会很麻烦
  • 收敛的目的就是1分钟前发现问题,然后到10分钟后,服务还没有恢复,就会告诉管理人员10分钟了服务还未恢复
  • mail.sh内容 //其中mail.py内容
#!/bin/bash

log=$1   
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s`  //定义2个小时的时间戳
#日志不存在就创建日志
if [ ! -f /tmp/$log ]
then
    echo $t_s2 > /tmp/$log
fi

#下面这段,等同于一个计时器

t_s2=`tail -1 /tmp/$log|awk '{print $1}'`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2]   //时间戳对比
echo $v

#当故障存在3600秒,就会进行告警

if [ $v -gt 3600 ]
then
    ./mail.py  $1  $2  $3
    echo "0" > /tmp/$log.txt  //等同于计数器
else
    if [ ! -f /tmp/$log.txt ]
    then
        echo "0" > /tmp/$log.txt
    fi
    nu=`cat /tmp/$log.txt`
    nu2=$[$nu+1]
    echo $nu2>/tmp/$log.txt
    if [ $nu2 -gt 10 ]
    then
         ./mail.py  $1 "trouble continue 10 min $2" "$3"
         echo "0" > /tmp/$log.txt   //邮件告警结束以后,重新开始计数
    fi
fi  
  • 该脚本运用于,间隔3600 故障;10分钟内故障;间歇性故障;
  • 核心判断:计时、计数

运行告警系统

  • 要执行告警系统,肯定要是每分钟,执行一次
crontab -e
* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh
  • 监控发送邮件的部分,尽量少用空格,因为mail.py发送邮件是以 空格来定义三个参数的

© 著作权归作者所有

共有 人打赏支持
lyy549745
粉丝 5
博文 88
码字总数 207267
作品 0
深圳
加载中

评论(1)

Nash_xiang
Nash_xiang
可以使用微信公众号api来实现微信告警,毕竟现在email告警的实效性不高
告警系统邮件引擎&运行告警系统

20.23/20.24/20.25 告警系统邮件引擎 告警邮件引擎的核心,conf主配置文件调用到的都是mail.sh 告警邮件引擎的核心需要定义调用mail.py的sh脚本,因为之前做zabbix的时候,做过mail.py的脚本...

影夜Linux
07/19
0
0
20.23/20.24/20.25 告警系统邮件引擎 20.26 运行告警系统

20.23/20.24/20.25 告警系统邮件引擎 因为之前做zabbix的时候,做过mail.py的脚本,在这里,直接调用进行使用就可以。 但是告警邮件引擎核心,conf主配置文件调用到的都是"mail.sh" ,所以这...

JasonYan86
03/28
0
0
20.23 20.24 20.25 告警系统邮件引擎20.26 运行告警系统

20.23 20.24 20.25 告警系统邮件引擎 把之前zabbix设置好的邮件拷贝到mail目录下 cd /usr/local/sbin/mon/mail vim mail.sh 这个脚本的目的是做告警收敛的,就是服务没有恢复超过一定时间才会...

cwliang
06/29
0
0
2018-4-24 17周5次课 告警系统邮件引擎

20.23/20.24/20.25 告警系统邮件引擎 ·mail.sh内容 其中 mail.py 内容到这里下载https://note.youdao.com/share/?id=dac98a142b86abba9b118e113969d4c4&type=note#/ mail.sh为的是做告警手收......

alexis7gunner
04/23
0
0
利用StackStorm实现故障智能诊断

携程旅行网是国内领先的在线旅游服务公司,也是国内规模较大的互联网公司之一。随着近年来业务的迅猛增长,支撑网站的技术和系统的复杂性和规模也随之呈跳跃性的攀升。要迎接网站规模和复杂性...

神谕03
07/01
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

qduoj~前端~二次开发~打包docker镜像并上传到阿里云容器镜像仓库

上一篇文章https://my.oschina.net/finchxu/blog/1930017记录了怎么在本地修改前端,现在我要把我的修改添加到部署到本地的前端的docker容器中,然后打包这个容器成为一个本地镜像,然后把这...

虚拟世界的懒猫
今天
1
0
UML中 的各种符号含义

Class Notation A class notation consists of three parts: Class Name The name of the class appears in the first partition. Class Attributes Attributes are shown in the second par......

hutaishi
今天
1
0
20180818 上课截图

小丑鱼00
今天
1
0
Springsecurity之SecurityContextHolderStrategy

注:下面分析的版本是spring-security-4.2.x,源码的github地址是: https://github.com/spring-projects/spring-security/tree/4.2.x 先上一张图: 图1 SecurityContextHolderStrategy的三个......

汉斯-冯-拉特
今天
1
0
LNMP架构(Nginx负载均衡、ssl原理、生成ssl密钥对、Nginx配置ssl)

Nginx负载均衡 网站的访问量越来越大,服务器的服务模式也得进行相应的升级,比如分离出数据库服务器、分离出图片作为单独服务,这些是简单的数据的负载均衡,将压力分散到不同的机器上。有时...

蛋黄_Yolks
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部