Awesome Prometheus alerts

03/20 15:22
阅读数 17

其实快速的搭建一个监控平台很快,也很容易,但是如何通过使用一个监控平台采集的数据进行报警让数据说话才是我们做监控的主要目的。通常我们是如何知道环境中的服务出现问题的呢?


1. 用户反馈

2. 开发反馈

3. 自用自查


对于我来说,大部分时间都是不用这些服务的,只有出现问题的时候采取检查,那么如何做到尽量早的发现环境中有哪些问题呢?监控告警就是解决我的这个需求。我们就需要通过Alertmanager来将告警通过Slack,email,微信等等告诉我们。


这里不做Alertmanager的安装和概念的介绍,主要是对告警规则进行简单的描述。希望部分能帮助到你。


本文使用的exporter版本如下:


监控平台做好了,可是我们需要关注哪些指标呢?


Blackbox_exporter

cadvisor && Elasticsearch

kafka  && mongodb && MYSQL

Prometheus && RabbitMQ

Redis

主机基础监控

想获取告警配置的rules源文件,恢复"alertmanager-rules"获取。喜欢就关注我吧。

本文分享自微信公众号 - 云原生生态圈(CloudNativeEcoSystem)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部