加载中
Prometheus 告警恢复时,怎么获取恢复时的值?

Prometheus 告警事件中的 $value 表示当前告警触发时的值,但是在告警恢复时,Resolved 事件中的 $value 仍然是最新告警时的值,并非是恢复时的值,这是什么原因和原理?是否有办法来解决呢?...

透过 node*exporter 彻底弄懂机器监控 01. node*exporter 框架讲解

前言 Prometheus 生态里有很多采集器负责各类监控数据的采集,其中使用最广泛的,显然是 node-exporter,负责 Linux、BSD 等系统的常规监控指标的采集,比如 CPU、内存、硬盘、网络、IO 等。...

大一统的监控探针采集器 cprobe

需求背景 监控数据采集领域,比如 Prometheus 生态有非常多的 Exporter,虽然生态繁荣,但是无法达到开箱即用的大一统体验,Exporter 体系的核心问题有: 良莠不齐:有的 Exporter 写的非常棒...

01/13 10:56
68
Prometheus 14 点实践经验分享

这是 2017 年的 promcon 的分享,原文地址在这里,作者 Julius Volz,今天偶然看到,虽然已经过去 6 年,有些实践经验还是非常值得学习。做个意译,加入一些自己的理解,分享给大家。 埋点方...

2023/12/29 18:22
75
使用 JMX-Exporter 监控 Kafka 和 Zookeeper

JVM 默认会通过 JMX 的方式暴露基础指标,很多中间件也会通过 JMX 的方式暴露业务指标,比如 Kafka、Zookeeper、ActiveMQ、Cassandra、Spark、Tomcat、Flink 等等。掌握了 JMX 监控方式,就掌...

夜莺官方文档优化第一弹:手把手教你部署和架构讲解,消灭所有部署失败的case!干!

前置说明 各种环境的选型建议 Docker compose 方式:仅仅用于简单测试,不推荐在生产环境使用 Docker compose,升级起来挺麻烦的,除非你对 Docker compose 真的很熟 二进制部署:最推荐的方...

2023/05/18 11:37
722
Prometheus 瘦身第一步,使用 mimirtool 找到没用的 Prometheus 指标

简介 最近我有一个任务,需要跟踪、搞定 series 基数问题,并显著减少 Prometheus 的资源使用。为了做到这一点,我首先需要分析系统。在本文中,我将解释如何使用 mimirtool 来识别平台上使用...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部