文档章节

OneAlert 入门(三)——事件分析

OneAPM蓝海讯通
 OneAPM蓝海讯通
发布于 2016/01/22 16:33
字数 1127
阅读 45
收藏 0

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第三篇,将帮助你快速了解和配置 OneAlert,从而挖掘该平台的最大价值。

OneAlert 入门(三)——事件分析

####事件分析 你此前用过的大多数工单系统或问题追踪系统都会要求你手动分类或联结工单。OneAlert 可不一样。OneAlert 事件流中的每个事件都是自动创建的,且以监控栈中实时产生的告警为基础。ZabbixNagios ,Solarwinds ,AWS CloudWatch ,阿里云 ,监控宝,腾讯云等国内外主流监控工具都能支持,而且新的应用正在快速集成。只要该工具会给 IT 和 DevOps(运维开发团队)产生告警,我们都会想办法与之集成。OneAlert 除了可以做一名合格的告警搬运工,还提供事件分析功能,目前包括总览、告警 Top 分析、告警压缩、应用,即将上线的还有面向 Team Leader 的团队分析、成员分析、通知分析功能。

OneAlert 入门(三)——事件分析

####Top分析----对告警内容和对象进行深入分析 OneAlert 提供两种 Top 分析,一种是根据告警内容产生告警的频繁次数进行排名分析;一种是根据告警对象产生告警的频繁次数进行排名分析。我们可以直观的看到哪些事件发生故障的次数排名,这样我们可以有针对的排除发生故障的原因,预防下次还频繁发生故障。我们还可以看相应告警的持续时间和 MTTA / MTTR,可以查看团队的工作效率,从而继续优化团队排班和升级策略。

OneAlert 入门(三)——事件分析

####告警压缩----减少噪音 生产环境中的一个问题可能导致多个告警。例如,一个磁盘问题可能会先导致磁盘 IO 告警。后者又很可能迅速触发一些列的 CPU,内存,数据库及应用告警。当然,在这种情况下,你可不想分开管理二十多个问题。实际上,它们都是同一个原因导致的。因此,OneAlert 会自动进行分组,将相关的告警整合为高级事件。OneAlert 的分组算法会使用主机名、集群和应用等信息,确保所有相关告警都分到同一组内。未来还会根据集群、应用和团队职责等进行分组。此外,算法还会考虑告警出现的时间顺序,使你对事件的了解更加深入。

OneAlert 入门(三)——事件分析

####前沿分享 以上事件分析功能主要面向运营团队的一线人员,未来我们将推出面向 Team Leader 的团队分析、成员分析、通知分析功能。让 Team Leader 可以直观看出团队设置的排版和升级策略是否需要继续优化,也可以看出每个人的确认告警的时间和解决故障的时间,查看整个团队和成员的工作效率。更多功能敬请期待。

OneAlert 能够实时地自动整合告警,并且通过多链路多种通知方式让告警最有效率的通知到相关人员,极大的缩短 MTTR,最后事件分析功能让团队价值最大化。这使 OneAlert 成为国内 IT 与 DevOps 团队管理并解决问题的最佳平台。在第四部分,我们会介绍如何在整个团队中使用该工具,从而最大限度地提高协作效率。

本文转自 OneAPM 官方博客

© 著作权归作者所有

OneAPM蓝海讯通
粉丝 94
博文 631
码字总数 1266889
作品 0
海淀
私信 提问
OneAlert 入门(一)——事件流

OneAlert 入门(一)——事件流 OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。它能以史上第二快的速度,...

OneAPM蓝海讯通
2016/01/21
43
0
OneAlert 入门(二)——事件分析

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分...

OneAPM蓝海讯通
2016/01/22
33
0
OneAlert 入门(四)——事件分派和通知必达

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分...

OneAPM蓝海讯通
2016/01/26
44
1
「技术大牛」是如何缩短事件平均解决时间的?

前不久,我们讨论了运维不容错过的 4个关键指标,其中平均解决时间(MTTR)被认为是衡量业务的最佳标准,随后也分析了「告警等级」对MTTR的重要性。 正确看待 MTTR MTTR 为从故障发生到故障修...

OneAPM蓝海讯通
2016/01/07
37
0
Zabbix-3.0.x 使用 OneAlert 发送告警

1、 认识OneAlrt 通过使用 OneAlert 的监控工具集成功能,轻松对接第三方监控工具告警事件。每一个需要集成的第三方工具,都是一个OneAlert App应用,每个应用的安装方式有些差异。 通过Age...

linuxprobe
2016/07/28
1K
0

没有更多内容

加载失败,请刷新页面

加载更多

Spark sql的批处理物理计划BatchScanExec

BatchScanExec是batch类的物理计划,对应的逻辑计划是DataSourceV2Relation,是Datasource。 它的入参是Scan类,Scan类有两个重要方法,一个获取分区列表信息;另一个方法获取读取器工厂。 ...

守望者之父
28分钟前
10
0
for循环与while循环

循环结构三要素 a. 初始值 b. 循环条件 c. 改变条件 for循环 声明格式 for(表达式1;表达式2;表达式3){ 循环体语句 } 表达式1:用来循环的变量初始值。(开始值) 表达式2:用来判断循环的条件。...

Lenat
34分钟前
11
0
进程描述符和内存描述符、进程栈、线程栈、内核栈

进程描述符 task_struct 线程创建的时候,加上了 CLONE_VM 标记,这样 线程的内存描述符 将直接指向 父进程的内存描述符。 内存描述符mm_struct 进程栈:stack 线程栈:使用mmap系统调用分配...

SibylY
36分钟前
12
0
Mybatis之TypeHandler

mybatis-3.4.6.release. TypeHandler在mybatis中是个重要的组件,对statement设置参数还是从Resultset中取值,都会用到它。 List-1 public interface TypeHandler<T> { void setParame......

克虏伯
46分钟前
11
0
js—String的一些方法

<!DOCTYPE html><html><head> <meta charset="UTF-8"> <title></title> <script type="text/javascript"> var str="Hello boy" /** * 在底......

zhengzhixiang
59分钟前
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部