文档章节

如何使用Cloud Insight SDK 监控druid

CloudInsight
 CloudInsight
发布于 2016/01/27 17:44
字数 1448
阅读 1.6K
收藏 2

钉钉、微博极速扩容黑科技,点击观看阿里云弹性计算年度发布会!>>>

Druid 简介与用途

首先说明,这里所说的 Druid 并不是阿里巴巴的数据库连接池项目,而是 Eric Tschetter 创立的一个开源的分布式实时处理系统,希望为烧钱的大数据处理,提供一种更廉价的选择。为了解决查询延迟问题,使用 Hadoop 来实现交互式查询分析很难满足实时分析的需要。而 Druid 提供了以交互方式访问数据的能力,并权衡了查询的灵活性而采取了特殊的存储格式。

作为一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,Druid 能够快速处理大规模的数据,并实现快速查询和分析。即使发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid 仍能够保持 100% 正常运行。

目前 Druid 应用最多场景是广告分析,包括互联网广告系统监控、度量和网络监控。并且 eBay 也已经计划将 Druid 用于生产环境中。

而时刻关注新技术的 OneAPM 也试图对 Druid 的指标进行展示。

使用 Cloud Insight SDK 监控 Druid

Cloud Insight 根据 StatsD 进行了修改,形成了 Cloud Insight SDK,可以方便用户上传自定义指标至 Cloud Insight,目前支持的数据类型有,Counters 和 Gauges, 语言仅支持 Python。

使用 SDK 前先确保自己安装了 Cloud Insight Agent,并且 Agent 处于运行的状态。

由于被监控的机器处于内网环境下,并不能与外网通讯。所以为了使用 Cloud Insight,需要部署一台主节点来接收其他机器的数据,并将数据发送至 Cloud Insight 后端。简要的配置方法如下:

  1. 修改 yum.conf,添加一行 “proxy=http://10.173.9.xx:xx”
  2. 手动在一个有外网 IP 的机器上下载了 install_agent.sh
  3. 把 install_agent.sh 拷贝到需要安装探针的机器上,运行sudo sh install_agent.sh
  4. 手动修改/etc/oneapm-ci-agent/oneapm-ci-agent.conf,添加 proxy 配置
  5. 重启 oneapm-ci-agent 服务

好了,搞定这一切之后,就只需要使用pip来安装 SDK 了。

pip install -i http://pypi.oneapm.com/simple --upgrade oneapm-ci-sdk

Druid 脚本说明

Cloud Insight SDK 共有 Counters 和 Gauges 两种数据类型,下面结合 Druid 脚本来对数据类型做一些说明。

由于用户的代码跟使用的服务比较相关,在此就不提供代码了,可以看下面示例简单了解一下。Druid 监控示例脚本如下:

# coding: utf8 

from oneapm_ci_sdk import statsd 

# 发送标准数据,即数值是float, int类型的数据 
# statsd.gauge(metric, value, tags=None, sample_rate=1) 
statsd.gauge('yaiba.test_gauge', 130.4, tags='yaiba_gauge') 

# 增加数据的值 
# statsd.increment(metric, value=1, tags=None, sample_rate=1) 
statsd.increment('yaiba.test_inc') # +1  
statsd.increment('yaiba.test_inc', 100, 'whatever', 0.7) # 增加100,采样比例是 70% 

# 减少数据的值 
# statsd.decrement(metric, value=1, tags=None, sample_rate=1) 

# ------------- 
# 以上数据都是立刻发送给探针 

# 批量发送 
# statsd.open_buffer(max_buffer_size=50) 

# statsd.close_buffer() 
statsd.open_buffer()  
statsd.gauge('yaiba.test_gauge', 13.4, tags='yaiba_gauge')  
statsd.gauge('yaiba.test_gauge', 10.4, tags='yaiba_gauge')  
statsd.gauge('yaiba.test_gauge', 130.4, tags='yaiba_gauge')  
statsd.close_buffer() 

# Or 
with statsd as batch:  
    statsd.gauge('yaiba.test_gauge', 13.4, tags='yaiba_gauge') 
    statsd.gauge('yaiba.test_gauge', 10.4, tags='yaiba_gauge') 
    statsd.gauge('yaiba.test_gauge', 130.4, tags='yaiba_gauge')

Counters

Counters 是 StatsD 和 Cloud Insight SDK 最基本的一种数据类型。当调用increment和decrement时,对参数进行自增或自减。如:

statsd.increment('yaiba.test_inc')

是将yaiba.test_inc这个指标的数值自增1。increment方法可以包含 4 个参数:metric_name、stepping、metric_tags、sample_rate。如:

statsd.increment('yaiba.test_inc', 100, 'whatever', 0.7)

是将yaiba.test_inc这个指标的数值自增100,并且标签信息为whatever,而采样率为 0.7.

采样率

Cloud Insight SDK 通过sample_rate参数来设置采样率。假设sample_rate=0.1:

在采集周期 30 s 内,只采集 10% 的数据。也就是说,调用了 10 次 increment,只自增了一次 Metric。

在数据量较大的情况下,可以确保采样的高效。

statsd.increment('page.views', sample_rate=0.1)

采样率会传递至 Agent,所以最终发送的数值,为计算采样率后的真实数值。 同样,decrement 和 increment 一样,使用相同的参数。

statsd.decrement('some.other.event')

# Decrease the counter by 5, 15% sample.

statsd.decrement('some.third.event', 5, rate=0.15)

Gauges

Gauges 是连续型的数据类型,也就是说,当我们第一次赋值后,该 Metric 表现在图表上,会是一条于 X 轴平行的直线;直到再次为该 Metric 赋了一个不同的值。

Gauges 可以用来度量一些已经计算过的数值,如 WebSockets 的有效链接数;而系统目前登录的用户数,则在每次用户登录时,调用 Counters 中的 increment 比较适合。

Gauges 支持 4 个参数,分别是metric_name、metric_value、metric_tags和sample_rate,如:

statsd.gauge('yaiba.test_gauge', 13.4, tags='yaiba_gauge')

是将13.4赋值给yaiba.test_gauge这个指标,并添加了yaiba_gauge这个标签信息。

Druid 监控效果

最后上两张 Druid 的监控效果截图。首先在平台页面,您可以直接查询自定义的一些指标,和它的数值。

如何使用 Cloud Insight SDK 实现 Druid 监控?

然后,使用自定义仪表盘,根据自己的业务来自建展现形式。

如何使用 Cloud Insight SDK 实现 Druid 监控?

总体来说,Cloud Insight Agent 的可配置项目很多。所以就算是在内网环境下使用,也没有问题。而 Cloud Insight SDK 也存在大量的注释,使用起来也不会有什么麻烦。数据类型也比较简单。

Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。本文由 OneAPM 工程师翻译整理,想阅读更多技术文章,请访问 OneAPM 官方技术博客

CloudInsight
粉丝 15
博文 3
码字总数 4653
作品 0
高级程序员
私信 提问
加载中
请先登录后再评论。
可视化系统监控工具 - Cloudinsight Agent

Cloudinsight 是一个可视化系统监控工具,能够对数据指标进行聚合、分组、过滤、 管理、计算;并提供团队协作功能,共同管理数据和报警事件。而这些的关键,正是 Cloudinsight Agent。 目前探...

Cloudinsight技术团队
2016/10/18
9.1K
4
系统监控工具 Cloudinsight Agent 正式开源

很高兴地宣布 Cloudinsight Agent 在 BSD 开源协议下正式开源了。我们的工程师在开源前已将代码用 Golang 重写,更加清晰简洁,欢迎大家参与到 Cloudinsight Agent 的开发和迭代中来。 为什么...

Cloudinsight技术团队
2016/10/18
269
0
Cloudinsight Agent 正式开源

很高兴地宣布 Cloudinsight Agent 在 BSD 开源协议下正式开源了。我们在开源前已将代码用 Golang 重写,更加清晰简洁,欢迎大家参与到 Cloudinsight Agent 的开发和迭代中来。 为什么要用 Go...

Cloudinsight技术团队
2016/10/18
6.1K
19
可视化系统监控工具 Cloudinsight Agent 正式开源

很高兴地宣布 Cloudinsight Agent 在 BSD 开源协议下正式开源了。我们的工程师在开源前已将代码用 Golang 重写,更加清晰简洁,欢迎大家参与到 Cloudinsight Agent 的开发和迭代中来。 为什么...

OneAPM蓝海讯通
2016/10/18
563
0
容器监控—阿里云&容器内部服务监控

目前[Docker][1]的使用越来越离不开对容器的监控,阿里云最近上线了容器服务,不但提供了核心的容器和宿主机监控能力,而且支持集成 [Cloud Insight][2] 监控,下面会介绍如何集成。 首先介绍...

OneAPM蓝海讯通
2016/06/02
91
0

没有更多内容

加载失败,请刷新页面

加载更多

插入,在PostgreSQL中重复更新吗? - Insert, on duplicate update in PostgreSQL?

问题: Several months ago I learned from an answer on Stack Overflow how to perform multiple updates at once in MySQL using the following syntax: 几个月前,我从关于堆栈溢出的答案......

技术盛宴
28分钟前
20
0
互联网的寒冬下各大一线互联网公司还在用SpringBoot这是为什么?

引言 现在各大技术社区 Spring Boot 的文章越来越多,Spring Boot 相关的图文、视频教程越来越多,使用 Spring Boot 的互联网公司也越来越多; Java 程序员现在出去面试, Spring Boot 已经成...

北柠Java
31分钟前
8
0
vue+elementui实现简易的列筛选功能实现。

一、简易效果图: 二、需求背景 大家都知道,后管类系统当中,有时一个列表可能有很多列需要展示,如下图所示,但是用户在使用系统的时候,往往会需要针对其中某几列进行数据提取,在展示列比...

一生懸命吧
33分钟前
60
0
批处理问题记录——数字实验bat

记录学习批处理时的问题 批处理为输入一个数字,如果大于等于一百,直接输出输入数字,如果小于一百会重复+1,直到100后输出。 问题是,如果不输入数字,直接空格的话,批处理会出错。 寻求一...

愤怒的乌老大
40分钟前
6
0
算法题汇总

计算两个字符串中的最大的相同字符串

佳幂小煜
50分钟前
27
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部