文档章节

利用神器BTrace 追踪线上 Spring Boot应用运行时信息

CodeSheep
 CodeSheep
发布于 01/17 07:34
字数 1803
阅读 3974
收藏 199

Profile


概述

生产环境中的服务可能会出现各种问题,但总不能让服务下线来专门排查错误,这时候最好有一些手段来获取程序运行时信息,比如 接口方法参数/返回值、外部调用情况 以及 函数执行时间等信息以便定位问题。传统的日志记录方式的确可以,但有时非常麻烦,甚至可能需要重启服务,因此代价太大,这时可以借助一个牛批的工具:BTrace

BTrace 可用于动态跟踪正在运行的 Java程序,其原理是通过动态地检测目标应用程序的类并注入跟踪代码 ( “字节码跟踪” ),因此可以直接用于监控和追踪线上问题而无需修改业务代码并重启应用程序。

BTrace 的使用方式是用户自己编写符合 BTrace使用语法的脚本,并结合btrace命令,来获取应用的一切调用信息,就像下面这样:

<btrace>/bin/btrace <PID> <trace_script>
  • 其中 <PID>为被监控 Java应用的 进程ID
  • <trace_script> 为 根据需要监控的信息 而自行编写的 Java脚本

本文就来实操一波 BTrace工具的使用,实验环境如下:

注: 本文首发于 My Personal Blog:CodeSheep·程序羊,欢迎光临 小站


BTrace 安装部署

这里我解压到目录:/home/btrace

  • 配置系统环境变量
vim /etc/profile

BTRACE_HOME=/home/btrace
export BTRACE_HOME
export PATH=$PATH:$BTRACE_HOME/bin
  • 验证 BTrace安装情况
btrace --version

编译 BTrace源码

  • 克隆源码
git clone git@github.com:btraceio/btrace.git
  • 编译源码
./gradlew build

编译源码

  • 构建完成的生成物路径位于build/libs目录下

构建生成物路径

我们取出构建生成的 jar包供下文使用。


利用btrace追踪 Spring Boot应用例析

首先我们得构造一个 Spring Boot的模拟业务 用于下文被追踪和分析,这里我就使用文章 《Spring Boot应用缓存实践之:Ehcache加持》中的实验工程。

我们在此工程里再添加一个 scripts包,用于放置 btrace 脚本文件:

项目结构

由于 btrace脚本中需要用到 btrace相关的组件和函数库,因此我们还需要在工程的 pom.xml中引入 btrace的依赖,所使用的 jar包就是上文编译生成的 btrace-1.3.11.3.jar

        <dependency>
            <groupId>com.sun.btrace</groupId>
            <artifactId>btrace</artifactId>
            <version>1.3.11.3</version>
        </dependency>

Talk is cheap ,Show you the code !接下来就用四五个实验来说明一切吧:


0x01 监控方法耗时情况

btrace 脚本:

@BTrace
public class BtraceTest2 {

    @OnMethod(clazz = "cn.codesheep.springbt_brace.controller.UserController", method = "getUsersByName", location = @Location(Kind.RETURN))
    public static void getFuncRunTime( @ProbeMethodName String pmn, @Duration long duration) {
        println( "接口 " + pmn + strcat("的执行时间(ms)为: ", str(duration / 1000000)) ); //单位是纳秒,要转为毫秒
    }
}

接下来开始运行 btrace脚本来拦截方法的参数,首先我们用 jps命令取到需要被监控的 Spring Boot应用的进程 Id为 27887,然后执行:

/home/btrace/bin/btrace 27887 BtraceTest2.java

这里我总共对 /getusersbyname接口发出了 12次 POST请求,情况如下:

12次请求情况

接下来我们再看看利用btrace脚本监控到的 /getuserbyname接口的执行时间:

12次请求所对应的接口调用时间

这样一对比很明显,从数据库取数据还是需要 花费十几毫秒的,但从缓存读取数据 几乎没有耗时,这就是为什么要让缓存加持于应用的原因!!!


0x02 拦截方法的 参数/返回值

btrace 脚本:

    @OnMethod(
            clazz = "cn.codesheep.springbt_brace.controller.UserController",
            method = "getUsersByName",
            location = @Location(Kind.ENTRY)
    )
    public static void getFuncEntry(@ProbeClassName String pcn, @ProbeMethodName String pmn, User user ) {

        println("类名: " + pcn);
        println("方法名: " + pmn);

        // 先打印入参实体整体信息
        BTraceUtils.print("入参实体为: ");
        BTraceUtils.printFields(user);

        // 再打印入参实体每个属性的信息
        Field oneFiled = BTraceUtils.field("cn.codesheep.springbt_brace.entity.User", "userName");
        println("userName字段为: " + BTraceUtils.get(oneFiled, user));

        oneFiled = BTraceUtils.field("cn.codesheep.springbt_brace.entity.User", "userAge");
        println("userAge字段为: " + BTraceUtils.get(oneFiled, user));

    }

接下来开始运行 btrace脚本来拦截方法的参数,首先我们用 jps命令取到需要被监控的java应用的进程 Id为 27887,然后执行:

/home/btrace/bin/btrace -cp springbt_brace/target/classes 27887 BtraceTest4.java

此时正常带参数 {"userName":"codesheep.cn"} 去请求业务接口:POST /getusersbyname,会得到如下输出:

成功拦截到了接口入参

很明显请求参数已经被 btrace给拦截到了

同理,如果想拦截方法的返回值,可以使用如下 btrace脚本:

    @OnMethod(
            clazz = "cn.codesheep.springbt_brace.controller.UserController",
            method = "getUsersByName",
            location = @Location(Kind.RETURN)  //函数返回的时候执行,如果不填,则在函数开始的时候执行
    )
    public static void getFuncReturn( @Return List<User> users ) {
        println("返回值为: ");
        println(str(users));
    }

运行 btrace命令后,继续请求想要被监控的业务接口,则可以得到类似如下的输出:

成功拦截到了接口返回值


0x03 监控代码是否到达了某类的某一行

btrace 脚本如下:

@BTrace
public class BtraceTest3 {

    @OnMethod(
            clazz="cn.codesheep.springbt_brace.service.UserService",
            method="getUsersByName",
            location=@Location(value= Kind.LINE, line=28)  // 比如拦截第28行, 28行是从数据库取数据操作
    )
    public static void lineTest( @ProbeClassName String pcn, @ProbeMethodName String pmn, int line ) {
        BTraceUtils.println("ClassName: " + pcn);
        BTraceUtils.println("MethodName: " + pmn);
        BTraceUtils.println("执行到的line行数: " + line);
    }
}

执行 btrace追踪命令

/home/btrace/bin/btrace 28927 BtraceTest3.java

接着用 POSTMAN工具连续发出了对 /getuserbyname接口的 十几次POST请求,由于只有第一次请求没有缓存时才会从数据库读,因此也才会执行到 UserService类的第 28行 !


0x04 监控指定函数中所有外部调用的耗时情况

btrace脚本如下:

@BTrace
public class BtraceTest5 {

    @OnMethod (clazz = "cn.codesheep.springbt_brace.service.UserService",method = "getUsersByName",
    location=@Location(value= Kind.CALL, clazz="/.*/", method="/.*/", where = Where.AFTER) )
    public static void printMethodRunTime(@Self Object self,@TargetInstance Object instance,@TargetMethodOrField String method, @Duration long duration) {

        if( duration > 5000000 ){  //如果外部调用耗时大于 5ms 则打印出来
            println( "self: " + self );
            println( "instance: " + instance );
            println( method + ",cost:" + duration/1000000 + " ms" );
        }
    }

}

执行监控命令:

/home/btrace/bin/btrace 28927 BtraceTest5.java

然后再对接口 /getuserbyname发出POST请求,观察监控结果如下:

发现最耗时的外部调用来源于 MyBatis调用

我们发现最耗时的外部调用来源于 MyBatis调用。


0x05 其他追踪与监控

除了上面四种典型的追踪场景之外,其他的 btrace追踪与监控场景还比如 查看谁调用了System.gc(),调用栈如何,则可以使用如下 btrace脚本进行监控

@BTrace
public class BtraceTest {
    @OnMethod(clazz = "java.lang.System", method = "gc")
    public static void onSystemGC() {
        println("entered System.gc()");
        jstack();
    }
}

很明显,因为btrace 内置了一系列诸如 jstack等十分有用的监控命令。

当然最后需要说明的是 btrace内置了很多语法和命令,可以应对很多线上 Java应用监控场景,大家可以去研究一下官方文档


后记

由于能力有限,若有错误或者不当之处,还请大家批评指正,一起学习交流!



© 著作权归作者所有

共有 人打赏支持
CodeSheep

CodeSheep

粉丝 207
博文 70
码字总数 97482
作品 0
南京
程序员
私信 提问
加载中

评论(7)

not3
not3
在测试环境查问题满好的,生产环境你敢用?
Ryan-瑞恩
Ryan-瑞恩

引用来自“Ryan-瑞恩”的评论

以后不用写代码了,,阿里开源的 arthas 可以帮你完成这些动作!

引用来自“CodeSheep”的评论

arthas和btrace各有所长
绝对的代替肯定是不行的。
CodeSheep
CodeSheep

引用来自“Ryan-瑞恩”的评论

以后不用写代码了,,阿里开源的 arthas 可以帮你完成这些动作!
arthas和btrace各有所长
CodeSheep
CodeSheep

引用来自“gm100861”的评论

脚本不是还要提前放到项目里面吗? 如果没有提前把脚本放进去,不是还要放进去再重新发布才能用么.
当然不需要
g
gm100861
脚本不是还要提前放到项目里面吗? 如果没有提前把脚本放进去,不是还要放进去再重新发布才能用么.
Ryan-瑞恩
Ryan-瑞恩
以后不用写代码了,,阿里开源的 arthas 可以帮你完成这些动作!
彼端的云
已学习
【JVM】基于BTrace的监控调试

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zlt995768025/article/details/81809513 BTrace简介 BTrace可以动态地向目标应用程序的字节码注入追踪代码 Ja...

周丽同
2018/08/18
0
0
动态实时跟踪你的java程序

文章转自:http://www.tbdata.org/archives/1851 之前有写 基于AOP的日志调试 讨论一种跟踪Java程序的方法, 但不是很完美.后来发现了 Btrace , 由于它借助动态字节码注入技术 , 实现优雅且功...

鉴客
2011/08/15
3.4K
1
BTrace介绍和生产环境例子

一/简单介绍 BTrace 是一个可靠的,用来动态跟踪Java程序的工具。它通过动态对运行中的Java程序进行字节码生成来工作。BTrace会对运行中的Java程序的类插入一些跟踪操作 来对被跟踪的程序进...

令飞
2015/04/15
0
0
zookeeper 大量连接断开重连原因排查

问题现象 最后发现线上的zookeeper的日志zookeeper.out 文件居然有6G,后来设置下日志为滚动输出,参考: http://blog.csdn.net/hengyunabc/article/details/19006911 但是改了之后,发现一天...

横云断岭
2014/11/24
0
0
JDK的可视化工具系列 (四) JConsole、VisualVM

JConsole: Java监视与管理控制台 代码清单1: import java.util.*; public class JConsoleDemo { } 内存监控: 编译运行JConsoleDemo类, 运行时设置的虚拟机参数为 -Xms100m -Xmx100m -XX:+Use...

qingshanli
2018/07/19
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Httpd 整合 Tomcat 步骤

环境:Tomcat8 + Httpd2.4 工作原理:借助于Tomcat的AJP连接器实现Apache与Tomcat的通信 配置步骤: 1. 配置httpd.conf 新增: Include conf/extra/mod_jk.conf 修改:添加 index.jsp <IfM...

ZeroneLove
昨天
1
0
Docker笔记3——容器命令(未写完,明天整理接着写)

未写完,明天整理接着写 新建并启动容器 docker run docker run [OPTIONS] IMAGE [COMMEND] [ARG...] OPTIONS: --name=[容器新名字] :为容器指定一个名称 -d:后台运行容器,并返回容器ID,...

HappyBKs
昨天
1
0
2018个人年终总结

感谢领导的信任和指导,新的一年获得了很多成长和提高,改掉了很多不好的习惯。 在这一年里,我在领导的帮助下,主要完成了以下功能: 1、完成上海银行版本投资营销相关功能的开发。 2、完成车...

万山红遍
昨天
12
0
保密工作与linux系统的发展

保密工作从性质上可以分成商业方面的保密和国家安全方面的保密。由于自己从事的是IT方面的工作,工作中必然会接触涉及到计算机信息方面的相关文件。加上单位已近通过武器装备科研生产单位二级...

linux-tao
昨天
3
0
Spark共享变量

概述 Spark程序的大部分操作都是RDD操作,通过传入函数给RDD操作函数来计算。这些函数在不同的节点上并发执行,但每个内部的变量有不同的作用域,不能相互访问,所以有时会不太方便,Spark提...

仟昭
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部