文档章节

从1+1=2来理解Java字节码

木木匠
 木木匠
发布于 2019/12/30 07:58
字数 2393
阅读 1.5W
收藏 59

背景

前不久《深入理解Java虚拟机》第三版发布了,赶紧买来看了看新版的内容,这本书更新了很多新版本虚拟机的内容,还对以前的部分内容进行了重构,还是值得去看的。本着复习和巩固的态度,我决定来编译一个简单的类文件来分析Java的字节码内容,来帮助理解和巩固Java字节码知识,希望也对阅读本文的你有所帮助。

说明:本次采用的环境是OpenJdk12

编译“1+1”代码

首先我们需要写个简单的小程序,1+1的程序,学习就要从最简单的1+1开始,代码如下:

package top.luozhou.test;

/**
 * @description:
 * @author: luozhou
 * @create: 2019-12-25 21:28
 **/
public class TestJava {
    public static void main(String[] args) {
        int a=1+1;
        System.out.println(a);
    }
}

写好java类文件后,首先执行命令javac TestJava.java 编译类文件,生成TestJava.class。 然后执行反编译命令javap -verbose TestJava,字节码结果显示如下:

  Compiled from "TestJava.java"
public class top.luozhou.test.TestJava
  minor version: 0
  major version: 56
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #5.#14         // java/lang/Object."<init>":()V
   #2 = Fieldref           #15.#16        // java/lang/System.out:Ljava/io/PrintStream;
   #3 = Methodref          #17.#18        // java/io/PrintStream.println:(I)V
   #4 = Class              #19            // top/luozhou/test/TestJava
   #5 = Class              #20            // java/lang/Object
   #6 = Utf8               <init>
   #7 = Utf8               ()V
   #8 = Utf8               Code
   #9 = Utf8               LineNumberTable
  #10 = Utf8               main
  #11 = Utf8               ([Ljava/lang/String;)V
  #12 = Utf8               SourceFile
  #13 = Utf8               TestJava.java
  #14 = NameAndType        #6:#7          // "<init>":()V
  #15 = Class              #21            // java/lang/System
  #16 = NameAndType        #22:#23        // out:Ljava/io/PrintStream;
  #17 = Class              #24            // java/io/PrintStream
  #18 = NameAndType        #25:#26        // println:(I)V
  #19 = Utf8               top/luozhou/test/TestJava
  #20 = Utf8               java/lang/Object
  #21 = Utf8               java/lang/System
  #22 = Utf8               out
  #23 = Utf8               Ljava/io/PrintStream;
  #24 = Utf8               java/io/PrintStream
  #25 = Utf8               println
  #26 = Utf8               (I)V
{
  public top.luozhou.test.TestJava();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 8: 0

  public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=2, args_size=1
         0: iconst_2
         1: istore_1
         2: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
         5: iload_1
         6: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
         9: return
      LineNumberTable:
        line 10: 0
        line 11: 2
        line 12: 9
}

解析字节码

1.基础信息

上述结果删除了部分不影响解析的冗余信息,接下来我们便来解析字节码的结果。

 minor version: 0 次版本号,为0表示未使用
 major version: 56 主版本号,56表示jdk12,表示只能运行在jdk12版本以及之后的虚拟机中
flags: ACC_PUBLIC, ACC_SUPER

ACC_PUBLIC:这就是一个是否是public类型的访问标志。

ACC_SUPER: 这个falg是为了解决通过 invokespecial 指令调用 super 方法的问题。可以将它理解成 Java 1.0.2 的一个缺陷补丁,只有通过这样它才能正确找到 super 类方法。从 Java 1.0.2 开始,编译器始终会在字节码中生成 ACC_SUPER 访问标识。感兴趣的同学可以点击这里来了解更多。

2.常量池

接下来,我们将要分析常量池,你也可以对照上面整体的字节码来理解。

#1 = Methodref          #5.#14         // java/lang/Object."<init>":()V

这是一个方法引用,这里的#5表示索引值,然后我们可以发现索引值为5的字节码如下

#5 = Class              #20            // java/lang/Object

它表示这是一个Object类,同理#14指向的是一个"<init>":()V表示引用的是初始化方法。

#2 = Fieldref           #15.#16        // java/lang/System.out:Ljava/io/PrintStream;

上面这段表示是一个字段引用,同样引用了#15#16,实际上引用的就是java/lang/System类中的PrintStream对象。其他的常量池分析思路是一样的,鉴于篇幅我就不一一说明了,只列下其中的几个关键类型和信息。

NameAndType:这个表示是名称和类型的常量表,可以指向方法名称或者字段的索引,在上面的字节码中都是表示的实际的方法。

Utf8我们经常使用的是字符编码,但是这个不是只有字符编码的意思,它表示一种字符编码是Utf8的字符串。它是虚拟机中最常用的表结构,你可以理解为它可以描述方法,字段,类等信息。 比如:

#4 = Class              #19 
#19 = Utf8               top/luozhou/test/TestJava

这里表示#4这个索引下是一个类,然后指向的类是#19,#19是一个Utf8表,最终存放的是top/luozhou/test/TestJava,那么这样一连接起来就可以知道#4位置引用的类是top/luozhou/test/TestJava了。

3.构造方法信息

接下来,我们分析下构造方法的字节码,我们知道,一个类初始化的时候最先执行它的构造方法,如果你没有写构造方法,系统会默认给你添加一个无参的构造方法。

public top.luozhou.test.TestJava();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 8: 0

descriptor: ()V :表示这是一个没有返回值的方法。

flags: ACC_PUBLIC:是公共方法。

stack=1, locals=1, args_size=1 :表示栈中的数量为1,局部变量表中的变量为1,调用参数也为1。

这里为什么都是1呢?这不是默认的构造方法吗?哪来的参数?其实Java语言有一个潜规则:在任何实例方法里面都可以通过this来访问到此方法所属的对象。而这种机制的实现就是通过Java编译器在编译的时候作为入参传入到方法中了,熟悉python语言的同学肯定会知道,在python中定义一个方法总会传入一个self的参数,这也是传入此实例的引用到方法内部,Java只是把这种机制后推到编译阶段完成而已。所以,这里的1都是指this这个参数而已。

         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: return
    LineNumberTable:
        line 8: 0

经过上面这个分析对于这个构造方法表达的意思也就很清晰了。

aload_0:表示把局部变量表中的第一个变量加载到栈中,也就是this

invokespecial:直接调用初始化方法。

return:调用完毕方法结束。

LineNumberTable:这是一个行数的表,用来记录字节码的偏移量和代码行数的映射关系。line 8: 0表示,源码中第8行对应的就是偏移量0的字节码,因为是默认的构造方法,所以这里并无法直观体现出来。

另外这里会执行Object的构造方法是因为,Object是所有类的父类,子类的构造要先构造父类的构造方法。

4.main方法信息

public static void main(java.lang.String[]);
    descriptor: ([Ljava/lang/String;)V
    flags: ACC_PUBLIC, ACC_STATIC
    Code:
      stack=2, locals=2, args_size=1
         0: iconst_2
         1: istore_1
         2: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
         5: iload_1
         6: invokevirtual #3                  // Method java/io/PrintStream.println:(I)V
         9: return
      LineNumberTable:
        line 10: 0
        line 11: 2
        line 12: 9

有了之前构造方法的分析,我们接下来分析main方法也会熟悉很多,重复的我就略过了,这里重点分析code部分。

stack=2, locals=2, args_size=1:这里的栈和局部变量表为2,参数还是为1。这是为什么呢?因为main方法中声明了一个变量a,所以局部变量表要加一个,栈也是,所以他们是2。那为什么args_size还是1呢?你不是说默认会把this传入的吗?应该是2啊。注意:之前说的是在任何实例方法中,而这个main方法是一个静态方法,静态方法直接可以通过类+方法名访问,并不需要实例对象,所以这里就没必要传入了

0: iconst_2:将int类型2推送到栈顶。

1: istore_1:将栈顶int类型数值存入第二个本地变量。

2: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;:获取PrintStream类。

5: iload_1: 把第二个int型本地变量推送到栈顶。

6: invokevirtual #3 // Method java/io/PrintStream.println:(I)V:调用println方法。

9: return:调用完毕结束方法。

这里的LineNumberTable是有源码的,我们可以对照下我前面描述是否正确:

line 10: 0: 第10行表示 0: iconst_2字节码,这里我们发现编译器直接给我们计算好了把2推送到栈顶了。

line 11: 2:第11行源码对应的是 2: getstatic 获取输出的静态类PrintStream

line 12: 9:12行源码对应的是return,表示方法结束。

这里我也画了一个动态图片来演示main方法执行的过程,希望能够帮助你理解:

总结

这篇文章我从1+1的的源码编译开始,分析了生成后的Java字节码,包括类的基本信息,常量池,方法调用过程等,通过这些分析,我们对Java字节码有了比较基本的了解,也知道了Java编译器会把优化手段通过编译好的字节码体现出来,比如我们的1+1=2,字节码字节赋值一个2给变量,而不是进行加法运算,从而优化了我们的代码,提搞了执行效率。

参考

  1. https://bugs.openjdk.java.net/browse/JDK-6527033

© 著作权归作者所有

木木匠

木木匠

粉丝 200
博文 35
码字总数 81600
作品 0
广州
高级程序员
私信 提问
加载中

评论(11)

流光1013
那么问题来了,有《深入理解java虚拟机》第三版的 电子版么?😄
木木匠
木木匠 博主
我买的是纸质版的
罗某某某
罗某某某
好巧,同为小罗同志
木木匠
木木匠 博主
好巧😄
开源中国首席罗纳尔多
开源中国首席罗纳尔多
可以局部编译替换class吗?
木木匠
木木匠 博主
可以详细说一下问题吗?
开源中国首席罗纳尔多
开源中国首席罗纳尔多
用别人的lib里面的某方法处理有问题,只有class没有源码,如何局部优化这个方法重新生成新的class
木木匠
木木匠 博主
这个首先要考虑能否扩展吧?比如继承或者实现接口,局部编译生成新的class这个我没有试过,理论上应该是可以通过字节码技术来实现,你可以试试ASM字节码框架来修改原有类的代码。
old_big
old_big
模糊的问题得到模糊的答案。
bhzhu203
bhzhu203
感谢分享!
木木匠
木木匠 博主
感谢支持
1.3.2 java程序的运行机制和jvm

java语言比较特殊,由java语言编写的程序需要经过编译步骤,但这个编译步骤并不会生成特定平台的机器码,而是生成一种与平台无关的字节码(也就是*.class文件)。当然,这种字节码不是可执行...

Gooiem
2015/08/17
534
2
如何编写和运行Java应用程序

Java应用程序的编写和运行过程 1、建立Java源文件首先创建Java的源代码即建立一个文本文档包括有符合Java规范的语句。 2、编译源文件“编译”就是将一个源代码文件翻译成计算机可以理解和处理...

jdroid
2012/03/26
267
0
JVM规范系列开篇:为什么要读JVM规范?

许多人知道类加载机制、JVM内存模型,但他们可能不知道什么是《Java虚拟机规范》。对于Java开发来说,《Java虚拟机规范》才是最为官方、准确的一个文档,了解这个规范可以让我们更深入地理解...

陈树义
2018/12/19
0
0
JVM规范系列第3章:为Java虚拟机编译

Oracle 的 JDK 包括两部分内容:一部分是将 Java 源代码编译成 Java 虚拟机的指令集的编译器,另一部分是用于Java 虚拟机的运行时环境。 第一部分应该说的是 Javac 这个前置编译器,用于将J...

陈树义
2018/12/19
0
0
Jvm与字节码——类的方法区模型

从一个类开始 我们从一个简单类开始说起: 这是一段平凡得不能再平凡的Java代码,稍微有点编程语言入门知识的人都能理解它表达的意思: 创建一个名为SimpleClass的类; 定义一个入口main方法...

溜达向日葵
2018/08/31
0
0

没有更多内容

加载失败,请刷新页面

加载更多

仁怀哪里可以开餐饮费发票-中国新闻网

仁怀哪里可以开餐饮费发票【139 * 7⒏ б2 * 15 З9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridg...

17054723687
今天
58
0
资兴哪里可以开餐饮费发票-中国新闻网

资兴哪里可以开餐饮费发票【139 * 7⒏ б2 * 15 З9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridg...

17054723480
今天
42
0
沅江哪里可以开餐饮费发票-中国新闻网

沅江哪里可以开餐饮费发票【139 * 7⒏ б2 * 15 З9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridg...

17054723685
今天
42
0
天津哪里可以开餐饮费发票-中国新闻网

天津哪里可以开餐饮费发票【139 * 7⒏ б2 * 15 З9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridg...

17054723617
今天
39
0
汨罗哪里可以开餐饮费发票-中国新闻网

汨罗哪里可以开餐饮费发票【139 * 7⒏ б2 * 15 З9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridg...

17060820048
今天
62
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部