Java类加载及变量初始化过程

原创
2015/10/09 08:33
阅读数 68

Java虚拟机如何把编译好的.class文件加载到虚拟机里面?加载之后如何初始化类?静态类变量和实例类变量的初始化过程是否相同,分别是如何初始化的呢?这篇文章就是解决上面3个问题的。

本文前面理论部分比较枯燥,但是如果耐心读完,结合后面的实例,我相信你以后绝对不会再遇到java类初始化这样的疑惑。若有不正之处,请多多谅解并欢迎各位能够给予批评指正提前谢谢各位

1. Java虚拟机加载.class过程

虚拟机把Class文件加载到内存,然后进行校验,解析和初始化,最终形成java类型,这就是虚拟机的类加载机制。加载,验证,准备,初始化这5个阶段的顺序是确定的,类的加载过程,必须按照这种顺序开始。这些阶段通常是相互交叉和混合进行的。解析阶段在某些情况下,可以在初始化阶段之后再开始---为了支持java语言的运行时绑定。Java虚拟机规范中,没有强制约束什么时候要开始加载,但是,却严格规定了几种情况必须进行初始化(加载,验证,准备则需要在初始化之前开始):

1)遇到 newgetstaticputstatic、或者invokestatic 4条字节码指令,如果没有类没有进行过初始化,则出发初始化

2)使用java.lang.reflect包的方法,对垒进行反射调用的时候,如果没有初始化,则先触发初始化

3)初始化一个类时候,如果发现父类没有初始化,则先触发父类的初始化 

在《java编程思想》中对这段也有描述,只不过没有这么详细的描述,它描述的角度是我们平时应用的角度。

2. 加载,验证,解析

加载就是通过指定的类全限定名,获取此类的二进制字节流,然后将此二进制字节流转化为方法区的数据结构,在内存中生成一个代表这个类的Class对象。验证是为了确保Class文件中的字节流符合虚拟机的要求,并且不会危害虚拟机的安全。加载和验证阶段比较容易理解,这里就不再过多的解释。解析阶段比较特殊,解析阶段是虚拟机将常量池中的符号引用转换为直接引用的过程。如果想明白解析的过程,得先了解一点class文件的一些信息。class文件采用一种类似C语言的结构体的伪结构来存储我们编码的java类的各种信息。其中,class文件中常量池(constant_pool)是一个类似表格的仓库,里面存储了我们编写的java类的类和接口的全限定名,字段的名称和描述符,方法的名称和描述符。在java虚拟机将class文件加载到虚拟机内存之后,class类文件中的常量池信息以及其他的数据会被保存到java虚拟机内存的方法区。我们知道class文件的常量池存放的是java类的全名,接口的全名和字段名称描述符,方法的名称和描述符等信息,这些数据加载到jvm内存的方法区之后,被称做是符号引用。而把这些类的全限定名,方法描述符等转化为jvm可以直接获取的jvm内存地址,指针等的过程,就是解析。虚拟机实现可以对第一次的解析结果进行缓存,避免解析动作的重复执行。在解析类的全限定名的时候,假设当前所处的类为D,如果要把一个从未解析过的符号引用N解析为一个类或者接口C的直接引用,具体的执行办法就是虚拟机会把代表N的全限定名传递给D的类加载器去加载这个类C。这块可能不太好理解,但是我们可以直接理解为调用D类的ClassLoader来加载N,然后就完成了N--->C的解析,就可以了。

3. 准备阶段

之所以把在解析阶段前面的准备阶段,拿到解析阶段之后讲,是因为,准备阶段已经涉及到了类数据的初始化赋值。和我们本文讲的初始化有关系,所以,就拿到这里来讲述。在java虚拟机加载class文件并且验证完毕之后,就会正式给类变量分配内存并设置类变量的初始值。这些变量所使用的内存都将在方法区分配。注意这里说的是类变量,也就是static修饰符修饰的变量,在此时已经开始做内存分配,同时也设置了初始值。比如在 

Public static int value = 123 这句话中,在执行准备阶段的时候,会给value 分配内存并设置初始值0, 而不是我们想象中的123. 那么什么时候 才会将我们写的123 赋值给 value呢?就是我们下面要讲的初始化阶段。

4. 初始化阶段

类初始化阶段是类加载过程的最后阶段。在这个阶段,java虚拟机才真正开始执行类定义中的java程序代码。Java虚拟机是怎么完成初始化的呢?这要从编译开始讲起。在编译的时候,编译器会自动收集类中的所有静态变量(类变量)和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序是根据语句在java代码中的顺序决定的。收集完成之后,会编译成java类的 static{} 方法,java虚拟机则会保证一个类的static{} 方法在多线程或者单线程环境中正确的执行,并且只执行一次。在执行的过程中,便完成了类变量的初始化。值得说明的是,如果我们的java类中,没有显式声明static{}块,如果类中有静态变量,编译器会默认给我们生成一个static{}方法。 我们可以通过javap -c 的命令,来看一下java字节码中编译器为我们生成或者合并的static{} 方法:

?

1
2
3
public  class  StaticValInitTest {
     public  static  int  value =  123
}

上面我们讲述的是单类的情况,如果出现继承呢?如果有继承的话,父类中的类变量该如何初始化?这点由虚拟机来解决:虚拟机会保证在子类的static{}方法执行之前,父类的static{}方法已经执行完毕。由于父类的static{}方法先执行,也就意味着父类的静态变量要优先于子类的静态变量赋值操作。

上面讲的都是静态变量,实例变量怎么解决呢?实例变量的初始化,其实是和静态变量的过程是类似的,但是时间和地点都不同哦。我们以下面的Dog类为例来讲一讲。

?

1
2
3
4
public  class  Dog {
     public  String type =  "tai di" ;
     public  int  age =  3 ;
}

1. 当用new Dog() 创建对象的时候,首先在堆上为Dog对象分配足够的空间。

2. 这块存储空间会被清零,这就是自动将Dog对象中的所有基本类型的数据都设置成了默认值,而引用类型则被设置成了null(类似静态类的准备阶段的过程)

3. Java收集我们的实例变量赋值语句,合并后在构造函数中执行赋值语句。没有构造函数的,系统会默认给我们生成构造函数。


至此,java类初始化的理论基础已经完成了,其中的大部分的理论和思想都出自《深入理解java虚拟机》这本书。有了以上的理论基础,再复杂的类初始化的情况,我们都可以应对了,下面就拿一个例子做一个具体的分析吧

?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
public  class  Insect {
     private  int  i =  9 ;
     protected  int  j;
     protected  static  int  x1 = printInit( "static Insect.x1 initialized" );
     Insect() {
         System.out.println( "基类构造函数阶段: i = "  + i +  ", j = "  + j);
         j =  39 ;
     }
     static  int  printInit(String s) {
         System.out.println(s);
         return  47 ;
     }
}
public  class  Beetle  extends  Insect { 
     protected  int  k = printInit( "Beetle.k initialized" );
     protected  static  int  x2 = printInit( "static Beetle.x2 initialized" ); 
     public  static  void  main(String[] args) {  
         Beetle b =  new  Beetle();
     }
}

上面例子来自《java编程思想》,以上代码的执行结果是什么呢?如果对上面我们讲的理论理解的话,很容易就知道结果是:

static Insect.x1 initialized

static Beetle.x2 initialized

基类构造函数阶段: i = 9, j = 0

Beetle.k initialized

具体的执行结果过程是:在执行Beetle 类的 main方法的时候,因为该main方法是static方法,我们在上面已经知道,在执行类的static方法的时候,如果该类没有初始化,则要进行初始化,因此,我们在执行main方法的时候,会执行加载--验证--准备--解析---初始化这个过程。在进行最后的初始化的时候,又有一个约束:虚拟机会保证在子类的static{}方法执行之前,父类的static{}方法已经执行完毕。所以,在执行完解析之后,会先执行父类的初始化,在执行父类初始化的时候,输出static Insect.x1 initialized

然后接着初始化子类,输出:static Beetle.x2 initialized

以上两行输出,是静态变量的初始化,是在第一次调用静态方法,即,在执行newgetstaticputstatic、或者invokestatic 4条字节码指令时候触发的。所以,你如果把上例中的static main 方法中的 Beetle b = new Beetle(); 注释掉,上面两行仍然会输出出来。

然后就是执行Beetle b = new Beetle();这句代码了。

我们知道,在实例化子类对象的时候,会自动调用父类的构造函数。所以,接着就输出:

基类构造函数阶段: i = 9, j = 0

紧接着是执行自己的构造函数,在堆上创建类实例对象,实例对象空间清零,然后执行赋值语句k = printInit("Beetle.k initialized");

输出: Beetle.k initialized 

至此,整个类加载并初始化完毕,是不是理解起来就很简单了,趁胜追击,我们还是再来看一个例子吧:

?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
public  class  Base {
     Base() {
         preProcess();
     }
     void  preProcess() {
     }
public  class  Derived  extends  Base {
     public  String whenAmISet =  "set when declared"
     @Override 
     void  preProcess() {
         whenAmISet =  "set in preProcess" ;
     }    
     public  static  void  main(String[] args) {
         Derived d =  new  Derived();
         System.out.println(d.whenAmISet);
     }
}

这个例子来源与@左耳朵耗子的博客,我就是看了他博客中的这个例子,才想起来写篇文章里理顺下java类初始化的过程,才有了这篇博客。废话不多说,这个例子里面,有一个地方比较绕:父类在执行构造函数的时候,调用了子类(导出类)重载过的方法,在子类的重载方法中,给实例变量做了一次赋值,正是这次赋值,干扰了我们对类初始化的理解。

我们不管类里面是怎么做的,还按照我们上个例子中那样进行分析:

1. 执行Derived 类 static main 方法的时候,执行类变量初始化,但是此例中父类和子类都没有类变量,所以此步骤什么都不做,进行实例变量初始化

2. 执行new Derived()的时候,先调用了父类的构造函数,因为子类的重载,调用了子类的preProcess方法,为实例变量whenAmISet 赋值为"set in preProcess"

3. 然后执行子类Derived 的构造函数,在构造函数中,有编译器为我们收集生成的实例变量赋值语句,最终,又将实例变量whenAmISet 赋值为"set when declared"

4. 所以最终的输出是: set when declared

如果对这个还不太理解的话,可以再Derived 类里面添加注释,改成下面的样子,输出看看,是不是对这个执行过程更清晰了呢?

?

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
public  class  Derived  extends  Base {
     // 准备阶段赋值 whenAmISet=null
     public  String whenAmISet =  "set when declared" ;
     public  Derived() {
         System.out.println( "do son constructor" );
    
     @Override 
     void  preProcess() {
            System.out.println( "do son process" );
              System.out.println( "whenAmISet:"  + whenAmISet);
         whenAmISet =  "set in preProcess" ;
         System.out.println( "whenAmISet:"  + whenAmISet);
         System.out.println( "set in preProcess end" );
    
     public  static  void  main(String[] args) {
         Derived d =  new  Derived();
         System.out.println(d.whenAmISet);
     }
}

参考资料:

深入理解java虚拟机

Java编程思想》

http://coolshell.cn/articles/1106.html 

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部