JVM学习笔记之二:栈和堆

原创
2014/01/24 17:48
阅读数 635

    栈

    栈是java程序运行的关键,在java中,每一个线程都会有一个与之对应的线程栈。它是由许多栈帧(stack frame)或者说帧(frame)组成的,一个栈帧包含一个java方法调用的状态。当线程调用一个java方法时,虚拟机压入一个新的栈帧到该线程的java栈中,当该方法返回时,这个栈帧被从java栈中弹出并抛弃。总结起来就是,栈负责java程序运行过程中的进程和程序处理逻辑的控制。

    栈帧由三部分组成:局部变量区,操作数栈和帧数据区。

        1.局部变量区,顾名思义,存储对应方法的参数和局部变量。

        2.操作数栈,相当于寄存器,存储虚拟机的程序指令。

        3.帧数据区,除了局部变量区和操作数栈中的数据外,java栈帧还需要一些数据来支持常量池解析,正常方法返回以及异常派发机制,这些信息都保存在帧数据区中。

    由于栈的结构和功能设计导致它不适合动态增长,因此在java的虚拟机规范中,栈只能存储基本类型的数据和对堆中对象的引用。java栈上的数据都是此线程私有的,任何线程都不能访问另外一个线程的栈数据。


    堆

    堆是java程序运行时创建的实例和数组的存储空间。每一个java虚拟机实例只会存在一个堆空间,因此,所有线程都将共享这个堆。

    由堆的作用可以很容易的知道,它是一个随时都会有大量新数据产生,大量老数据过期的地方,因此对数据的管理和垃圾回收机制是影响堆性能很重要的指标。java虚拟机并没有强制规定怎么去实现一个堆,它只要求虚拟机必须以某种方式来管理自己的堆空间。因此,堆的构成和处理机制不能一概而论,不同的jvm可能会有各自独特的实现。所以本着学以致用的原则,个人只学习了我们常用的java虚拟机也就是sun/oracle的虚拟机HotSpot VM的堆实现,以下虚拟机相关内容都指的是该虚拟机。

    堆一般由两部分构成:年轻代,年老代。

        1. 年轻代。作用是作为程序中所有刚生成的对象的存储空间,设计这一空间的目的是尽可能快的回收掉那些生命周期不长的对象,提高堆空间的利用率。年轻代的内部还有更细划分,涉及到垃圾回收机制的介绍,在后续笔记中会说明。

        2. 年老代。用于存放那些生命周期较长,经历了数次垃圾回收后仍然健在的对象。存放于年老代的数据基本上都经过年轻代的过滤,比较稳定。

    很多人认为HotSpot VM的堆还应该包含一个持久代,这点个人并不认可,因为这个持久代的概念和jvm的方法区太类似,基本上就是方法区。而且从jconsole对内存的划分上来看(见下图),sun/oracle明显不认为它是堆的组成部分。


    堆和栈的联系和区别

 这一块不打算长篇大论,因为网上已经有牛人将之总结的很好了,在此纯引用之,原文链接附在文末:


 堆和栈是程序运行的关键,很有必要把他们的关系说清楚。

   

    栈是运行时的单位,而堆是存储的单位

    栈解决程序的运行问题,即程序如何执行,或者说如何处理数据;堆解决的是数据存储的问题,即数据怎么放、放在哪儿。

    在Java中一个线程就会相应有一个线程栈与之对应,这点很容易理解,因为不同的线程执行逻辑有所不同,因此需要一个独立的线程栈。而堆则是所有线程共享的。栈因为是运行单位,因此里面存储的信息都是跟当前线程(或程序)相关信息的。包括局部变量、程序运行状态、方法返回值等等;而堆只负责存储对象信息。

    为什么要把堆和栈区分出来呢?栈中不是也可以存储数据吗

    第一,从软件设计的角度看,栈代表了处理逻辑,而堆代表了数据。这样分开,使得处理逻辑更为清晰。分而治之的思想。这种隔离、模块化的思想在软件设计的方方面面都有体现。

    第二,堆与栈的分离,使得堆中的内容可以被多个栈共享(也可以理解为多个线程访问同一个对象)。这种共享的收益是很多的。一方面这种共享提供了一种有效的数据交互方式(如:共享内存),另一方面,堆中的共享常量和缓存可以被所有栈访问,节省了空间。

    第三,栈因为运行时的需要,比如保存系统运行的上下文,需要进行地址段的划分。由于栈只能向上增长,因此就会限制住栈存储内容的能力。而堆不同,堆中的对象是可以根据需要动态增长的,因此栈和堆的拆分,使得动态增长成为可能,相应栈中只需记录堆中的一个地址即可。

    第四,面向对象就是堆和栈的完美结合。其实,面向对象方式的程序与以前结构化的程序在执行上没有任何区别。但是,面向对象的引入,使得对待问题的思考方式发生了改变,而更接近于自然方式的思考。当我们把对象拆开,你会发现,对象的属性其实就是数据,存放在堆中;而对象的行为(方法),就是运行逻辑,放在栈中。我们在编写对象的时候,其实即编写了数据结构,也编写的处理数据的逻辑。不得不承认,面向对象的设计,确实很美。

    在Java中,Main函数就是栈的起始点,也是程序的起始点

    程序要运行总是有一个起点的。同C语言一样,java中的Main就是那个起点。无论什么java程序,找到main就找到了程序执行的入口:)

    堆中存什么?栈中存什么

    堆中存的是对象。栈中存的是基本数据类型堆中对象的引用。一个对象的大小是不可估计的,或者说是可以动态变化的,但是在栈中,一个对象只对应了一个4btye的引用(堆栈分离的好处:))。

    为什么不把基本类型放堆中呢?因为其占用的空间一般是1~8个字节——需要空间比较少,而且因为是基本类型,所以不会出现动态增长的情况——长度固定,因此栈中存储就够了,如果把他存在堆中是没有什么意义的(还会浪费空间,后面说明)。可以这么说,基本类型和对象的引用都是存放在栈中,而且都是几个字节的一个数,因此在程序运行时,他们的处理方式是统一的。但是基本类型、对象引用和对象本身就有所区别了,因为一个是栈中的数据一个是堆中的数据。最常见的一个问题就是,Java中参数传递时的问题。

    Java中的参数传递时传值呢?还是传引用

    要说明这个问题,先要明确两点:

         1. 不要试图与C进行类比,Java中没有指针的概念

         2. 程序运行永远都是在栈中进行的,因而参数传递时,只存在传递基本类型和对象引用的问题。不会直接传对象本身。

    明确以上两点后。Java在方法调用传递参数时,因为没有指针,所以它都是进行传值调用(这点可以参考C的传值调用)。因此,很多书里面都说Java是进行传值调用,这点没有问题,而且也简化的C中复杂性。

    但是传引用的错觉是如何造成的呢?在运行栈中,基本类型和引用的处理是一样的,都是传值,所以,如果是传引用的方法调用,也同时可以理解为“传引用值”的传值调用,即引用的处理跟基本类型是完全一样的。但是当进入被调用方法时,被传递的这个引用的值,被程序解释(或者查找)到堆中的对象,这个时候才对应到真正的对象。如果此时进行修改,修改的是引用对应的对象,而不是引用本身,即:修改的是堆中的数据。所以这个修改是可以保持的了。

    对象,从某种意义上说,是由基本类型组成的。可以把一个对象看作为一棵树,对象的属性如果还是对象,则还是一颗树(即非叶子节点),基本类型则为树的叶子节点。程序参数传递时,被传递的值本身都是不能进行修改的,但是,如果这个值是一个非叶子节点(即一个对象引用),则可以修改这个节点下面的所有内容。

 

    堆和栈中,栈是程序运行最根本的东西。程序运行可以没有堆,但是不能没有栈。而堆是为栈进行数据存储服务,说白了堆就是一块共享的内存。不过,正是因为堆和栈的分离的思想,才使得Java的垃圾回收成为可能。

     Java中,栈的大小通过-Xss来设置,当栈中存储数据比较多时,需要适当调大这个值,否则会出现java.lang.StackOverflowError异常。常见的出现这个异常的是无法返回的递归,因为此时栈中保存的信息都是方法返回的记录点。




本文参考:

    <深入java虚拟机第二版>;

    <jvm调优总结--一些概念>:http://hllvm.group.iteye.com/group/wiki/2858-JVM;


展开阅读全文
打赏
1
37 收藏
分享
加载中
很好的文章
2014/01/25 08:13
回复
举报
更多评论
打赏
1 评论
37 收藏
1
分享
返回顶部
顶部