Java String 在JVM中的思考

2017/03/06 17:41
阅读数 142
  1. <span style="font-size: medium;">package com;  
  2.   
  3. /** 
  4.  * @author longgangbai 
  5.  *  
  6.  */  
  7. public class StringTest {  
  8.     public static void main(String[] args) {  
  9.         String a = "ab";// 创建了一个对象,并加入字符串池中  
  10.         System.out.println("String a = \"ab\";");  
  11.         String b = "cd";// 创建了一个对象,并加入字符串池中  
  12.         System.out.println("String b = \"cd\";");  
  13.         String c = "abcd";// 创建了一个对象,并加入字符串池中  
  14.   
  15.         String d = "ab" + "cd";  
  16.         // 如果d和c指向了同一个对象,则说明d也被加入了字符串池  
  17.         if (d == c) {  
  18.             System.out.println("\"ab\"+\"cd\" 创建的对象 \"加入了\" 字符串池中"); //答案  
  19.         }  
  20.         // 如果d和c没有指向了同一个对象,则说明d没有被加入字符串池  
  21.         else {  
  22.             System.out.println("\"ab\"+\"cd\" 创建的对象 \"没加入\" 字符串池中");  
  23.         }  
  24.         String e = a + "cd";  
  25.         // 如果e和c指向了同一个对象,则说明e也被加入了字符串池  
  26.         if (e == c) {  
  27.             System.out.println(" a  +\"cd\" 创建的对象 \"加入了\" 字符串池中");  
  28.         }  
  29.         // 如果e和c没有指向了同一个对象,则说明e没有被加入字符串池  
  30.         else {  
  31.             System.out.println(" a  +\"cd\" 创建的对象 \"没加入\" 字符串池中");//答案.  
  32.         }  
  33.         String f = "ab" + b;  
  34.         // 如果f和c指向了同一个对象,则说明f也被加入了字符串池  
  35.         if (f == c) {  
  36.             System.out.println("\"ab\"+ b   创建的对象 \"加入了\" 字符串池中");  
  37.         }  
  38.         // 如果f和c没有指向了同一个对象,则说明f没有被加入字符串池  
  39.         else {  
  40.             System.out.println("\"ab\"+ b   创建的对象 \"没加入\" 字符串池中");//答案  
  41.         }  
  42.   
  43.         String g = a + b;  
  44.         // 如果g和c指向了同一个对象,则说明g也被加入了字符串池  
  45.         if (g == c) {  
  46.             System.out.println(" a  + b   创建的对象 \"加入了\" 字符串池中");   
  47.         }  
  48.         // 如果g和c没有指向了同一个对象,则说明g没有被加入字符串池  
  49.         else {  
  50.             System.out.println(" a  + b   创建的对象 \"没加入\" 字符串池中");//答案  
  51.         }  
  52.     }  
  53. }  

 java编译器对string常量表达式的处理和优化

 

sun的编译器,jdk1.5是通过的如下:

 

 

首先把问题摆出来,先看这个代码 

String a = "ab"; 
String b = "a" + "b"; 
System.out.println((a == b)); 

打印结果会是什么?类似这样的问题,有人考过我,我也拿来考过别人(蛮好玩的,大家也可以拿来问人玩),一般答案会是以下几种: 

1.true 
    "a" + "b" 的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true 
    一般java新人如是答。 
2.false 
    "a" + "a"会生成新的对象"aa",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false 
    对java的String有一定了解的通常这样回答。 
3.true 
    String a = "ab";创建了新的对象"ab"; 再执行String b = "a" + "b";结果b="ab",这里没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true. 
    能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。 
    很遗憾,这个答案,是不够准确的。或者说,根本没有运行时计算b = "a" + "b";这个操作.实际上运行时只有String b = "ab"; 
    3的观点适合解释以下情况: 
    String a = "ab"; 
    String b = "ab"; 
    System.out.println((a == b)); 
    如果String b = "a" + "b";是在运行期执行,则3的观点是无法解释的。运行期的两个string相加,会产生新的对象的。(本文后面对此有解释) 

4.true 
    下面是我的回答:编译优化+ 3的处理方式 = 最后的true 
    String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化 
    String a = "ab"; 
    String b = "ab"; 
    System.out.println((a == b)); 
    然后根据3的解释,得到结果true 

    这里有一个疑问就是String不是基本类型,像 
int secondsOfDay = 24 * 60 * 60; 
    这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a" + "b" 这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗? 
    下面简单证明我的推断,首先编译这个类: 
public class Test { 
    private String a = "aa"; 

       复制class文件备用,然后修改为 
public class Test { 
    private String a = "a" + "a"; 

    再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差. 
    ok,真相大白了.根本不存在运行期的处理String b = "a" + "b";这样的代码的问题,编译时就直接优化掉了。 


下面进一步探讨,什么样的string + 表达式会被编译器当成常量表达式? 
String b = "a" + "b"; 
这个String + String被正式是ok的,那么string + 基本类型呢? 

String a = "a1"; 
String b = "a" + 1; 
System.out.println((a == b));  //result = true 

String a = "atrue"; 
String b = "a" + true; 
System.out.println((a == b));  //result = true 

String a = "a3.4"; 
String b = "a" + 3.4; 
System.out.println((a == b));  //result = true 
   
可见编译器对string + 基本类型是当成常量表达式直接求值来优化的。 

再注意看这里的string都是"**"这样的,我们换成变量来试试: 
String a = "ab"; 
String bb = "b"; 
String b = "a" + bb; 
System.out.println((a == b));   //result = false 
这个好理解,"a" + bb中的bb是变量,不能进行优化。这里很很好的解释了为什么3的观点不正确,如果String+String的操作是在运行时进行的,则会产生新的对象,而不是直接从jvm的string池中获取。 

再修改一下,把bb作为常量变量: 
String a = "ab"; 
final String bb = "b"; 
String b = "a" + bb; 
System.out.println((a == b));   //result = true 
竟然又是true,编译器的优化好厉害啊,呵呵,考虑下面这种情况: 
String a = "ab"; 
final String bb = getBB(); 
String b = "a" + bb; 
System.out.println((a == b));    //result = false 
private static String getBB() { 
return "b"; 

看来java(包括编译器和jvm)对string的优化,真的是到了极点了,string这个所谓的"对象",完全不可以看成一般的对象,java对string的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。 

另外感叹一下,string的+号处理,算是java语言里面唯一的一个"运算符重载"(接触过c++的人对这个不会陌生)吧?

 

 

网友A:

第三点其实是正确的哦, 你所说的问题在于"a"+"b"是什么时候被执行的,但是并不能解释引用a为什么是==引用b的,其实你想说的是string的+操作是在编译期执行,这个确实是你正确的,从你的例子中也可以看出来。 

但是如果要解释a==b是true这个问题还是要用第3点解释哦,所以第3点并没有错,这是千真万确的,但是你对+操作的执行时期的描述也是正确的,这两个应该是一个整体,而不是对立的。 

String a = "ab"; 
String b = "ab"; 
System.out.println((a == b)); 
问题还是那样,结果为什么是true,必须用第3点来解释,而且这也是深入浅出jvm中的观点。

 

 

直听传闻说法是: 

SUN JDK 的 javac 是优化最多的, 编译速度也慢. 
IBM jikes 编译速度快, 但没什么优化. 
Eclipse JDT Compiler 是从 VA4J Compiler 演化来的, 增量编译很强, 优化也有, 相对JDK少. 
GNU GCJ 不清楚, 不过还不成熟, 研究意义似乎不大. 

不过我也没怎么接触过jikes, 楼主有空不妨用别的编译器试试.

 

 

网友M:

 

恩,就是这个意思,我的表述不是很清晰。 
我所说的第三点错,并不是说第三点的解释方式有问题,而是第三点阐述的"a"+"b"是运行期被执行不正确,而是第4点钟的编译器执行优化。 
第三点中阐述的jvm对string的处理我没有异议,呵呵,所以我在第4点中根本没有解释 
String a = "ab"; 
String b = "ab"; 
System.out.println((a == b)); 
结果为什么是true,因为基本能想到第3点或第4点人,肯定非常清楚这里的true是怎么来的,呵呵。 

第4点,其实是建立在第3点阐述的jvm对string的处理机制的基础上的。先执行4优化,再执行3的机制,最后才能得到true这么一个结果。 

 

修改了一下文档的内容,将3的阐述改的清楚了一些。

实际这里存在两个问题
1.   3解释下面为true的问题
String a = "ab";
String b = "ab";
System.out.println((a == b)); 
   但是3的错误在于3中认为在运行期String b = "a"+"b";可以等同于String b = "ab";
2.   4通过编译器优化的解释解决了
String b = "a"+"b";等同于String b = "ab";的问题

 

 

还有对于jvm对string的处理和优化,我的感觉(还不确定,请大家指正)是这样,jvm里面的string池,似乎只使用于两个情况: 

1.在编译后的*.class文件里面定义的"abc"这样的"直接"常量
   对于new String(), String + String/基本类型,toString()方法之类生成的string不是从string池里面取,而是直接生成新的string类。
2.调用string的intern()方法
   这个算是"强制"加入池吧

 

 

 

 

String这个东西也挺搞的,看了这个帖子,才知道我昨天做了一道题目错了。:( 
立即写了个小程序测试:

Java代码 复制代码 收藏代码

Java代码 

 收藏代码

  1. <span style="font-size: medium;">   public static void main(String[] args) {  
  2.         String s1 = "ab";  
  3.         String s2="a"+"b";  
  4.         System.out.println((s1==s2)+":"+(s1.equals(s2)));  
  5.         StringBuffer sb1=new StringBuffer("ab");  
  6.         StringBuffer sb2=new StringBuffer().append("a").append("b");  
  7.         System.out.println((sb1==sb2)+":"+(sb1.equals(sb2)));  
  8.     }  
  9. </span>  


结果是 
true:true 
false:false 

对于StringBuffer,只有引用相同,==和equals()才会成立。我看了equals()源码,直接就是返回==比较的结果。 
对于String,正如楼主的编译器优化的说法,我再写了一个程序:

Java代码 复制代码 收藏代码

Java代码 

 收藏代码

  1. <span style="font-size: medium;">   private static String getString(){  
  2.         return "b";  
  3.     }  
  4.     public static void main(String[] args) {  
  5.         String s1 = "ab";  
  6.         String s2="a"+getString();  
  7.         System.out.println((s1==s2)+":"+(s1.equals(s2)));  
  8.     }  
  9. </span>  


结果: 
false:true 

这个程序运行时产生的String对象是equals的,但==不成立。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
1 收藏
0
分享
返回顶部
顶部