通过Java字节码发现有趣的内幕之String篇(二)

原创
2015/08/31 17:46
阅读数 1.7K

1、字面量相加

首先来看两个字面量字符串相加发生了什么情况,Java代码:

package com.jaffa.test.string;

public class StringOptTest {
	public static void main(String[] args){
	        //假设下面不符合常理的写法发生了,看聪明的编译器为我们做什么
		String str1 = "abc"+"def";
	}
}

编译后常量池列表和指令截图如下:

   

   

通过编译后常量池列表和指令我们发现"abc"和"def"在编译阶段被自动合成一个字符串常量了,减少运行时的指令运算。对于两个字面量的操作还适用于基本类型,如int、float、long、double等,在编译时都会对两个字面量进行运算。但是如果是一个错误的运算结果,那么编译保留原生的字节码指令,运行时报异常,如下面测试代码:

int iNum = 1/0;

2、声明变量的方式相加

String str1 = "abc";
String str2 = "def";
String str3 = str1 + str2;

   常量池列表:  

   

   字节码指令:

 0: ldc           #16
 2: astore_1
 3: ldc           #18
 5: astore_2
 6: new           #20
 9: dup
10: aload_1
11: invokestatic  #22
14: invokespecial #28
17: aload_2
18: invokevirtual #31
21: invokevirtual #35
24: astore_3
25: return

在字节码指令第6个是先new #20,即声明了一个java.lang.StringBuilder的对象,接着执行aload_1将"abc"从栈帧的局部变量表加载到操作数栈中,执行invokestatic #22调用String.valueOf(Ljava/lang/Object)得字符串,并调用invokespecial #28来完成StringBuilder的初始化工作,即new StringBuilder("abc")。第17,18个执行指令完成了append("def")的操作,最后执行21、24指令将数据存储第3个局部变量中。所以可以得到被编译优化后的代码应该如下:

String str1 = "abc";
String str2 = "def";
//String str3 = str1 + str2;
String str3 = new StringBuilder(String.valueOf(str1)).append(str2).toString();

通过验证是否可以说明在开发时可以直接使用String来操作字符相加呢,当然不是,如果只是简单的两个短字符串相加在性能上影响不大,但是如果所要操作的是一个大内容的字符串时,在使用上是建议通过new StringBuilder(capacity)来显示声明对象,因为大量的内容相加StringBuilder内部会不断扩展存放空间和复制数据来满足操作,这样会带来额外的消耗,下面这段代码两个情况执行效率上存在差距。

long time1 = System.currentTimeMillis();
long index = 0;
String str1 = "abc";
String str2 = "def";
while(index<=1000000){
    //cost time 3383
	StringBuilder str3 = new StringBuilder(200);
	//cost time 9821
	//String str3 = null;
	for(int i=0;i<100;i++){
		str3.append(str1).append(str2);
		//str3 += str1+str2;
	}	
	index ++;
}
System.out.printf("cost time %s",System.currentTimeMillis()-time1);

3、类成员属性

package com.jaffa.test.string;

public class StringOptTest {
	private String str1 = "abc";
	private String str2 = "def";
	private String str3 = str1+str2;
}

   

从编译后地字节码我们发现默认生成一个不带参数的构造函数,所有的成员初始化操作在构造函数中完成,注意这里和静态方法不太一样,默认会有aload_0表示实例本身,即this对象是默认参数传入。如果我们显示的编写一个构造函数时,构造函数中的代码会放在初始化成员属性后面执行。如下截图。

展开阅读全文
打赏
4
5 收藏
分享
加载中
图挂了 请博主重新更新一下
2016/10/24 17:33
回复
举报
jaffa博主

引用来自“YanbinQ”的评论

编译优化, 这要体现编译器的智能, 例如有些编译器能把 a * 9 优化成 a << 3 + a, 移位和加法性能优于乘法.
对于 final static 的变量的引用会内联常量值, 所以有些常量值变了, 光替换修改编译后的 class 文件是没用的.

类的变量初始化或 {} 中的代码会放到 <init> 方法中, 相应的 static{} 中的代码会放到 <cinit> 方法中, 这就是我们双大括号的写法 new HashMap(){{this.put("a", "b");}}
对于 final static 的变量的引用会内联常量值, 所以有些常量值变了, 光替换修改编译后的 class 文件是没用的. 学习了,验证一下确实是的,如果final static在父类常量中,编译优化后通过子类去使用这个常量时甚至不会引发父类的静态初始化
2016/03/31 10:17
回复
举报
编译优化, 这要体现编译器的智能, 例如有些编译器能把 a * 9 优化成 a << 3 + a, 移位和加法性能优于乘法.
对于 final static 的变量的引用会内联常量值, 所以有些常量值变了, 光替换修改编译后的 class 文件是没用的.

类的变量初始化或 {} 中的代码会放到 <init> 方法中, 相应的 static{} 中的代码会放到 <cinit> 方法中, 这就是我们双大括号的写法 new HashMap(){{this.put("a", "b");}}
2016/03/30 23:55
回复
举报
更多评论
打赏
3 评论
5 收藏
4
分享
返回顶部
顶部