文档章节

深入Java编程:Java的字节代码

We911
 We911
发布于 2017/02/08 10:17
字数 4601
阅读 5
收藏 0
点赞 0
评论 0

深入Java编程:Java的字节代码


Java程序员很少注意程序的编译结果。事实上,Java的字节代码向我们提供了 非常有价值的信息。特别是在调试排除Java性能问题时,编译结果让我们可以更 深入地理解如何提高程序执行的效率等问题。其实JDK使我们研究Java字节代码变 得非常容易。本文阐述怎样利用JDK中的工具查看解释Java字节代码,主要包含以 下方面的一些内容:

l Java类分解器——javap

l Java字节代码是怎样使程序 避免程序的内存错误

l 怎样通过分析字节代码来提高程序的执行效率

l 利用第三方工具反编译Java字节代码

一、Java类分解器 ——javap

大多数Java程序员知道他们的程序不是编译成本机 代码的。实际上,程序被编译成中间字节代码,由Java虚拟机来解释执行。然而 ,很少程序员注意一下字节代码,因为他们使用的工具不鼓励他们这样做。大多 数的Java调试工具不允许单步的字节代码调试。这些工具要么显示源代码,要么 什么都不显示。

幸好JDK提供了Java类分解器javap,一个命令行工具。 javap对类名给定的文件(.class)提供的字节代码进行反编译,打印出这些类的 一个可读版本。在缺省情况下,javap打印出给定类内的公共域、方法、构造函数 ,以及静态初始值。

1.javap的具体用法

语法: javap <选项 > <类名>...

其中选项包括:

参数 含义
b 向后兼容JDK 1.1中的 javap
c 反编译代码,打印出每个给定类中方法的 Java虚拟机指令。使用该选项后,将对包括私有及受保护方法在内的所有方法进 行反编译
classpath <pathlist> 指明到哪里 查找用户的类文件。这个选项值覆盖了缺少路径以及由CLASSPATH环境变量定义的 路径。此处给出的路径是一个目录及zip文件有序列表,其元素在Unix中以 “:”,在Windows中以“;”分隔。要想在不覆盖缺省系统 类路径的情况下增加一些要查找的目录或zip文件,应使用CLASSPATH环境变量, 使用方法与编译器的-classpath相同。
extdirs <dirs> 覆盖安装扩展目录
help 显示帮助信息
J<flag> 将<flag>直接传递给运行系 统
l 在原来打印信息的基础上,增加行号和局部 变量表
public 只显示公共类及其成员
protected 显示受保护/公共类及其成员
package 显示包受保护/公共类及其成员(缺省)
private 显示所有类及其成员
s 打印内部类型标记
bootclasspath <pathlist> 覆盖由引导类加 载器加载的类文件位置
verbose 打印堆栈大小,方 法的局部变量和参数的数目。若可验证,打印出错原因

2.应用实例

让我们来看一个例子来进一步说 明如何使用javap。

// Imports
import  java.lang.String;

public class ExampleOfByteCode {
  // Constructors
  public ExampleOfByteCode() { }

  // Methods
  public static void main(String[]  args) {
    System.out.println("Hello world");
  }
}

编译好这个类以后,可以用一个十六进制编辑器打开.class文 件,再通过虚拟机说明规范来解释字节代码的含义,但这并不是好方法。利用 javap,可以将字节代码转换成人们可以阅读的文字,只要加上-c参数:

javap -c ExampleOfByteCode

输出结果如下:

Compiled from ExampleOfByteCode.java
public class  ExampleOfByteCode extends java.lang.Object {
    public  ExampleOfByteCode();
    public static void main (java.lang.String[]);
}

Method ExampleOfByteCode()
   0 aload_0
   1 invokespecial #6 <Method  java.lang.Object()>
   4 return

Method void  main(java.lang.String[])
   0 getstatic #7 <Field  java.io.PrintStream out>
   3 ldc #1 <String "Hello  world">
   5 invokevirtual #8 <Method void  println(java.lang.String)>
   8 return

从以上 短短的几行输出代码中,可以学到关于字节代码的许多知识。在main方法的第一 句指令是这样的:

0 getstatic #7 <Field java.io.PrintStream out>

开头的初始数字是指令在方法中的偏移,所以第一个指令的偏移 是0。紧跟偏移的是指令助记符。在本例中,getstatic指令将一个静态字段压入 一个数据结构,我们称这个数据结构为操作数堆栈。后续指令可以通过此结构引 用这个字段。紧跟getstatic指令后面的是压到哪个字段中去。这里的字段是 “#7 <Field java.io.PrintStream out>”。如果直接察看字 节代码,这些字段信息并没有直接存放到指令中去。事实上,就象所有Java类使 用的常量一样,字段信息存储在共享池中。在共享池中存储字段信息可以减小字 节代码的大小。这是因为指令仅仅需要存储的是整型索引号,而不是将整个常量 存储到常量池中。本例中,字段信息存放在常量池的第七号位置。存放的次序是 由编译器决定的,所以看到的是“#7”。

通过分析第一行指令 ,我们可以看出猜测其它指令的含义还是比较简单的。“ldc”(载入 常量)指令将常量“Hello, World.”压入操作数堆栈。 “invokevirtual ”激发println方法,此方法从操作数堆栈中弹出 两个参数。不要忘记象println这样的方法有两个参数:明显的一个是字符串参数 ,加上一个隐含的“this”引用。


二、Java字节代码是怎样使 程序避免程序的内存错误

Java程序设计语言一直被称为internet的安全语 言。从表面上看,这些代码象典型的C++代码,安全从何而来?安全的重要方面是 避免程序的内存错误。计算机罪犯利用程序的内存错误可以将他们的非法代码加 到其它安全的程序中去。Java字节代码是站在第一线抵御这种攻击的

1.类 型安全检测实例

以下的例子可以说明Java具体是怎样做的。

public float add(float f, int n) {
return f +  n;
}

如果你将这段代码加到第一个例子中去,重新编译, 运行javap,分析情况如下:

Method float add(float, int) 
   0 fload_1
   1 iload_2
   2 i2f
    3 fadd
   4 freturn

在Java方法的开头,虚拟机 将方法的参数放到一个被称为举办变量表的数据结构中。从名字就可以看出,局 部变量表包含所有声明的局部变量。在本例中,方法从三个局部变量表实体开始 ,这些是add方法的三个参数。位置0保存该方法返回类型,位置1和2保存浮点和 整型参数。

为了真正操纵变量,它们必须被装载(压)到操作数堆栈。第 一条指令fload_1将浮点参数压到操作数堆栈的位置1。第二条指令iload_2将整型 参数压到操作数堆栈的位置2。有趣的是这些指令的前缀是以“i”和 “f”开头的,这表明Java字节代码的指令按严格的类型划分的。如果 参数类型与字节代码的参数类型不符合,虚拟机将拒绝不安全的字节代码。更妙 的是,字节代码被设计成仅执行一次类型安全检查——当加载类的时 候。

2.Java中的类型安全检测

类型安全是怎样增强系统安全性的 呢?如果攻击者可以让虚拟机将整型变量当成浮点变量,或更严重更多,很容易 预见计算的崩溃。如果计算是发生在银行账户上的,牵连的安全问题是很明显的 。更危险的是欺骗虚拟机将整型变量编程一个对象引用。在大多数情况下,虚拟 机将崩溃,但是攻击者只要找到一个漏洞即可。不要忘记攻击者不需要手工查找 ——更好且容易的办法是写一个程序产生大量变换的坏的字节代码, 直到找到一个可以危害虚拟机的。

另一种字节代码保护内存安全的是数组操作。“aastore”和 “aaload”字节代码操作Java数组,而它们一直要检查数组的边界。 当调用者超越数组边界时,这些字节代码将产生数组溢出错误 (ArrayIndexOutOfBoundsException)。也许所有应用中最重要的检测是分支指 令,例如,以“if.”开始的字节代码。在字节代码中,分支指令在同 一个方法中只能跳转到另一条指令。向方法之外传递控制的唯一办法是返回,产 生一个异常,或执行一个唤醒(invoke)指令。这不仅关闭了许多易受攻击的大 门,也防止由伴随引用和堆栈的崩溃导致的可恶的程序错误。如果你曾经用系统 调试器打开过代码中随机定位的程序,你对这些程序错误会很熟悉。

需要 着重指出的是:所有的这些检测是由虚拟机在字节代码级上完成的,不仅仅是编 译器。其它编程语言的编译器象C++的,可以防止一些我们在上面讨论过的内存错 误,但这些保护是基于源代码级的。操作系统将读入执行任何机器代码,而不管 这些代码是由小心翼翼的C++编译器还是由邪恶的攻击者产生的。简单地说,C++ 是在源程序级上是面向对象的,而Java的面向对象特性扩展到已经编译好的字节 代码上。


时间:2011-09-04 comprg.com.cn

三、怎样通过分析字节代码来提高程序的执行效率

不管你注意它们与 否,Java字节代码的内存和安全保护都客观存在,那为什么还要那么麻烦去看字 节代码呢?其实,就如在DOS下深入理解汇编就可以写出更好的C++代码一样,了 解编译器怎样将你的代码翻译成字节代码可帮助你写出更有效率的代码,有时候 甚至可以防止不知不觉的程序错误。

1.为什么在进行字符串合并时要使用 StringBuffer来代替String

我们看以下代码:

//Return  the concatenation str1+str2
    String concat(String str1,  String str2) {
        return str1 + str2;
     }

    //Append str2 to str1
    void  concat(StringBuffer str1, String str2) {
         str1.append(str2);
    }

试想一下每个方法需要执行 多少函数。编译该程序并执行javap,输出结果如下:

Method  java.lang.String concat(java.lang.String, java.lang.String)
    0 new #6 <Class java.lang.StringBuffer>
   3  dup
   4 aload_1
   5 invokestatic #14 <Method  java.lang.String valueOf(java.lang.Object)>
   8  invokespecial #9 <Method java.lang.StringBuffer (java.lang.String)>
  11 aload_2
  12 invokevirtual  #10 <Method java.lang.StringBuffer append(java.lang.String) >
  15 invokevirtual #13 <Method java.lang.String  toString()>
  18 areturn

Method void concat (java.lang.StringBuffer, java.lang.String)
   0 aload_1
   1 aload_2
   2 invokevirtual #10 <Method  java.lang.StringBuffer append(java.lang.String)>
   5  pop
   6 return

第一个concat方法有五个方法调用: new,invokestatic,invokespecial和两个invokevirtual 。这比第二个cacat 方法多了好多些工作,而第二个cacat只有一个简单的invokevirtual调用。 String类的一个特点是其实例一旦创建,是不能改变的,除非重新给它赋值。在 我们学习Java编程时,就被告知对于字符串连接来说,使用StringBuffer比使用 String更有效率。使用javap分析这点可以清楚地看到它们的区别。如果你怀疑两 种不同语言架构在性能上是否相同时,就应该使用javap分析字节代码。不同的 Java编译器,其产生优化字节代码的方式也不同,利用javap也可以清楚地看到它 们的区别。以下是JBuilder产生字节代码的分析结果:

Method  java.lang.String concat(java.lang.String, java.lang.String)
    0 aload_1
   1 invokestatic #5 <Method  java.lang.String valueOf(java.lang.Object)>
   4  aload_2
   5 invokestatic #5 <Method java.lang.String  valueOf(java.lang.Object)>
   8 invokevirtual #6  <Method java.lang.String concat(java.lang.String)>
  11  areturn

可以看到经过JBuilder的优化,第一个concat方法有三 个方法调用:两个invokestatic invokevirtual 。这还是没有第二个concat方 法简洁。

不管怎样,熟悉即时编译器(JIT, Just-in-time)。因为当某个 方法被第一次调用时,即时编译器将对该虚拟方法表中所指向的字节代码进行编 译,编译完后表中的指针将指向编译生成的机器码,这样即时编译器将字节代码 重新编译成本机代码,它可以使你进行更多javap分析没有揭示的代码优化。除非 你拥有虚拟机的源代码,你应当用性能基准来进行字节代码分析。



2.防止 应用程序中的错误

以下的例子说明如何通过检测字节代码来帮助防止应用 程序中的错误。首先创建两个公共类,它们必须存放在两个不同的文件中。

public class ChangeALot {
    // Variable
    public static final boolean debug=false;
     public static boolean log=false;
}

public class  EternallyConstant {
    // Methods
    public  static void main(String [] args) {
         System.out.println("EternallyConstant beginning execution");
         if (ChangeALot.debug)
             System.out.println("Debug mode is on");
        if  (ChangeALot.log)
            System.out.println ("Logging mode is on");
    }
}

如果运行 EternallyConstant类,应该得到如下信息:

EternallyConstant beginning execution.

现在我们修改ChangeALot文件,将debug和log变量 的值都设置为true。只重新编译ChangeALot文件,再运行EternallyConstant,输 出结果如下:

EternallyConstant beginning execution
Logging mode is on

在调试模式下怎么了?即使设置debug 为true,“Debug mode is on”还是打印不出来。答案在字节编码中 。运行javap分析EternallyConstant类,可看到如下结果:

Compiled from EternallyConstant.java
public class  EternallyConstant extends java.lang.Object {
    public  EternallyConstant();
    public static void main (java.lang.String[]);
}

Method EternallyConstant()
   0 aload_0
   1 invokespecial #1 <Method  java.lang.Object()>
   4 return

Method void  main(java.lang.String[])
   0 getstatic #2 <Field  java.io.PrintStream out>
   3 ldc #3 <String  "EternallyConstant beginning execution">
   5  invokevirtual #4 <Method void println(java.lang.String)>
   8 getstatic #5 <Field boolean log>
  11 ifeq  22
  14 getstatic #2 <Field java.io.PrintStream  out>
  17 ldc #6 <String "Logging mode is  on">
  19 invokevirtual #4 <Method void println (java.lang.String)>
  22 return

很奇怪吧!由于 有“ifep”检测log字段,代码一点都不检测debug字段。因为debug字 段被标记为final ,编译器知道debug字段在运行过程中不会改变。所以 “if”语句被优化,分支部分被移去了。这是一个非常有用的优化, 因为这使你可以在引用程序中嵌入调试代码,而设置为false时不用付出代价,不 幸的是这会导致编译混乱。如果改变了final字段,记住重新编译其它引用该字段 的类。这就是引用有可能被优化的原因。Java开发工具不是每次都能检测这个细 微的改变,这些可能导致临时的非常程序错误。在这里,古老的C++格言对于Java 环境来说一样成立:“每当迷惑不解时,重新编译所有程序“。



四、利用第三方工具反编译Java字节代码

以上介绍了利用javap来 分析Java字节代码,实际上,利用第三方的工具,可以直接得到源代码。这样的 工具有很多,其中NMI's Java Code Viewer (NJCV)是其中使用起来比较方便的一 种。

1.NMI's Java Code Viewer简介

NJCV针对编译好的Java字节 编码,即.class文件、.zip或.jar文件。.jar文件实际上就是.zip文件。利用 NJCV这类反编译工具,可以进一步调试、监听程序错误,进行安全分析等等。通 过分析一些非常优秀的Java代码,我们可以从中学到许多开发Java程序的技巧。

NMI's Java Code Viewer 的最新版本是4.8.3,而且只能运行在以下 Windows平台:

l Windows 95/98

l Windows 2000

l Windows NT 3.51/4.0

2. NMI's Java Code Viewer应用实例

我们以前面例举到的ExampleOfByteCode.class作为例子。打开File菜单 中的open菜单,打开Java字节代码文件,Java class files中列出了所有与该文 件在同一个目录的文件。选择要反编译的文件,然后在Process菜单中选择 Decompile或Dissasemble,反编译好的文件列在Souce-code files一栏。用NMI's Java Code Viewer提供的Programmer’s File Editor打开该文件,瞧,源 代码都列出来了。

// Processed by NMI's Java Code  Viewer 4.8.3 © 1997-2000 B. Lemaire
// Website:  http://njcv.htmlplanet.com  E-mail : info@njcv.htmlplanet.com
// Copy registered to Evaluation Copy
// Source File  Name:   ExampleOfByteCode.java

import  java.io.PrintStream;

public class ExampleOfByteCode {

    public ExampleOfByteCode() {
    }

    public static void main(String args[]) {
         System.out.println("Hello world");
    }

     public float add(float f, int n) {
         return f + (float)n;
    }

    String  concat(String str1, String str2) {
        return  str1 + str2;
    }

    void concat (StringBuffer str1, String str2) {
         str1.append(str2);
    }
}

NMI's Java Code Viewer也支持直接从jar/zip文件中提取类文件。反编译好的文件缺省用.nmi扩展 名存放,用户可以设置.java扩展名。编辑源文件时可以使用NJCV提供的编辑器, 用户可以选择自己喜欢的编辑器。其结果与原文件相差不大,相信大家会喜欢它 。

五、结束语

了解一些字节代码可以帮助从事Java程序编程语言 的程序员们编程。javap工具使察看字节代码变得非常容易,第三方的一些工具使 代码的反编译易如反掌。经常使用javap检测代码,利用第三方工具反编代码,对 于找到特别容易忘记的程序错误、提高程序运行效率、提高系统的安全性和性能 来说,其价值是无法估量的。

随着Java编程技术的发展,Java类库不断完 善,利用Java优越的跨平台性能开发的应用软件也越来越多。Oracle用Java编写 了Oracle 8i的Enterprise Manager,以及其数据库的安装程序;Inprise公司的 Borland JBuilder 3.5也用Java写成;一些Internet电话也使用了Java技术,如 MediaRing、DialPad的网络电话采用了Java的解决方案;甚至以上提到的NMI's Java Code Viewer也是用Java写成的。Java2已使Java得运行性能基本接近C++程 序的执行速度,结合Enterprise JavaBean、Servlet以及COBRA、RMI技术,Java 的功能会越来越强大,其应用也将日益广泛。


本文转载自:http://blog.csdn.net/liduanw/article/details/8201762

共有 人打赏支持
We911
粉丝 0
博文 63
码字总数 0
作品 0
深圳
程序员
【JVM系列】深入了解JVM 、JRE、JDK三者的联系

JDK: Java Development Tool Kit(Java开发工具包)。JDK就是我们用来做事情的工具,它包括JRE还有其他工具。我们所说版本的不同,也就是说它里面的工具有差异。就像是你不同的工具箱里放着不同...

磊神Ray
2011/09/21
0
1
深入探索Java工作原理:JVM,内存回收及其他

Java语言引入了Java虚拟机,具有跨平台运行的功能,能够很好地适应各种Web应用。同时,为了提高Java语言的性能和健壮性,还引入了如垃圾回收机制等新功能,通过这些改进让Java具有其独特的工...

AlphaJay
2010/04/14
0
0
什么是编译性语言、解释性语言和脚本语言

什么是编译性语言、解释性语言和脚本语言   计算机不能直接理解高级语言,只能直接理解机器语言,所以必须要把高级语言翻译成机器语言,计算机才能值型高级语言编写的程序。  翻译的方式有...

AlphaJay
2010/08/18
0
0
深入理解JVM内幕:从基本结构到Java 7新特

摘要:许多没有深入理解JVM的开发者也开发出了很多非常好的应用和类库。不过,如果你更加理解JVM的话,你就会更加理解Java,这样你会有助于你处理类似于我们前面的案例中的问题。 每个Java开...

开源中国驻成都办事处
2012/12/06
0
1
云计算高级培训,Tomcat运维JVM 虚拟机常识

云计算高级培训,Tomcat运维JVM 虚拟机常识,作为了解JVM 虚拟机的开始。我们很有必要弄明白以下问题。 所谓虚拟机,就是一台虚拟的计算机。他是一款软件,用来执行一系列虚拟计算机指令。大...

长沙千锋
05/17
0
0
结合JVM源码谈Java类加载器

一、前言 之前文章 Java 类加载器揭秘 从Java层面讲解了Java类加载器的原理,这里我们结合JVM源码在稍微深入讲解下。 二、Java类加载器的委托机制 Java 类加载器使用的是委托机制,也就是一个...

阿里加多
04/29
0
0
《Java从小白到大牛精简版》之第1章 开篇综述

Java诞生到现在已经有20多年了,但是Java仍然是非常热门的编程语言之一,很多平台中使用Java开发。表1-1所示的是TIOBE社区发布的2016年5月和2017年5月的编程语言排行榜,可见Java语言的热度,...

tony关东升
06/26
0
0
亮剑JVM的9款编程语言杀手开发利器重磅推荐

随着各种各样的编程语言铺地盖地向我们涌来,软件世界似乎变得有点疯狂了。JVM的帝国在不断地壮大,它已经不满足于只作为Java语言的运行平台。它勇敢地将自己的触角伸向了JRuby,Groovy等等,...

ndjys
2012/03/19
0
0
深度探讨Java字节代码的操纵方法

本文为IBM工程师成富编写的《Java深度历险》的第一部分Java字节代码的操纵,像这样Java语言的深度理解和运用还没有很多文章,我们把他奉献给读者,希望读者们喜欢。 51CTO编者按:我们曾给大...

mj4738
2011/11/02
0
0
什么是Java语言?java语言简介

Java是由Sun Microsystems公司于1995年5月推出的Java程序设计语言(以下简称Java语言)和Java平台的总称。用Java实现的HotJava浏览器(支持Java applet)显示了Java的魅力:跨平台、动态的W...

阿秀a
2010/10/19
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Weblogic问题解决记录

问题:点击登录,页面刷新但是不进去管理界面。解决:删除cookies再登录。

wffger
20分钟前
0
0
RxJava2的错误处理方案

最近使用retrofit2 + rxKotlin2写接口访问,想尽量平铺代码,于是就想到当借口返回的状态码为「不成功」时(比如:code != 200),就连同网络错误一起,统一在onError方法中处理。想法总是好的...

猴亮屏
28分钟前
0
0
程序的调试信息

调试二进制程序时,经常要借助GDB工具,跟踪程序的执行流程,获取程序执行时变量的值,以发现问题所在。GDB能得到这些信息,是因为编译程序时,编译器保存了相应的信息。Linux下的可执行程序...

qlee
50分钟前
0
0
应用级缓存

缓存命中率 从缓存中读取数据的次数与总读取次数的比例,命中率越高越好 java缓存类型 堆缓存 guavaCache Ehcache3.x 没有序列化和反序列化 堆外缓存ehcache3.x 磁盘缓存 存储在磁盘上 分布式...

writeademo
今天
0
0
python爬虫日志(3)find(),find_all()函数

1.一般来说,为了找到BeautifulSoup对象内任何第一个标签入口,使用find()方法。 以上代码是一个生态金字塔的简单展示,为了找到第一生产者,第一消费者或第二消费者,可以使用Beautiful Sou...

茫羽行
今天
0
0
java:thread:顺序执行多条线程

实现方案: 1.调用线程的join方法:阻塞主线程 2.线程池 package com.java.thread.test;public class MyThread01 implements Runnable {@Overridepublic void run() {Syste...

人觉非常君
今天
0
0
ElasticSearch 重写IK分词器源码设置mysql热词更新词库

常用热词词库的配置方式 1.采用IK 内置词库 优点:部署方便,不用额外指定其他词库位置 缺点:分词单一化,不能指定想分词的词条 2.IK 外置静态词库 优点:部署相对方便,可以通过编辑指定文...

键走偏锋
今天
19
0
Git 2.18版本发布:支持Git协议v2,提升性能

Git 2.18版本发布:支持Git协议v2,提升性能Git 2.18版本发布:支持Git协议v2,提升性能 新版本协议的主要驱动力是使 Git 服务端能够对各种 ref(分支与 tag)进行过滤操作。 这就意味着,G...

linux-tao
今天
0
0
python浏览器自动化测试库【2018/7/22-更新】

64位py2.7版本 更新 document_GetResources 枚举页面资源 document_GetresourceText 获取指定url的内容 包括页面图片 下载地址下载地址 密码:upr47x...

开飞色
今天
42
0
关于DCL双重锁失效及解决方案

关于DCL双重锁失效及解决方案 Double Check Lock (DCL)实现单例 DCL 方式实现单例的优点是既能够在需要时才初始化单例,又能够保证线程安全,且单例对象初始化后调用getInstance方法不进行...

DannyCoder
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部