什么是字节码?
我们平时所说的 Java 字节码,指的是用 Java 语言编译成的字节码。准确的说能在 JVM 平台上执行的字节码格式都是一样的。所以应该统称为 JVM 字节码。
不同的编译器,可以编译出相同的字节码文件,字节码文件也可以在不同的 JVM 上运行。
Java 虚拟机与 Java 语言并没有必然的联系,它只与特定的二进制文件格式 .class 文件格式所关联,.class 文件中包含了 Java 虚拟机指令集(或者称为字节码、Bytecodes)和符号表,还有一些其他的辅助信息。
Java bytecode 由单字节(byte)的指令组成,理论上最多支持 256 个操作码(opcode)。 实际上 Java 只使用了200左右的操作码,还有一些操作码则保留给调试操作。详情见:
JVM 指令集对照表
根据指令的性质,主要分为四个大类:
- 栈操作指令,包括与局部变量交互的指令
- 程序流程控制指令
- 对象操作指令,包括方法调用指令
- 算术运算以及类型转换指令
举个简单的例子:
1 2 3 4 5
| public class HelloByteCode { public static void main(String[] args) { HelloByteCode obj = new HelloByteCode(); } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67
| $ javac -g HelloByteCode.java $ javap -c -v HelloByteCode Classfile /Users/yonghong/Coding/code-lab/gtu-java/week01/HelloByteCode.class Last modified 2021-1-7; size 415 bytes MD5 checksum 44dd68d97fffda0bd16a524fb32b983a Compiled from "HelloByteCode.java" public class HelloByteCode minor version: 0 major version: 52 // 52 对应 Java 8 flags: ACC_PUBLIC, ACC_SUPER Constant pool: // 常量池 #1 = Methodref #2 = Class #3 = Methodref #4 = Class #5 = Utf8 <init> #6 = Utf8 ()V #7 = Utf8 Code #8 = Utf8 LineNumberTable #9 = Utf8 LocalVariableTable #10 = Utf8 this #11 = Utf8 LHelloByteCode; #12 = Utf8 main #13 = Utf8 ([Ljava/lang/String;)V #14 = Utf8 args #15 = Utf8 [Ljava/lang/String; #16 = Utf8 obj #17 = Utf8 SourceFile #18 = Utf8 HelloByteCode.java #19 = NameAndType #20 = Utf8 HelloByteCode #21 = Utf8 java/lang/Object { public HelloByteCode(); descriptor: ()V flags: ACC_PUBLIC Code: stack=1, locals=1, args_size=1 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 1: 0 LocalVariableTable: Start Length Slot Name Signature 0 5 0 this LHelloByteCode;
public static void main(java.lang.String[]); descriptor: ([Ljava/lang/String;)V flags: ACC_PUBLIC, ACC_STATIC Code: stack=2, locals=2, args_size=1 0: new #2 // class HelloByteCode 3: dup 4: invokespecial #3 // Method "<init>":()V 7: astore_1 8: return LineNumberTable: line 3: 0 // new 指令在源码的第 3 行 line 4: 8 // return 指令在源码的第 4 行 LocalVariableTable: // 本地变量表 Start Length Slot Name Signature // 起作用的行 生效范围 槽数 变量名称 变量类型签名 0 9 0 args [Ljava/lang/String; 8 1 1 obj LHelloByteCode; } SourceFile: "HelloByteCode.java"
|
javac 与 javap
javac 的用法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
| $ javac -help 用法: javac <options> <source files> 其中, 可能的选项包括: -g 生成所有调试信息 -g:none 不生成任何调试信息 -g:{lines,vars,source} 只生成某些调试信息 -nowarn 不生成任何警告 -verbose 输出有关编译器正在执行的操作的消息 -deprecation 输出使用已过时的 API 的源位置 -classpath <路径> 指定查找用户类文件和注释处理程序的位置 -cp <路径> 指定查找用户类文件和注释处理程序的位置 -sourcepath <路径> 指定查找输入源文件的位置 -bootclasspath <路径> 覆盖引导类文件的位置 -extdirs <目录> 覆盖所安装扩展的位置 -endorseddirs <目录> 覆盖签名的标准路径的位置 -proc:{none,only} 控制是否执行注释处理和/或编译。 -processor <class1>[,<class2>,<class3>...] 要运行的注释处理程序的名称; 绕过默认的搜索进程 -processorpath <路径> 指定查找注释处理程序的位置 -parameters 生成元数据以用于方法参数的反射 -d <目录> 指定放置生成的类文件的位置 -s <目录> 指定放置生成的源文件的位置 -h <目录> 指定放置生成的本机标头文件的位置 -implicit:{none,class} 指定是否为隐式引用文件生成类文件 -encoding <编码> 指定源文件使用的字符编码 -source <发行版> 提供与指定发行版的源兼容性 -target <发行版> 生成特定 VM 版本的类文件 -profile <配置文件> 请确保使用的 API 在指定的配置文件中可用 -version 版本信息 -help 输出标准选项的提要 -A关键字[=值] 传递给注释处理程序的选项 -X 输出非标准选项的提要 -J<标记> 直接将 <标记> 传递给运行时系统 -Werror 出现警告时终止编译 @<文件名> 从文件读取选项和文件名
|
javap 的用法
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| $ javap -help 用法: javap <options> <classes> 其中, 可能的选项包括: -help --help -? 输出此用法消息 -version 版本信息 -v -verbose 输出附加信息 -l 输出行号和本地变量表 -public 仅显示公共类和成员 -protected 显示受保护的/公共类和成员 -package 显示程序包/受保护的/公共类 和成员 (默认) -p -private 显示所有类和成员 -c 对代码进行反汇编 -s 输出内部类型签名 -sysinfo 显示正在处理的类的 系统信息 (路径, 大小, 日期, MD5 散列) -constants 显示最终常量 -classpath <path> 指定查找用户类文件的位置 -cp <path> 指定查找用户类文件的位置 -bootclasspath <path> 覆盖引导类文件的位置
|
字节码的运行时结构
JVM 是一台基于栈的计算机器。
每个线程都有一个独属于自己的线程栈(JVM Stack),用于存储 栈帧(Frame)。 每一次方法调用,JVM 都会自动创建一个栈帧。栈帧由操作数栈,局部变量数组以及一个 Class 引用组成。Class 引用指向当前方法在运行时常量池中对应的 Class。
从助记符到二进制

四则运行的例子
MovingAverage.java
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| public class MovingAverage { private int count = 0; private double sum = 0.0D;
public void submit(double value) { this.count++; this.sum += value; }
public double getAvg() { if (0 == this.count) { return sum; } return this.sum / this.count; } }
|
LocalVaribleTest.java
1 2 3 4 5 6 7 8 9 10
| public class LocalVaribleTest { public static void main(String[] args) { MovingAverage ma = new MovingAverage(); int num1 = 1; int num2 = 2; ma.submit(num1); ma.submit(num2); double avg = ma.getAvg(); } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81
| $ javap -c MovingAverage Compiled from "MovingAverage.java" public class MovingAverage { public MovingAverage(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: aload_0 5: iconst_0 6: putfield #2 // Field count:I 9: aload_0 10: dconst_0 11: putfield #3 // Field sum:D 14: return
public void submit(double); Code: 0: aload_0 1: dup 2: getfield #2 // Field count:I 5: iconst_1 6: iadd 7: putfield #2 // Field count:I 10: aload_0 11: dup 12: getfield #3 // Field sum:D 15: dload_1 16: dadd 17: putfield #3 // Field sum:D 20: return
public double getAvg(); Code: 0: iconst_0 1: aload_0 2: getfield #2 // Field count:I 5: if_icmpne 13 8: aload_0 9: getfield #3 // Field sum:D 12: dreturn 13: aload_0 14: getfield #3 // Field sum:D 17: aload_0 18: getfield #2 // Field count:I 21: i2d 22: ddiv 23: dreturn }
$ javap -c LocalVaribleTest Compiled from "LocalVaribleTest.java" public class LocalVaribleTest { public LocalVaribleTest(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return
public static void main(java.lang.String[]); Code: 0: new #2 // class MovingAverage 3: dup 4: invokespecial #3 // Method MovingAverage."<init>":()V 7: astore_1 8: iconst_1 9: istore_2 10: iconst_2 11: istore_3 12: aload_1 13: iload_2 14: i2d // int 转成 double 隐式转换 15: invokevirtual #4 // Method MovingAverage.submit:(D)V 18: aload_1 19: iload_3 20: i2d 21: invokevirtual #4 // Method MovingAverage.submit:(D)V 24: aload_1 25: invokevirtual #5 // Method MovingAverage.getAvg:()D 28: dstore 4 30: return }
|
算数操作与类型转换

一个完整的循环控制
1 2 3 4 5 6 7 8 9 10
| public class ForLoopTest { private static int[] nums = {1, 6, 8}; public static void main(String[] args) { MovingAverage ma = new MovingAverage(); for (int num : nums) { ma.submit(num); } double avg = ma.getAvg(); } }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59
| $ javap -c ForLoopTest Compiled from "ForLoopTest.java" public class ForLoopTest { public ForLoopTest(); Code: 0: aload_0 1: invokespecial #1 // Method java/lang/Object."<init>":()V 4: return
public static void main(java.lang.String[]); Code: 0: new #2 // class MovingAverage 3: dup 4: invokespecial #3 // Method MovingAverage."<init>":()V 7: astore_1 8: getstatic #4 // Field nums:[I 11: astore_2 12: aload_2 13: arraylength 14: istore_3 15: iconst_0 // 初始化变量 0 16: istore 4 // 存储到本地变量表 4 槽位 18: iload 4 // 加载 4 槽位 到操作数栈 20: iload_3 // 加载 int 3 到操作数栈 21: if_icmpge 43 // 比较,如果大于等于跳转到 43 行指令 24: aload_2 25: iload 4 27: iaload 28: istore 5 30: aload_1 31: iload 5 33: i2d 34: invokevirtual #5 // Method MovingAverage.submit:(D)V 37: iinc 4, 1 // 4 槽位上加 1 40: goto 18 // goto 18 行指令 43: aload_1 44: invokevirtual #6 // Method MovingAverage.getAvg:()D 47: dstore_2 48: return
static {}; Code: 0: iconst_3 1: newarray int 3: dup 4: iconst_0 5: iconst_1 6: iastore 7: dup 8: iconst_1 9: bipush 6 11: iastore 12: dup 13: iconst_2 14: bipush 8 16: iastore 17: putstatic #4 // Field nums:[I 20: return }
|
方法调用的指令
- invokestatic,顾名思义,这个指令用于调用某个类的静态方法,这是方法调用指令中最快的一个。
- invokespecial, 用来调用构造函数,但也可以用于调用同一个类中的 private 方法, 以及可见的超类方法。
- invokevirtual,如果是具体类型的目标对象,invokevirtual 用于调用公共,受保护和 package 级的私有方法。
- invokeinterface,当通过接口引用来调用方法时,将会编译为 invokeinterface 指令。
- invokedynamic,JDK7 新增加的指令,是实现“动态类型语言”(Dynamically Typed Language)支持而进行的升级改进,同时也是 JDK8 以后支持 lambda 表达式的实现基础。