Java JVM 运行机制：从 .class 到机器码

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

2203 字

6 分钟

Java JVM 运行机制：从 .class 到机器码

2023-02-04

原理

运行时

/

底层原理

你执行 java -jar app.jar，控制台卡了三秒才出现日志。运维说 GC 停顿导致接口 P99 飙到了 500ms。你打开 GC 日志，满屏的 Young GC、Full GC、Mixed GC 看得头皮发麻。一个 .class 文件是怎么一步步变成 CPU 上运行的机器码的？为什么”一次编写，到处运行”会带来这些性能代价？本文深入剖析 JVM 的完整运行机制。

JVM 架构概览#

flowchart TB subgraph 类加载子系统 A[.class 文件] --> B[类加载器] B --> C[加载] C --> D[链接] D --> E[初始化] end subgraph 运行时数据区 F[方法区 Method Area] G[堆 Heap] H[虚拟机栈 VM Stack] I[程序计数器 PC Register] J[本地方法栈 Native Stack] end subgraph 执行引擎 K[解释器 Interpreter] L[JIT 编译器 HotSpot C1/C2] M[垃圾回收器 GC] end E --> F E --> G K --> H L --> H M --> G

一、类加载机制#

1.1 类的生命周期#

flowchart LR A[加载 Loading] --> B[验证 Verification] B --> C[准备 Preparation] C --> D[解析 Resolution] D --> E[初始化 Initialization] E --> F[使用 Using] F --> G[卸载 Unloading]

一个类从被加载到虚拟机内存中开始，到卸载出内存为止，它的整个生命周期包括：加载、验证、准备、解析、初始化、使用和卸载七个阶段。其中验证、准备、解析三个阶段统称为 链接（Linking）。

1.2 加载阶段#

加载阶段 JVM 需要完成三件事：

通过类的全限定名获取定义此类的二进制字节流
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
在内存中生成一个代表这个类的 java.lang.Class 对象

1
// 类加载的触发条件
2
public class ClassLoadingTrigger {
3
    // 1. new 关键字
4
    Object obj = new Object();
5

6
    // 2. 反射调用
7
    // Class.forName("com.example.MyClass")
8

9
    // 3. 子类初始化触发父类初始化
10
    // class Child extends Parent {}
11

12
    // 4. 虚拟机启动时的主类（含 main 方法）
13

14
    // 5. MethodHandle/VarHandle 的使用
15
}

1.3 链接阶段#

验证：确保 Class 文件的字节流包含的信息符合 JVM 规范。

flowchart TB A[文件格式验证] --> B[元数据验证] B --> C[字节码验证] C --> D[符号引用验证]

验证阶段	检查内容
文件格式验证	魔数 0xCAFEBABE、版本号、常量池
元数据验证	是否有父类、是否继承了 final 类、接口实现完整性
字节码验证	数据流分析、控制流分析、类型安全
符号引用验证	引用类是否存在、字段/方法是否可访问

准备：为类变量分配内存并设置初始值（零值），不是用户代码中设置的值。

1
// 准备阶段
2
public static int value = 123;
3
// 准备后 value = 0（零值），初始化阶段才变为 123
4

5
public static final int CONSTANT = 123;
6
// 准备后 CONSTANT = 123（final 常量在编译期就确定了）

解析：将常量池内的符号引用替换为直接引用。

1
符号引用 -> 直接引用
2

3
com/example/MyClass -> 内存地址 0x7f3a4b2c

1.4 初始化阶段#

执行类构造器 <clinit>() 方法，按源码顺序收集所有静态变量赋值语句和静态代码块。

1
public class InitOrder {
2
    static {
3
        System.out.println("1");  // <clinit> 中第一行
4
    }
5

6
    private static int value = getValue();
7

8
    static {
9
        System.out.println("3");  // <clinit> 中第三行
10
    }
11

12
    private static int getValue() {
13
        System.out.println("2");
14
        return 42;
15
    }
16

17
    // 输出顺序: 1 -> 2 -> 3
18
}

二、双亲委派模型#

2.1 类加载器层次#

flowchart TB A[Bootstrap ClassLoader 启动类加载器 rt.jar, resources.jar] --> B[Extension ClassLoader 扩展类加载器 ext/*.jar] B --> C[Application ClassLoader 应用程序类加载器 classpath] C --> D[自定义 ClassLoader]

类加载器	加载路径	实现语言
Bootstrap ClassLoader	`JAVA_HOME/lib` (rt.jar 等)	C++
Extension ClassLoader	`JAVA_HOME/lib/ext`	Java
Application ClassLoader	classpath 下的类	Java
Custom ClassLoader	自定义路径	Java

2.2 委派流程#

sequenceDiagram participant A as Application ClassLoader participant E as Extension ClassLoader participant B as Bootstrap ClassLoader A->>A: 检查是否已加载 A->>E: 委派给父加载器 E->>E: 检查是否已加载 E->>B: 委派给父加载器 B->>B: 检查是否已加载 B->>B: 尝试加载 alt Bootstrap 加载成功 B-->>E: 返回 Class 对象 E-->>A: 返回 Class 对象 else Bootstrap 加载失败 B-->>E: 返回 null E->>E: 尝试加载 alt Extension 加载成功 E-->>A: 返回 Class 对象 else Extension 加载失败 E-->>A: 返回 null A->>A: 尝试加载 end end

2.3 打破双亲委派#

1
// 线程上下文类加载器（SPI 机制）
2
// 参考: https://github.com/openjdk/jdk/blob/master/src/java.base/share/classes/java/util/ServiceLoader.java
3
ServiceLoader<Driver> drivers = ServiceLoader.load(Driver.class);
4

5
// ServiceLoader 使用线程上下文类加载器
6
public static <S> ServiceLoader<S> load(Class<S> service) {
7
    ClassLoader cl = Thread.currentThread().getContextClassLoader();
8
    return new ServiceLoader<>(service, cl);
9
}

OSGi 模块化：每个模块有自己的类加载器，形成网状而非树状的委派关系。

1
传统双亲委派（树状）:
2
Bootstrap -> Extension -> Application
3

4
OSGi（网状）:
5
Bundle A <-> Bundle B <-> Bundle C
6
    ^           ^           ^
7
    +-----------+-----------+

三、运行时数据区#

3.1 内存布局#

1
+--------------------------------------------------+
2
|                  JVM 运行时数据区                  |
3
+--------------------------------------------------+
4
|  线程共享                                         |
5
|  +--------------------+  +---------------------+  |
6
|  |   方法区 (Metaspace) |  |       堆 (Heap)     |  |
7
|  | - 类元数据          |  | - 新生代             |  |
8
|  | - 常量池            |  |   - Eden            |  |
9
|  | - 静态变量          |  |   - Survivor 0      |  |
10
|  | - JIT 代码缓存      |  |   - Survivor 1      |  |
11
|  +--------------------+  | - 老年代             |  |
12
|                          +---------------------+  |
13
+--------------------------------------------------+
14
|  线程私有                                         |
15
|  +--------------+  +-----------+  +------------+  |
16
|  | 虚拟机栈      |  | 本地方法栈 |  | 程序计数器 |  |
17
|  | - 栈帧        |  | - Native  |  | - 字节码   |  |
18
|  |   - 局部变量表 |  |   方法调用 |  |   行号     |  |
19
|  |   - 操作数栈   |  |           |  |            |  |
20
|  |   - 动态链接   |  |           |  |            |  |
21
|  |   - 返回地址   |  |           |  |            |  |
22
|  +--------------+  +-----------+  +------------+  |
23
+--------------------------------------------------+

3.2 堆内存结构#

flowchart TB subgraph Java Heap subgraph 新生代 Young Generation A[Eden 80%] B[Survivor 0 10%] C[Survivor 1 10%] end subgraph 老年代 Old Generation D[Tenured 长期存活对象] end end E[new 对象] --> A A -->|GC| B A -->|GC| C B -->|年龄>=15| D C -->|年龄>=15| D

3.3 虚拟机栈帧结构#

flowchart TB subgraph 栈帧 Stack Frame A[局部变量表 Local Variable Table] B[操作数栈 Operand Stack] C[动态链接 Dynamic Linking] D[方法返回地址 Return Address] E[附加信息 附加信息] end F[方法调用] --> A F --> B

1
// 栈帧示例
2
public int add(int a, int b) {
3
    int c = a + b;
4
    return c;
5
}
6

7
// 对应字节码（局部变量表和操作数栈的交互）
8
// 0: iload_1    // 将局部变量表 slot 1 (a) 压入操作数栈
9
// 1: iload_2    // 将局部变量表 slot 2 (b) 压入操作数栈
10
// 2: iadd       // 弹出两个值相加，结果压栈
11
// 3: istore_3   // 弹出结果存入局部变量表 slot 3 (c)
12
// 4: iload_3    // 加载 c
13
// 5: ireturn    // 返回

3.4 方法区演变#

JDK 版本	方法区实现	存储位置	特点
JDK 7	永久代 PermGen	JVM 堆	固定大小，容易 OOM
JDK 8+	元空间 Metaspace	本地内存	自动扩展，受限于物理内存

1
# JDK 8+ 元空间相关参数
2
-XX:MetaspaceSize=256m         # 初始元空间大小
3
-XX:MaxMetaspaceSize=512m      # 最大元空间大小
4
-XX:MinMetaspaceFreeRatio=40   # GC 后最小空闲比例

四、字节码执行引擎#

4.1 解释执行#

flowchart LR A[.class 文件] --> B[字节码 Bytecode] B --> C[解释器 Interpreter] C --> D[逐条解释执行] D --> E[机器码执行]

HotSpot JVM 使用的是基于栈的解释器。字节码指令通过操作数栈完成计算。

1
// 源码
2
int a = 1;
3
int b = 2;
4
int c = a + b;
5

6
// 字节码
7
// 0: iconst_1      // 将常量 1 压入操作数栈
8
// 1: istore_1      // 存入局部变量 a
9
// 2: iconst_2      // 将常量 2 压入操作数栈
10
// 3: istore_2      // 存入局部变量 b
11
// 4: iload_1       // 加载 a
12
// 5: iload_2       // 加载 b
13
// 6: iadd          // 加法
14
// 7: istore_3      // 存入局部变量 c

4.2 基于栈 vs 基于寄存器#

特性	基于栈（JVM）	基于寄存器（Dalvik/LuaVM）
指令长度	短（单字节大多够用）	较长（需要指定寄存器编号）
指令数量	多（需要入栈出栈操作）	少（直接操作寄存器）
可移植性	高（不依赖硬件寄存器）	低（需要映射到物理寄存器）
执行速度	较慢（频繁内存访问）	较快（寄存器访问更快）

五、JIT 编译#

5.1 热点探测#

JVM 通过方法调用计数器和回边计数器检测热点代码：

flowchart TB A[方法调用] --> B{调用计数器 超过阈值?} B -->|否| C[解释执行] B -->|是| D[触发 JIT 编译] D --> E[C1 编译 Client Compiler] E --> F{方法调用 更加频繁?} F -->|是| G[C2 编译 Server Compiler] F -->|否| H[C1 生成代码 继续执行] G --> I[C2 生成优化代码] C --> B

1
# JIT 编译相关参数
2
-XX:CompileThreshold=10000          # 方法调用阈值（C2）
3
-XX:CompileThresholdScaling=1.0     # 阈值缩放因子
4
-Xbatch                             # 同步编译（阻塞等待）
5
-XX:+PrintCompilation               # 打印 JIT 编译日志

5.2 分层编译#

JDK 8 开始默认启用分层编译（Tiered Compilation）：

层级	编译器	优化级别	特点
0	解释器	无	收集 profiling 信息
1	C1	简单	快速编译，简单优化
2	C1	中等	编译 + 部分 profiling
3	C1	完整	编译 + 完整 profiling
4	C2	完整	高度优化，编译较慢

5.3 JIT 优化技术#

方法内联（Inlining）：最基础也最有效的优化。

1
// 优化前
2
int result = add(a, b);
3

4
public int add(int x, int y) {
5
    return x + y;
6
}
7

8
// JIT 内联后（等价于直接计算）
9
int result = a + b;

1
# 查看内联情况
2
-XX:+PrintInlining

逃逸分析（Escape Analysis）：分析对象的作用域，决定是否可以在栈上分配。

1
public void process() {
2
    // 对象不会逃逸出方法，可以在栈上分配
3
    // 不需要 GC 回收
4
    Point p = new Point(1, 2);
5
    int sum = p.x + p.y;
6
}

标量替换（Scalar Replacement）：将对象拆解为标量（基本类型）。

1
// 逃逸分析发现 Point 不逃逸
2
// 标量替换后，不创建对象
3
int x = 1;
4
int y = 2;
5
int sum = x + y;

循环优化：

1
// 循环展开（Loop Unrolling）
2
// 优化前
3
for (int i = 0; i < 1000; i++) {
4
    sum += array[i];
5
}
6

7
// 优化后（减少循环开销）
8
for (int i = 0; i < 1000; i += 4) {
9
    sum += array[i];
10
    sum += array[i+1];
11
    sum += array[i+2];
12
    sum += array[i+3];
13
}

5.4 C1 与 C2 对比#

特性	C1 (Client Compiler)	C2 (Server Compiler)
编译速度	快	慢
优化程度	较低	高度优化
适用场景	启动性能敏感	长期运行的服务端应用
优化手段	方法内联、简单优化	逃逸分析、循环优化、向量化

六、垃圾回收#

6.1 如何判断对象可回收#

引用计数法（Java 未采用）：

1
对象 A <- 引用计数 = 2
2
    ^         ^
3
  ref1      ref2
4

5
循环引用问题:
6
A <-> B  两者引用计数都不为 0，但实际已无法访问

可达性分析（Java 实际采用）：

flowchart TB subgraph GC Roots A[栈帧中的局部变量] B[静态变量] C[JNI 引用] D[同步锁持有的对象] end A --> E[对象 X] B --> F[对象 Y] E --> G[对象 Z] F --> G H[孤立对象 A] --> I[孤立对象 B] I --> H

6.2 分代收集理论#

GC 类型：

GC 类型	回收区域	触发条件	特点
Minor GC	新生代	Eden 区空间不足	频繁，速度快
Major GC	老年代	老年代空间不足	较慢
Mixed GC	新生代+部分老年代	G1 特有	G1 的回收策略
Full GC	整个堆+方法区	多种触发条件	最慢，应尽量避免

6.3 GC 算法#

标记-清除（Mark-Sweep）：

1
标记前:  [A][B][空][C][D][空][E][空][F]
2
标记后:  [A][B][空][X C][X D][空][E][空][F]
3
清除后:  [A][B][空][空][空][空][E][空][F]
4
                                    ^ 内存碎片

复制算法（Copying）：

1
回收前:
2
Eden:    [A][B][C][D][E][F]
3
S0:      [空]
4
S1:      [G][H]
5

6
存活对象复制到 S1:
7
S1:      [A][B][C][D][E][F][G][H]
8
Eden:    [空]（全部清空）
9
S0:      [空]
10

11
交换 S0 和 S1 的角色

标记-整理（Mark-Compact）：

1
标记前:  [A][空][B][空][C][空][D]
2
整理后:  [A][B][C][D][空][空][空]
3
         ^ 无碎片，但移动对象开销大

6.4 常用垃圾回收器#

flowchart TB subgraph 新生代回收器 A[Serial 单线程，STW] B[ParNew 多线程版 Serial] C[Parallel Scavenge 吞吐量优先] end subgraph 老年代回收器 D[Serial Old 单线程，标记-整理] E[CMS 并发标记-清除] F[Parallel Old 多线程，吞吐量优先] end subgraph 整堆回收器 G[G1 分区收集，可预测停顿] H[ZGC 超低延迟，并发整理] I[Shenandoah 并发压缩，低延迟] end A ---|配合| D B ---|配合| E C ---|配合| F

6.5 G1 垃圾回收器详解#

G1 将堆划分为多个大小相等的 Region：

1
+------+------+------+------+------+------+
2
| E    | S    | O    | E    | H    | E    |
3
+------+------+------+------+------+------+
4
| O    | E    | E    | O    | E    | S    |
5
+------+------+------+------+------+------+
6

7
E = Eden Region
8
S = Survivor Region
9
O = Old Region
10
H = Humongous Region（大对象）

sequenceDiagram participant Y as Young GC participant C as Concurrent Mark participant M as Mixed GC participant F as Full GC Note over Y: 回收所有 Eden 和 Survivor Y->>C: 老年代占用达到阈值 C->>C: 初始标记 (STW) C->>C: 并发标记 C->>C: 最终标记 (STW) C->>C: 筛选回收 (STW) C->>M: 选择回收价值高的 Region M->>F: 回收失败时退化

6.6 ZGC 垃圾回收器#

ZGC 是 JDK 11 引入的低延迟垃圾回收器，目标是将 GC 停顿控制在 10ms 以内。

1
# 启用 ZGC
2
java -XX:+UseZGC -Xmx4g -jar app.jar
3

4
# ZGC 关键参数
5
-XX:ZCollectionInterval=0    # GC 间隔（0 为不限制）
6
-XX:ZAllocationSpikeTolerance=2  # 分配峰值容忍度
7
-XX:+UnlockDiagnosticVMOptions -XX:+ZStatisticsForceTrace  # 统计追踪

ZGC 着色指针和读屏障：

1
着色指针（Colored Pointer）:
2
+------+------+------+------+------+------+
3
| 固定位 | finalizable | remap | marked1 | marked0 |
4
+------+------+------+------+------+------+
5
                    ^
6
            通过指针上的标记位判断对象状态
7

8
读屏障（Load Barrier）:
9
对象引用加载时检查指针颜色
10
如果颜色不对，通过转发表找到新地址
11
整个过程与应用线程并发执行

七、Java 内存模型 (JMM)#

7.1 JMM 抽象结构#

flowchart TB subgraph 线程 A A1[工作内存 Working Memory] end subgraph 线程 B B1[工作内存 Working Memory] end subgraph 主内存 C1[共享变量 Main Memory] end A1 <-->|read/write save/load| C1 B1 <-->|read/write save/load| C1 A1 -.->|不可直接通信| B1

7.2 happens-before 规则#

规则	说明
程序顺序规则	同一线程内，操作按代码顺序 happens-before
锁定规则	unlock 操作 happens-before 后续 lock 操作
volatile 规则	volatile 写 happens-before 后续 volatile 读
传递性规则	A -> B 且 B -> C，则 A -> C
线程启动规则	Thread.start() happens-before 线程内操作
线程终止规则	线程内操作 happens-before Thread.join() 返回

7.3 volatile 实现#

1
// volatile 写操作的字节码层面
2
// 会插入内存屏障指令
3

4
// 写操作前: StoreStore 屏障
5
// 写操作后: StoreLoad 屏障
6

7
// 读操作前: 无屏障
8
// 读操作后: LoadLoad 屏障 + LoadStore 屏障

1
// 单例模式中的 double-check locking
2
public class Singleton {
3
    private volatile static Singleton instance;
4

5
    public static Singleton getInstance() {
6
        if (instance == null) {               // 第一次检查
7
            synchronized (Singleton.class) {
8
                if (instance == null) {        // 第二次检查
9
                    instance = new Singleton(); // volatile 防止指令重排序
10
                }
11
            }
12
        }
13
        return instance;
14
    }
15
}
16

17
// 没有 volatile 可能的问题:
18
// instance = new Singleton() 实际分三步:
19
// 1. 分配内存空间
20
// 2. 初始化对象
21
// 3. 将引用指向内存地址
22
// 重排序后可能变成 1->3->2，导致其他线程拿到未初始化的对象

7.4 synchronized 实现#

1
// synchronized 在字节码层面使用 monitorenter/monitorexit
2
public void syncMethod() {
3
    synchronized (this) {
4
        // monitorenter
5
        // 临界区代码
6
        // monitorexit
7
    }
8
}

锁升级过程：

flowchart LR A[无锁 Unlocked] --> B[偏向锁 Biased Lock] B -->|第二个线程竞争| C[轻量级锁 Lightweight Lock] C -->|自旋失败| D[重量级锁 Heavyweight Lock]

锁状态	偏向锁	轻量级锁	重量级锁
适用场景	只有一个线程	少量线程交替	激烈竞争
获取方式	CAS 更新 Mark Word	CAS 更新 Mark Word	操作系统互斥量
性能	最高	较高	较低（涉及内核态切换）

八、JVM 调优实战#

8.1 常用参数#

1
# 堆大小设置
2
-Xms2g                          # 初始堆大小
3
-Xmx4g                          # 最大堆大小（建议与 Xms 相同）
4
-Xmn1g                          # 新生代大小
5
-Xss512k                        # 线程栈大小
6

7
# GC 选择
8
-XX:+UseG1GC                    # 使用 G1
9
-XX:+UseZGC                     # 使用 ZGC（JDK 11+）
10
-XX:+UseShenandoahGC            # 使用 Shenandoah（JDK 12+）
11

12
# GC 日志（JDK 9+ 统一日志格式）
13
-Xlog:gc*:file=gc.log:time,uptime,level,tags
14

15
# 元空间
16
-XX:MetaspaceSize=256m
17
-XX:MaxMetaspaceSize=512m
18

19
# JIT 相关
20
-XX:ReservedCodeCacheSize=256m  # JIT 代码缓存大小

8.2 内存泄漏排查#

1
# 1. 生成堆转储
2
jmap -dump:format=b,file=heap.hprof <pid>
3

4
# 或使用 JVM 参数自动在 OOM 时生成
5
-XX:+HeapDumpOnOutOfMemoryError
6
-XX:HeapDumpPath=/tmp/heap.hprof
7

8
# 2. 查看堆中对象统计
9
jmap -histo <pid> | head -20
10

11
# 3. 查看 GC 状况
12
jstat -gcutil <pid> 1000 10  # 每秒打印一次，共 10 次
13

14
# 输出示例:
15
#  S0     S1     E      O      M     CCS    YGC   YGCT   FGC  FGCT
16
#  0.00  45.23  67.89  72.34  95.12  91.56   156  2.345    3  0.892

8.3 GC 日志分析#

1
# 启用 GC 日志（JDK 8）
2
-XX:+PrintGCDetails
3
-XX:+PrintGCDateStamps
4
-Xloggc:/tmp/gc.log
5

6
# 启用 GC 日志（JDK 9+）
7
-Xlog:gc*:file=gc.log:time,level,tags
8

9
# 使用 GCEasy 分析: https://gceasy.io/
10
# 使用 GCViewer 分析: https://github.com/chewiebug/GCViewer

G1 GC 日志示例：

1
[GC pause (G1 Evacuation Pause) (young), 0.0234567 secs]
2
   [Eden: 256.0M(256.0M)->0.0B(230.0M)
3
    Survivors: 0.0B->26.0M
4
    Heap: 256.0M(512.0M)->24.0M(512.0M)]
5
 [Times: user=0.08 sys=0.01, real=0.02 secs]

8.4 常见问题与调优策略#

问题	现象	排查方向
频繁 Full GC	CPU 使用率高，响应变慢	检查是否有内存泄漏、大对象
OOM	应用崩溃	分析堆转储，找出最大对象
元空间溢出	Metaspace OOM	检查动态类生成（CGLIB 等）
GC 停顿过长	接口超时	切换低延迟 GC（ZGC/G1）
内存泄漏	堆内存持续增长	对比多次堆转储的对象变化

常见问题#

Q1: 为什么 JDK 8 用 Metaspace 替代了永久代？#

永久代大小在启动时固定（-XX:MaxPermSize），很难调优。字符串常量池、动态代理（CGLIB）、Groovy 脚本等场景容易导致 java.lang.OutOfMemoryError: PermGen space。Metaspace 使用本地内存，默认只受物理内存限制，大大减少了这类问题。