JavaScript 引擎原理：V8 执行流程

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

Souloss

公告

欢迎来到我的博客！这是一条示例公告

Learn More

标签

1035 字

3 分钟

JavaScript 引擎原理：V8 执行流程

2024-05-04

原理

运行时

/

底层原理

前言#

JavaScript 是一门解释型语言，但现代 JavaScript 引擎（如 V8）通过 JIT（Just-In-Time）编译技术，使其性能接近编译型语言。本文深入剖析 V8 引擎的执行流程，帮助你理解 JavaScript 代码是如何被高效执行的。

V8 架构概览#

flowchart TB subgraph 源码处理 A[JavaScript 源码] --> B[解析器 Parser] B --> C[抽象语法树 AST] end subgraph 字节码生成 C --> D[字节码生成器] D --> E[字节码 Bytecode] end subgraph 执行引擎 E --> F[解释器 Ignition] F --> G[执行字节码] G --> H[收集类型反馈] end subgraph 优化编译 H --> I[编译器 TurboFan] I --> J[优化机器码] J --> K[执行优化代码] K --> |去优化| F end

一、解析阶段（Parsing）#

1.1 词法分析（Lexical Analysis）#

将源码字符串转换为 Token 流：

1
// 源码
2
const x = 1 + 2;
3

4
// 词法分析后的 Token 流
5
[
6
  { type: "Keyword", value: "const" },
7
  { type: "Identifier", value: "x" },
8
  { type: "Punctuator", value: "=" },
9
  { type: "Numeric", value: "1" },
10
  { type: "Punctuator", value: "+" },
11
  { type: "Numeric", value: "2" },
12
  { type: "Punctuator", value: ";" },
13
];

词法分析器状态机：

stateDiagram-v2 [*] --> Start Start --> Identifier: 字母/_ Start --> Number: 数字 Start --> String: 引号 Start --> Operator: 运算符 Start --> Whitespace: 空白 Identifier --> Identifier: 字母/数字/_ Identifier --> [*]: 其他 Number --> Number: 数字/点 Number --> [*]: 其他 String --> String: 非引号 String --> [*]: 引号 Operator --> [*] Whitespace --> Start

1.2 语法分析（Syntax Analysis）#

将 Token 流转换为抽象语法树（AST）：

1
// 源码
2
function add(a, b) {
3
  return a + b;
4
}
5

6
// AST 结构（简化）
7
{
8
  type: 'FunctionDeclaration',
9
  id: { type: 'Identifier', name: 'add' },
10
  params: [
11
    { type: 'Identifier', name: 'a' },
12
    { type: 'Identifier', name: 'b' }
13
  ],
14
  body: {
15
    type: 'BlockStatement',
16
    body: [{
17
      type: 'ReturnStatement',
18
      argument: {
19
        type: 'BinaryExpression',
20
        operator: '+',
21
        left: { type: 'Identifier', name: 'a' },
22
        right: { type: 'Identifier', name: 'b' }
23
      }
24
    }]
25
  }
26
}

V8 解析器特点：

特性	说明
Pre-parser	预解析器，延迟解析非立即执行代码
Lazy parsing	懒解析，函数首次调用时才完整解析
Scope analysis	作用域分析，确定变量引用关系

1.3 懒解析优化#

1
// 外层代码立即解析
2
function outer() {
3
  // inner 函数体延迟解析（首次调用时才解析）
4
  function inner() {
5
    console.log("lazy parsed");
6
  }
7

8
  // 调用时才触发完整解析
9
  inner();
10
}

sequenceDiagram participant P as Parser participant PP as Pre-parser participant S as Source S->>P: 解析 outer 函数声明 P->>PP: 遇到 inner，交给预解析器 PP-->>P: 返回函数边界信息 Note over P: 继续解析后续代码 P->>P: 调用 inner 时完整解析

二、字节码生成#

2.1 字节码介绍#

字节码是介于源码和机器码之间的中间表示：

1
┌─────────────────────────────────────────┐
2
│ JavaScript 源码                          │
3
│ const x = 1 + 2;                        │
4
└─────────────────┬───────────────────────┘
5
                  ↓
6
┌─────────────────────────────────────────┐
7
│ 字节码（简化表示）                        │
8
│ Ldar a0          // 加载参数 a           │
9
│ Add a1, [0]      // 加上参数 b           │
10
│ Return           // 返回结果             │
11
└─────────────────┬───────────────────────┘
12
                  ↓
13
┌─────────────────────────────────────────┐
14
│ 机器码（x64）                            │
15
│ mov rax, [rbp-0x10]                     │
16
│ add rax, [rbp-0x18]                     │
17
│ ret                                     │
18
└─────────────────────────────────────────┘

2.2 字节码指令集#

V8 字节码指令集（部分）：

指令	操作
`Ldar`	Load accumulator from register
`Star`	Store accumulator to register
`Add`	加法运算
`Sub`	减法运算
`Mul`	乘法运算
`LdaGlobal`	加载全局变量
`StaGlobal`	存储全局变量
`Call`	函数调用
`Return`	返回
`Jump`	跳转
`TestEqual`	相等比较

2.3 字节码生成示例#

1
// 源码
2
function sum(a, b) {
3
  return a + b;
4
}
5

6
// 生成的字节码（简化）
7
// 参数 a 在寄存器 a0, b 在寄存器 a1
8
Ldar a0           // 加载 a 到累加器
9
Add a1, [0]       // 累加器 + b，结果存入累加器
10
Return            // 返回累加器值

1
// 源码：条件语句
2
function abs(x) {
3
  if (x >= 0) {
4
    return x;
5
  }
6
  return -x;
7
}
8

9
// 字节码（简化）
10
Ldar a0           // 加载 x
11
Star r0           // 存入 r0
12
LdaSmi [0]        // 加载立即数 0
13
TestGreaterThanOrEqual r0  // 比较 x >= 0
14
JumpIfFalse [10] // 条件为假跳转到地址 10
15
Ldar a0           // 返回 x
16
Return
17
Ldar a0           // 加载 x
18
Neg               // 取负
19
Return

三、解释执行（Ignition）#

3.1 Ignition 解释器#

Ignition 是 V8 的字节码解释器：

flowchart TB A[字节码] --> B[取指令 Fetch] B --> C[解码 Decode] C --> D[执行 Execute] D --> E{下一条指令} E -->|跳转| B E -->|返回| F[结果] D --> G[收集类型反馈] G --> H[反馈向量]

3.2 类型反馈收集#

解释器在执行时收集运行时类型信息：

1
function add(a, b) {
2
  return a + b;
3
}
4

5
// 第一次调用：整数
6
add(1, 2); // 记录：a 是 Smi，b 是 Smi，结果是 Smi
7

8
// 第二次调用：还是整数
9
add(3, 4); // 确认：参数类型稳定
10

11
// 第三次调用：字符串
12
add("a", "b"); // 类型变化！触发去优化

反馈向量结构：

1
FeedbackVector for add:
2
┌────────────────────────────────────────┐
3
│ Slot 0: BinaryOp (+)                   │
4
│   ├── 类型: Smi + Smi → Smi            │
5
│   └── 调用次数: 2                       │
6
├────────────────────────────────────────┤
7
│ Slot 1: CallCount                      │
8
│   └── 调用次数: 3                       │
9
└────────────────────────────────────────┘

3.3 内联缓存（Inline Cache）#

V8 使用内联缓存加速属性访问：

1
const obj = { x: 1, y: 2 };
2

3
function getX(o) {
4
  return o.x; // 第一次：查找属性位置
5
  // 后续：直接使用缓存的位置
6
}
7

8
getX(obj); // 缓存：obj 的 x 在 offset 0
9
getX(obj); // 命中缓存，直接访问

flowchart LR A[访问 o.x] --> B{IC 缓存?} B -->|命中| C[直接访问 offset] B -->|未命中| D[查找属性] D --> E[缓存结果] E --> F[返回值] C --> F

四、优化编译（TurboFan）#

4.1 TurboFan 编译器#

TurboFan 是 V8 的优化编译器：

flowchart TB A[字节码 + 类型反馈] --> B[构建图] B --> C[优化阶段] C --> D[降低阶段] D --> E[代码生成] E --> F[优化机器码] subgraph 优化阶段 C1[内联] C2[逃逸分析] C3[循环优化] C4[死代码消除] end C --> C1 --> C2 --> C3 --> C4

4.2 内联优化#

将函数调用替换为函数体：

1
// 原始代码
2
function add(a, b) {
3
  return a + b;
4
}
5
function compute(x) {
6
  return add(x, 10);
7
}
8

9
// 内联后
10
function compute(x) {
11
  return x + 10; // add 函数被内联
12
}

内联决策因素：

因素	影响
函数大小	小函数更可能内联
调用频率	热点函数更可能内联
类型稳定性	类型稳定的更可能内联
调用深度	避免过度内联

4.3 逃逸分析#

分析对象是否”逃逸”出函数：

1
function createPoint(x, y) {
2
  return { x, y }; // 对象逃逸（返回给外部）
3
}
4

5
function compute(x, y) {
6
  const point = { x, y }; // 对象未逃逸
7
  return point.x + point.y;
8
}
9

10
// 逃逸分析后，可以标量替换
11
function compute(x, y) {
12
  // const point = { x, y };  // 消除对象分配
13
  return x + y; // 直接使用标量
14
}

4.4 Sea of Nodes#

TurboFan 使用图表示（Sea of Nodes）：

1
// 源码
2
// return a + b * c;
3

4
计算图:
5
    Load(a)    Load(b)    Load(c)
6
        |          |          |
7
        |      Multiply------+
8
        |          |
9
        +---Add----+
10
            |
11
         Return

节点类型：

类型	说明
ValueNode	值计算
ControlNode	控制流
EffectNode	副作用
MemoryNode	内存操作

4.5 优化假设#

TurboFan 基于类型反馈做优化假设：

1
function process(arr) {
2
  let sum = 0;
3
  for (let i = 0; i < arr.length; i++) {
4
    sum += arr[i];
5
  }
6
  return sum;
7
}
8

9
// 假设：arr 是连续的整数数组（SMI Array）
10
// 优化：
11
// 1. 内联 length 访问
12
// 2. 消除边界检查（如果已验证）
13
// 3. 使用 SIMD 指令加速

五、去优化（Deoptimization）#

5.1 触发条件#

当优化假设失效时，触发去优化：

flowchart TB A[执行优化代码] --> B{假设检查} B -->|通过| C[继续执行] B -->|失败| D[触发去优化] D --> E[丢弃优化代码] E --> F[回到解释器] F --> G[重新收集反馈]

触发条件：

条件	示例
类型变化	`add(1, 2)` → `add('a', 'b')`
原型链变化	修改对象原型
隐藏类变化	添加新属性
数组类型变化	SMI 数组变为对象数组

5.2 去优化代价#

1
// 热点函数
2
function hot(arr) {
3
  return arr[0] + arr[1];
4
}
5

6
// 大量调用，已优化
7
for (let i = 0; i < 100000; i++) {
8
  hot([1, 2]); // 整数数组，优化为 SMI 操作
9
}
10

11
// 类型改变，触发去优化
12
hot(["a", "b"]); // 字符串数组！
13

14
// 后续调用回到解释器
15
hot([3, 4]); // 不再是优化代码

去优化的影响：

丢弃已编译的优化代码
恢复到解释执行
需要重新收集类型反馈
可能触发重新优化（或标记为不可优化）

六、内存管理#

6.1 堆组织#

V8 堆内存分为多个区域：

flowchart TB subgraph 新生代 NewSpace NS[From/Semi-Space] NT[To/Semi-Space] end subgraph 老生代 OldSpace OP[Old Pointers] OD[Old Data] end subgraph 大对象 LargeObjectSpace LO[大对象] end subgraph 代码空间 CodeSpace CO[代码对象] end

区域	大小	用途
New Space	1-8MB	新对象分配
Old Space	动态	长期存活对象
Large Object Space	动态	大于 256KB 的对象
Code Space	动态	JIT 生成的代码

6.2 垃圾回收#

V8 使用分代 GC：

flowchart TB subgraph 新生代 GC A[分配] --> B[From 空间] B --> C{GC 触发} C -->|Scavenge| D[复制存活对象到 To] D --> E[交换 From/To] E --> F{存活多次?} F -->|是| G[晋升到老生代] F -->|否| A end

GC 算法：

算法	区域	特点
Scavenge	新生代	复制算法，快速
Mark-Sweep-Compact	老生代	标记清除压缩
Incremental	老生代	增量标记，减少停顿
Parallel	老生代	并行标记
Concurrent	老生代	并发标记

6.3 隐藏类（Hidden Class）#

V8 使用隐藏类优化对象访问：

1
// 创建两个"形状"相同的对象
2
const p1 = { x: 1, y: 2 };
3
const p2 = { x: 3, y: 4 };
4

5
// 它们共享同一个隐藏类
6
// 隐藏类: { x: offset 0, y: offset 1 }

flowchart LR A[空隐藏类 C0] --> B[添加 x: C1] B --> C[添加 y: C2] D[p1] --> C E[p2] --> C F[p3: 不同顺序] --> G[不同隐藏类]

1
// 不同顺序创建不同隐藏类
2
const p1 = { x: 1, y: 2 }; // 隐藏类 A
3
const p2 = { y: 1, x: 2 }; // 隐藏类 B（不同！）

七、性能优化实践#

7.1 保持类型稳定#

1
// 不好：类型不稳定
2
function process(value) {
3
  if (typeof value === "number") {
4
    return value * 2;
5
  }
6
  return value + value; // 字符串拼接
7
}
8
process(1); // number
9
process("hello"); // string - 触发去优化！
10

11
// 好：类型稳定
12
function processNumber(value) {
13
  return value * 2;
14
}
15
function processString(value) {
16
  return value + value;
17
}

7.2 保持对象形状一致#

1
// 不好：动态添加属性
2
function Point(x, y) {
3
  this.x = x;
4
  if (y !== undefined) {
5
    this.y = y; // 有时没有 y
6
  }
7
}
8

9
// 好：固定形状
10
function Point(x, y = 0) {
11
  this.x = x;
12
  this.y = y; // 始终有 y
13
}

7.3 避免隐藏类转换#

1
// 不好：改变对象形状
2
const obj = { a: 1 };
3
obj.b = 2; // 添加属性，创建新隐藏类
4
delete obj.a; // 删除属性，再创建新隐藏类
5

6
// 好：提前定义所有属性
7
const obj = { a: 1, b: null };
8
obj.b = 2; // 不改变隐藏类

7.4 优化数组访问#

1
// 不好：混合类型数组
2
const arr = [1, 2, "a", {}]; // 存储为对象数组
3

4
// 好：同质数组
5
const arr = [1, 2, 3, 4]; // 存储为 SMI 数组
6
const arr2 = [1.1, 2.2, 3.3]; // 存储为 double 数组

八、调试与分析#

8.1 查看字节码#

1
# Node.js 查看字节码
2
node --print-bytecode script.js
3

4
# 查看优化信息
5
node --trace-opt script.js
6

7
# 查看去优化信息
8
node --trace-deopt script.js

8.2 Chrome DevTools#

1
Performance 面板:
2
├── 查看函数执行时间
3
├── 识别热点函数
4
└── 分析 GC 暂停
5

6
Memory 面板:
7
├── 堆快照
8
├── 分配时间线
9
└── 内存泄漏检测

8.3 性能分析代码#

1
// 使用 performance.now() 测量
2
const start = performance.now();
3
for (let i = 0; i < 1000000; i++) {
4
  process(arr);
5
}
6
const end = performance.now();
7
console.log(`耗时: ${end - start}ms`);
8

9
// 使用 console.time
10
console.time("process");
11
for (let i = 0; i < 1000000; i++) {
12
  process(arr);
13
}
14
console.timeEnd("process");

总结#

V8 执行流程图#

flowchart TB A[JavaScript 源码] --> B[解析器 Parser] B --> C[AST] C --> D[字节码生成器] D --> E[字节码] E --> F[Ignition 解释器] F --> G[执行] G --> H[收集类型反馈] H --> I{热点函数?} I -->|是| J[TurboFan 编译] I -->|否| F J --> K[优化代码] K --> L{假设失效?} L -->|是| M[去优化] M --> F L -->|否| K