bitcode 和 bytecode的区别是什么

bitcode 和 bytecode的最大的区别是LLVM IR是SSA的，使用寄存器模型，而Java Bytecode是栈模型。对于编译器来说，栈模型是更好做的，也就是说更容易程序编写的。然而其实寄存器模型，性能才是更好的，所以很多编译器的中间语言都有寄存器模型。

最大的区别是LLVM IR是SSA的，使用寄存器模型，而Java Bytecode是栈模型。对于编译器来说，栈模型是更好做的，也就是说更容易程序编写的。然而其实寄存器模型，性能才是更好的，所以很多编译器的中间语言都有寄存器模型，同时为了程序编写的方便也有栈模型的中间语言，然后由栈模型的中间语言L1转换到寄存器模型的中间语言L2，具体的可以参看鲸书名列前茅章，那里面谈了中间语言的选择。

bitcode是被编译程序的一种中间形式的代码。包含bitcode配置的程序将会在App store上被编译和链接。bitcode允许苹果在后期重新优化程序的二进制文件，而不需要重新提交一个新的版本到App store上。bitcode是LLVM中的术语，其诞生完全是LLVM社区对Java中bytecode的恶搞。从设计上来说，它们是类似的概念，都是中间表示的二进制格式，只不过bytecode专门为JVM设计的，而bitcode是LLVM IR的二进制形式。

bytecode是一种包含执行程序，由一序列 op 代码/数据对组成的二进制文件。是一种中间码。字节码（Byte-code）是一种包含执行程序、由一序列 op 代码/数据对组成的二进制文件。字节码是一种中间码，它比机器码更抽象。它经常被看作是包含一个执行程序的二进制文件，更像一个对象模型。字节码被这样叫是因为通常每个 opcode 是一字节长，但是指令码的长度是变化的。每个指令有从 0 到 255（或十六进制的： 00 到FF)的一字节操作码，被参数例如寄存器或内存地址跟随。

延伸阅读：

什么是bitcode？

研究bitcode之前需要先了解一下LLVM，因为bitcode是由LLVM引入的一种中间代码(Intermediate Representation，简称IR)，它是源代码被编译为二进制机器码过程中的中间表示形态，它既不是源代码，也不是机器码。从代码组织结构上看它比较接近机器码，但是在函数和指令层面使用了很多高级语言的特性。

LLVM是一套优异的编译器框架，目前NDK/Xcode均采用LLVM作为默认的编译器。LLVM的编译过程可以简单分为3个部分:

前端(Frontend)，负责把各种类型的源代码编译为中间表示，也就是bitcode，在LLVM体系内，不同的语言有不同的编译器前端，最常见的如clang负责c/c++/oc的编译，flang负责fortran的编译，swiftc负责swift的编译等等

优化(Optimizer)，负责对bitcode进行各种类型的优化，将bitcode代码进行一些逻辑等价的转换，使得代码的执行效率更高，体积更小，比如DeadStrip/SimplifyCFG

后端(Backend)，也叫CodeGenerator，负责把优化后的bitcode编译为指定目标架构的机器码，比如X86Backend负责把bitcode编译为x86指令集的机器码。