bitcode 和 bytecode的最大的区别是LLVM IR是SSA的,使用寄存器模型,而Java Bytecode是栈模型。对于编译器来说,栈模型是更好做的,也就是说更容易程序编写的。然而其实寄存器模型,性能才是更好的,所以很多编译器的中间语言都有寄存器模型。
最大的区别是LLVM IR是SSA的,使用寄存器模型,而Java Bytecode是栈模型。对于编译器来说,栈模型是更好做的,也就是说更容易程序编写的。然而其实寄存器模型,性能才是更好的,所以很多编译器的中间语言都有寄存器模型,同时为了程序编写的方便也有栈模型的中间语言,然后由栈模型的中间语言L1转换到寄存器模型的中间语言L2,具体的可以参看鲸书名列前茅章,那里面谈了中间语言的选择。
bitcode是被编译程序的一种中间形式的代码。包含bitcode配置的程序将会在App store上被编译和链接。bitcode允许苹果在后期重新优化程序的二进制文件,而不需要重新提交一个新的版本到App store上。bitcode是LLVM中的术语,其诞生完全是LLVM社区对Java中bytecode的恶搞。从设计上来说,它们是类似的概念,都是中间表示的二进制格式,只不过bytecode专门为JVM设计的,而bitcode是LLVM IR的二进制形式。
bytecode是一种包含执行程序,由一序列 op 代码/数据对组成的二进制文件。是一种中间码。字节码(Byte-code)是一种包含执行程序、由一序列 op 代码/数据对组成的二进制文件。字节码是一种中间码,它比机器码更抽象。它经常被看作是包含一个执行程序的二进制文件,更像一个对象模型。字节码被这样叫是因为通常每个 opcode 是一字节长,但是指令码的长度是变化的。每个指令有从 0 到 255(或十六进制的: 00 到FF)的一字节操作码,被参数例如寄存器或内存地址跟随。
延伸阅读:
什么是bitcode?
研究bitcode之前需要先了解一下LLVM,因为bitcode是由LLVM引入的一种中间代码(Intermediate Representation,简称IR),它是源代码被编译为二进制机器码过程中的中间表示形态,它既不是源代码,也不是机器码。从代码组织结构上看它比较接近机器码,但是在函数和指令层面使用了很多高级语言的特性。
LLVM是一套优异的编译器框架,目前NDK/Xcode均采用LLVM作为默认的编译器。LLVM的编译过程可以简单分为3个部分:
前端(Frontend),负责把各种类型的源代码编译为中间表示,也就是bitcode,在LLVM体系内,不同的语言有不同的编译器前端,最常见的如clang负责c/c++/oc的编译,flang负责fortran的编译,swiftc负责swift的编译等等
优化(Optimizer),负责对bitcode进行各种类型的优化,将bitcode代码进行一些逻辑等价的转换,使得代码的执行效率更高,体积更小,比如DeadStrip/SimplifyCFG
后端(Backend),也叫CodeGenerator,负责把优化后的bitcode编译为指定目标架构的机器码,比如X86Backend负责把bitcode编译为x86指令集的机器码。
文章标题:bitcode 和 bytecode的区别是什么,发布者:小编,转载请注明出处:https://worktile.com/kb/p/37934