深入理解Java类加载机制-连接_java 类加载的过程
在接触了类加载的基本知识以后,我们已经清楚了类加载大体分为3个阶段:
- 加载
- 连接
- 初始化
今天我们主要讲解类加载的第二个阶段-连接阶段。连接阶段又可以分为三个部分:
- 验证
- 准备
- 解析
验证
由于我们的字节码来源多样化,并不一定来源于Class文件,所以我们需要通过一些措施来保证字节码的二进制流是正确的安全的,因此我们需要通过验证来避免虚拟机受到攻击。通过验证阶段的字节码也并不是百分之百安全的。
验证阶段大体会有4个阶段的验证:
- 文件格式验证
- 元数据格式验证
- 字节码验证
- 符号引用验证
文件格式验证
由于我们的字节码文件来源多样化,因此我们需要对其进行验证,验证的方向主要由以下几个方面:
- 文件是否以魔数开头OxCAFEBABE
- 主、次版本号是否在虚拟机可以处理的范围之内
- 常量池中是否有不被支持的常量类型
- 指向常量池中的各种索引值是否有指向不存在的常量或者不符合类型的常量
- CONSTANT_Utf8_info的常量中是否有不适合UTF8编码的数据
- Class文件中各个部分及文件本身是否有被删除或附加的其他信息
文件格式验证是唯一根据字节码二进制流进行验证的阶段,当文件格式阶段验证通过以后,字节码二进制流会进入内存的方法区(元数据区)进行存储。所以后面的3个验证阶段都是基于方法区(元数据区)的结构进行验证的。
元数据格式验证
元数据格式验证主要是对字节码描述的信息进行语义分析,保证其描述的信息符合Java语言的规范,主要包含以下几个方面的验证:
- 是否有父类(除了java.lang.Object,所有的类都有父类)
- 是否继承了不允许被继承的类(final修饰的)
- 如果这个类不是抽象类,是否实现了其父类或接口要求必须实现的所有方法
- 类中的字段、方法是否与父类产生矛盾(例如覆盖父类的final字段或者出现不合规则的重写及重载)
字节码验证
字节码验证主要是对类的方法体进行校验分析,保证方法在运行时不会做出危害虚拟机的事情:
- 保证任意时刻操作数栈的数据类型与指令代码都能配合工作,不能出现采用long类型的加载指令将int类型的操作数栈元素存储到局部变量表等类似的情况
- 保证跳转指令不会跳到方法体以外的字节码指令上
- 保证方法体中的类型转换是有效的
字节码验证的流程相对复杂,在JDK1.6之前都是采用基于数据流进行推导验证,为了减少该阶段的性能消耗,JDK1.6以后在Code属性的属性表上增加了StackMapTable属性,该属性描述了方法体中所有基本块(按照控制流拆分的代码块)开始时本地变量表和操作数栈应有的状态,字节码验证期间就不需要根据程序进行推导,而是直接检查StackMapTable属性中的记录是否合法。
理论上StackMapTable属性存在错误和被篡改的可能,如果同时修改Code属性和StackMapTable属性可以绕过虚拟机的类型校验,因此没有通过验证的字节码肯定是有问题的,但是通过验证的字节码也不是百分之百安全的。
JDK1.7,主版本号大于50的Class文件,使用StackMapTable进行分析校验是唯一的选择,不允许根据数据流进行推导。
符号引用验证
符号引用验证阶段通常发生在虚拟机将符号引用转换为直接引用的过程,这个过程将在连接的第三阶段解析阶段发生。
符号引用验证是对类自身以外的常量池中的各种符号引用进行匹配校验:
- 符号引用中通过字符串描述的全限定名能否找到对应的类
- 符号引用中的类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段
- 符号引用中的类、字段、方法的访问性是否可以被当前类访问
符号验证如果无法通过,将会抛出java.lang.IncompatibleClassChangeError异常的子类,如java.lang.IllegalAccessError、java.lang.NoSuchFieldError、java.lang.NoSuchMethodError等。
准备
准备阶段是为类变量(static)设置内存并分配初始值的阶段,这里强调以下两点:
- 只是类变量,不包含实例变量,实例变量会在对象实例化的时候分配到堆上,但类变量(变量内存)都会在方法区(元数据)中分配内存。
- 只是分配初始值,初始值见下图,有一种情况例外,就是如果字段属性表有ConstantValue(stati final修饰的变量)属性,准备阶段就会为变量赋值而不是初始值
WX20210217-163654@2x.png
这里我们来简单说一下变量分配,Java中的变量按其引用类型可以划分为原始类型,和引用类型。变量内存的占用其实有两部分,一部分是变量的内存占用,还有一部分是变量所指向的数据占用的内存,分别称为变量内存和数据内存。
原始类型的变量内存和数据内存往往是分配在同一区域,但引用类型的变量内存和数据内存是不一定位于相同的区域的。
解析
解析阶段是虚拟机将常量池中的符号引用替换为直接引用的过程,符号引用在Class文件中以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。
符号引用:以一组符号表示引用的目标,可以是任何形式的字面量,只要可以定位到目标即可。
直接引用:直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。
如果有了直接引用,那么引用的目标必定已经在内存中存在。
虚拟机要求在执行以下16个命令之前必须对所使用的符号引用进行解析:
- anewarray
- checkcast
- getfield
- getstatic
- instanceof
- invokedynamic
- invokeinterface
- invokespecial
- invokestatic
- invokevirtual
- ldc
- ldc_w
- multianewarray
- new
- putfiled
- putstatic
除了使用invokedynamic指令,虚拟机可以对符号引用的结果可以进行缓存(在运行时常量池记录直接引用),避免解析动作重复进行。无论是否执行了多次解析,虚拟机需要保证在同一个实体中,如果一个符号引用曾经被成功解析,那么后续的解析也必须成功,如果失败,后续的其他指令对该符号引用的解析请求也必须相应的失败。
解析动作主要针对类、接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符,分别对应常量池的:
- CONSTANT_Class_info
- CONSTANT_Fieldref_info
- CONSTANT_Methodref_info
- CONSTANT_InterfaceMethodref_info
- CONSTANT_MethodType_info
- CONSTANT_MethodHandle_info
- CONSTANT_InvokeDynamic_info
类和接口的解析
我们假设我们所处的类为A,要把一个从未解析的符号引用M解析为一个类或者接口B的直接引用,步骤如下:
- 如果B不是一个数组类型,那么虚拟机会把代表M的全限定名传递给A的类加载器去进行类加载B。如果在类加载B的过程发生异常,则解析过程失败
- 如果B是一个数组类型,将会按照第1点去加载数组元素类型中的类,接着由虚拟机生成一个代表此数组纬度和元素的数组对象
- 如果前两个步骤通过了,那么B在虚拟机中已经成为一个有效的类或者接口了,最后进行符号引用验证(验证阶段的第4个步骤),确认A是否有对C的访问权限。如果没有权限访问,抛出java.lang.IllegalAccessError异常
字段的解析
解析一个未被解析过的字段的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则字段的符号引用解析失败。解析成功以后,这里假设类B被成功解析,接着会对B的字段进行解析:
- 如果B本身就包含了简单名称和字段描述都匹配的字段,则返回这个字段的直接引用,结束
- 否则,如果C实现了接口,将会按照继承关系从下往上递归搜索各个接口或者它的父接口,如果找到了匹配的字段,返回直接引用,查找结束
- 否则,如果C不是java.lang.Object,将按照继承关系从下往上递归搜索父类,如果找到了匹配的字段,返回直接直接引用
- 否则查找失败,抛出java.lang.NoSuchFieldError异常
- 在返回直接引用以前,会对这个字段做权限校验,如果发现A不具备这个字段的访问权限,那么抛出java.lang.IllegalAccessError异常
类方法解析
解析一个未被解析过的方法的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则方法的符号引用解析失败。解析成功以后,这里假设类B被成功解析,接着会对B的方法进行解析:
- 如果发现B是一个接口,解析失败,抛出java.lang.IncompatibleClassChangeError
- 确认B是一个类以后,在类B中查找是否有简单名称和方法描述符都相匹配的方法,如果有,返回这个方法的直接引用,查找结束
- 否则,在B的父类中递归查找是否有匹配的方法,如果有则返回这个方法的直接引用,查找结束
- 否则,在B实现的接口列表和它们的父接口中递归查找是否有匹配的方法,如果有匹配的方法,说明B是一个抽象类,抛出java.lang.AbstractMethodError异常
- 否则,查找失败,抛出java.lang.NoSuchMethodError
- 在返回直接引用以前,需要对这个方法权限校验,如果发现A不具备对这个方法的访问权限,那么抛出java.lang.IllegalAccessError异常
接口方法解析
解析一个未被解析过的接口方法的符号引用时,首先要对其CONSTANT_Class_info进行解析。如果解析失败,则接口方法的符号引用解析失败。解析成功以后,这里假接口B被成功解析,接着会对B的方法进行解析:
- 如果B是个类不是接口,解析失败,抛出java.lang.IncompatibleClassChangeError
- 否则,在接口B中递归查找是否有匹配的方法,如果有则返回这个方法的直接引用,查找结束
- 否则,在接口B的父接口中递归查找,直到java.lang.Object为止,如果找到匹配的方法,则返回这个方法的直接引用,查找结束
- 否则,方法查找失败,抛出java.lang.NoSuchMethodError异常
接口方法不会对权限进行校验,因为接口方法默认是public。
本期类加载的连接阶段就介绍到这,下期我们会讲解类加载的初始化阶段,我们下期再见!!!
我是shysh95,希望可以和你专注技术的路上并肩作战,搜索关注微信公众号:Different Java,更多精彩文章!!!