简介:详细介绍了JVM中类加载子系统的相关概念
文章已同步至GitHub开源项目: JVM底层解析
代码编译的结果从本地机器指令码转化为字节码,是存储格式发展的一小步,但却是编程语言发展的一大步
—— 《深入理解JVM虚拟机》周志明·著
Java虚拟机将描述类的数据从class字节码文件加载到内存,并且对数据进行校验,转化,解析,初始化的工作,最终形成在内存中可以直接使用的数据类型。这个过程叫做虚拟机的类加载机制。
Car.class存放于本地硬盘中,在运行的时候,JVM将Car.class文件加载到JVM中,被称为DNA元数据模板
存放在JVM的方法区中,之后根据元数据模板实例化出相应的对象。
在 .class -> JVM -> 元数据模板 -> 实例对象 这个过程中,类加载器扮演者快递员的角色。
关于类加载的时机,《Java虚拟机规范》中并没有明确规定。这点可以由虚拟机的具体实现决定。
但是类的初始化阶段,规范中明确规定当某个类没有进行初始化,只有以下6中情况才会触发其初始化过程。
new
,getStatic
,putStatic
,invokeStatic
,这四条字节码指令的时候,如果改类型没有进行初始化,则会触发其初始化。也就是如下情况
new
关键字进行创建对象的时候。java.lang.invoke.MethidHandle
实例最后的解析结果为REF_getStatic
,REF_putStatic
,REF_invokeStatic
,REF_newInvokeSpecial
四种类型的方法句柄,并且这个句柄对应的类没有被初始化。对于以上6中触发类的初始化条件,在JVM规范中有一个很强制的词,if and only if
(有且只有)。这六种行为被称为对类进行主动引用
,除此之外,其他引用类的方式均不会触发类的初始化。
类加载的过程主要分为三个阶段 加载,链接,初始化。 而链接阶段又可以细分为验证,准备,解析三个子阶段。
接下来,我们详细分析下类加载的过程。
加载过程需要完成以下三个事情:
通过一个类的全限定名
获取定义此类的二进制字节流
;
将这个字节流所代表的的静态存储结构
转化为方法区的运行时数据结构
;
在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
《Java虚拟机规范 》对这三点的要求并不是特别的具体。因此,留给虚拟机实现于Java的应用的灵活度都是很大的。
在第一步通过一个类的全限定名
获取字节流的时候,并没有规范一定是从字节码文件获取,更没有规定是从本地文件中获取。因此,虚拟机的实现者就可以在加载阶段就构建出一个相当开放的舞台。
从ZIP压缩文件中读取,最终成为日后JAR包,WAR包的基础
从网络中获取,这种情况最典型的就是Web Applet。
运行时生成,从而为后来的动态代理技术奠定了理论基础。
从其他文件中生成,典型的应用就是Web中的JSP技术。由JSP文件编译生成字节码文件。
从数据库获取,例如中间件服务器,可以选择把程序安装到数据库中完成程序代码在集群中的分发。
……
加载结束之后,外部的二进制字节流就会以JVM所设定的格式存在于方法区中了。之后会在堆中实例一个java.lang.class类型的对象,这个对象作为程序访问方法区中的类型数据的入口。
在于确保Class文件的字节流中包含信息符合当前JVM规范要求,保证被加载类的正确性,不会危害虚拟机自身安全。
文件格式验证
CAFEBABE
开头文件格式验证不止以上,上面所列举的只是从HotSpot虚拟机源码中摘抄的一部分。只有通过这个阶段的验证之后,这一段字节流才会进入虚拟机内存中进行存储,之后的过程都是基于方法区中的存储结构进行的。不会直接读取字节流了。
源数据验证
用于保证字节码中的代码符合《Java语言规范》
字节码验证
此过程保证代码是符合逻辑的,对代码的流程进行判断,保证不会出现危害虚拟机安全的情况。
如果一个类型中的方法体没有通过次阶段,那它一定是有问题的。但是,不可以认为只要通过此阶段验证,一定没有问题。通过程序去校验程序的逻辑是无法做到绝对准确的。
符号引用验证
。
此阶段验证符号引用是否合法,主要用于解析阶段的前置任务。
主要用于判断 该类中是否存在缺少后者被禁止访问它依赖的某些外部类,字段,方法等资源。
为类变量(static)分配内存并且设置初始值。
这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化;
将常量池内的符号引用转换为直接引用的过程。
事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行
符号引用就是一组符号来描述所引用的目标。符号应用的字面量形式明确定义在《java虚拟机规范》的class文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT_Class_info
/CONSTANT_Fieldref_info
、CONSTANT_Methodref_info
等。
初始化阶段就是执行类构造器方法clInit()的过程。 clInit是ClassInit缩写。此方法并不是程序员定义的构造方法。
是javac编译器自动收集类中的所有类变量(Static)的赋值动作和静态代码块中的语句合并而来。
构造器方法中指令按语句在源文件中出现的顺序执行
若该类具有父类,jvm会保证子类的clinit()执行前,父类的clinit()已经执行完毕
比如如下代码
/**
* @作者: 写Bug的小杜 【email@shaoxiongdu.cn】
* @时间: 2021/07/30
* @描述:
*/
class A{
public static int a = 10;
static {
a = 20;
}
}
class B extends A{
public static int b = a;
}
public class CInitTestMain {
public static void main(String[] args) {
System.out.println(B.b);
}
}
通过执行,发现B类中b的值为20 由于是父类的CInit方法先执行,也就是说父类的静态代码块中的内容优于子类的赋值操作先执行。
虚拟机必须保证一个类的clinit()方法在多线程下被同步加锁。
验证
/**
* @作者: 写Bug的小杜 【email@shaoxiongdu.cn】
* @时间: 2021/07/30
* @描述: 测试一个类的CInit方法是否被加锁
*/
class TestClass {
static{
// 如果不加这个判断 编译器会报死循环的错误
if(true){
System.out.println(Thread.currentThread().getName() + "线程正在执行CInit方法");
while (true){
}
}
}
}
public class DeadLoopClass{
public static void main(String[] args) {
Runnable runnable = new Runnable() {
@Override
public void run() {
System.out.println(Thread.currentThread().getName() + "启动");
TestClass testClass = new TestClass(); //触发加载TestClass类
System.out.println(Thread.currentThread().getName() + "结束");
}
};
new Thread(runnable).start();
new Thread(runnable).start();
}
}
执行结果如下: 当一条线程死循环在CInit处,别的线程也会阻塞。
无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有三个,如下所示:
JAVA_HOME/lib
目录下的可以被虚拟机识别(通过文件名称,比如rt.jar``tools.jar
)的字节码文件。java.lang.ClassLoader
类 JAVA_HOME/lib/ext
目录下的的字节码文件。sun.misc.Launcher
类 此类继承于启动类加载器ClassLoader
ClassPath
路径下的字节码 也就是用户自己写的类。sun.misc.Launcher.AppClassLoader
类 此类继承于扩展类加载器Launcher
需要继承系统类加载器ClassLoader
,并重写findClass
方法。
负责加载指定位置的字节码文件。通过类中的path变量指定。
如下为用户重写的自定义加载器
```java
package cn.shaoxiongdu;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
/**
@描述: 用户自定义类加载器
*/
public class MyClassLoader extends ClassLoader {
private String path=”/home/lib/“; //默认加载路径
private String name; //类加载器名称
private final String filetype=”.class”; //文件类型
public MyClassLoader(String name) {
// TODO Auto-generated constructor stub
super();
this.name=name;
}
public MyClassLoader(ClassLoader parent,String name){
super(parent);
this.name=name;
}
@Override
public Class<?> findClass(String name) throws ClassNotFoundException {
// TODO Auto-generated method stub
byte[] b=loadClassData(name);
return defineClass(name, b, 0, b.length);
}
private byte[] loadClassData(String name) {
byte[] data=null;
InputStream in=null;
name=name.replace('.', '/');
ByteArrayOutputStream out=new ByteArrayOutputStream();
try {
in=new FileInputStream(new File(path+name+filetype));
int len=0;
while(-1!=(len=in.read())){
out.write(len);
}
data=out.toByteArray();
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}finally{
try {
in.close();
out.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
return data;
}
public String getPath() {
return path;
}
public void setPath(String path) {
this.path = path;
}
@Override
public String toString() {
// TODO Auto-generated method stub
return this.name;
}
}
```
Java虚拟机对class文件采用的是按需加载的方式,
也就是说当需要使用该类时才会将它的class文件加载到内存生成的class对象。
而且加载某个类的class文件时,java虚拟机采用的是双亲委派模式。
即把请求交由父类处理,它是一种任务委派模式
通过查看最顶层父类ClassLoader的loaderClass方法,我们可以验证双亲委派机制。
protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// 首先检查此类是否被加载过了
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
// 调用父类的加载器方法
if (parent != null) {
c = parent.loadClass(name, false);
} else {
// 此时是最顶级的启动类加载器
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// 抛出异常说明父类无法加载
}
if (c == null) {
//父类无法加载的时候,由子类进行加载。
// to find the class.
long t1 = System.nanoTime();
c = findClass(name);
//记录加载时间已经加载耗时
sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
sun.misc.PerfCounter.getFindClasses().increment();
}
}
if (resolve) {
resolveClass(c);
}
return c;
}
}
避免类的重复加载
当自己程序中定义了一个和Java.lang包同名的类,此时,由于使用的是双亲委派机制,会由启动类加载器去加载JAVA_HOME/lib
中的类,而不是加载用户自定义的类。此时,程序可以正常编译,但是自己定义的类无法被加载运行。
保护程序安全,防止核心API被随意篡改
自定义String类,但是在加载自定义String类的时候会率先使用引导类加载器加载,
而引导类加载器在加载过程中会先加载jdk自带的文件(rt.jar包中的java\lang\String.class),
报错信息说没有main方法就是因为加载的是rt.jar包中的String类。
这样可以保证对java核心源代码的保护,这就是沙箱安全机制.
类的完整类名必须一致,包括包名
加载这个类的ClassLoader(指ClassLoader实例对象)必须相同
换句话说,在jvm中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同,那么这两个类对象也是不相等的.
JVM必须知道一个类型是有启动类加载器加载的还是由用户类加载器加载的。如果一个类型由用户类加载器加载的,那么jvm会将这个类加载器的一个引用作为类型信息的会议部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM需要保证两个类型的加载器是相同的。
文章已同步至GitHub开源项目: JVM底层解析