从上帝视角看Java如何运行

2022-10-08,,,

jvm内存结构

可以看出jvm从宏观上可以分为 ‘内部’  及 ‘外部’  两个部分(便于记忆理解):

‘内部’包含:线程共享(公有)数据区 和 线程隔离(私有)数据区

‘外部’包含:类加载子系统、垃圾回收器、执行引擎、本地库接口、本地方法库

 

以上部件构成了整个jvm,接下来我们一个一个零件拆开了看。

 

class文件

  一个java文件会通过编译工具(javac)编译成class字节码文件,通过jvm进行加载运行。因为jvm屏蔽了底层操作系统的差异(平台无关性),所以一次编译到处运行。

 

类加载子系统

  类加载子系统:负责查找和装载class文件,将其中的二进制数据加载到jvm中。

字节码 --> 加载 -->  验证 --> 准备 --> 解析  --> 初始化

加载:通过类的完全限定名找到类文件所在位置,根据其中的字节码创建java.lang.class对象,所以才会说万物皆对象,我们也可以继承classloader,重写findclass方法来自定义实现类加载器。默认情况下我们都使用appclassloader

验证:确保加载的字节码的是否符合虚拟机的要求,是java提供的一种自我保护机制,不让其危害虚拟机安全。其主要包括四种验证,字节码验证、文件格式验证,元数据验证、符号引用验证。

准备:为类变量分配地址和初始化值,类变量会分配到方法区(元空间)中,这里的初始化是指该数据类型的默认初始值,例如int对应的是0,long对应的0l,只有在初始化时才会动显示赋值

解析:把类中的二进制数据中的符号引用转换为直接引用;例如我们通过user.getinfo();这里的.getinfo()就是符号引用,在解析阶段会将它指向真正的内存位置,这就是直接引用

初始化:主要为类的静态变量赋予正确的值,比如int num = 10; 这里num的值会从准备阶段的0变为10;并且若该类有父类,会对其进行初始化操作;如果类中有初始化语句,系统会按照顺序进行初始化

 

双亲委派模式

双亲委派:自底向上检查是否加载成功,自顶向下尝试加载。

当一个类加载器收到类加载请求,它不会自己进行加载,而是将该请求丢给父类加载,如果父类还存在父类,则会依次向上请求,直到到达顶级加载器,如果父类加载器能加载完成就返回加载成功,否则子类加载器才会自己尝试加载。

system.out.println(test.class.getclassloader());
system.out.println(test.class.getclassloader().getparent());
system.out.println(test.class.getclassloader().getparent().getparent());
system.out.println(string.class.getclassloader());

通过代码验证,可以很轻松的了解 appclassloader -> extclassloader -> bootstrapclassloader 这三层的关系。

 

类加载的三种方式

1. new关键字加载

  user user = new user();

    静态加载,在运行时候通过new关键字创建类实例

2. class.forname()加载

  class clazz = class.forname(“user”);  
  object user=clazz.newinstance();

    动态加载,通过class.forname()来加载类,然后调用类的newinstance()方法实例化对象

3. classloader 实例的 loadclass() 方法

  class clazz = classloader.loadclass(“user”); 
  object user=clazz.newinstance();

    动态加载,可通过继承classloader实现自定义类加载器

 

线程私有和线程公有

 

jvm内存区从宏观上可以分为 线程私有 和 线程公有 两块。

线程私有部分

  这部分没有线程安全问题,随着线程执行结束而结束;包含程序计数器、虚拟机栈、本地方法栈三个部件。

程序计数器:

   程序计数器也叫pc寄存器,作用是cpu进行切换的时候,指向当前时刻需要获取指令的位置。

   特点:

  1. 线程私有
  2. 一块较小的区域
  3. 记录程序执行的位置
  4. 不存在内存溢出outofmemoryerror

虚拟机栈:

  数据结构实现,入口和出口只有一个,称之为入栈和出栈,先进后出(filo)

  栈的作用主要是执行方法,先执行的方法在最下面,然后依次放入,方法执行完毕之后从上往下依次退出;所以方法执行就是压栈,方法结束就是出栈(销毁栈帧)。

public void start(){    
    say();    
    run();
}

 

虚拟机栈如何执行

栈帧

  栈帧存在java虚拟机栈中,是虚拟机栈中的单位元素。方法执行会创建栈帧,一个方法就是一个栈帧,一个栈帧分为四个部分:

1. 局部变量表

         存放方法参数或者内部定义的一组变量列表;例如方法中声明的对象:

  user user = new user();  //局部变量user

2. 操作数栈

           执行字节码指令的时候使用,通俗的讲就是方法的执行在操作数栈中进行,通过压栈和出栈进行访问

3. 动态链接

           java运行期间是动态链接的,需要将指向方法的符号引用转换为直接引用(内存地址);在类加载解析阶段,将符号引用转换为直接引用称之为静态解析。而此处正好就是动态链接

           user.getinfo();  //找到这个getinfo()方法的内存位置

4. 返回地址

         方法不管正常执行结束还是异常退出,需要返回方法被调用的位置

 

以上四个部分对应方法执行的过程。虚拟里面包含很多个栈帧,每个方法对应一个栈帧。

将一个class文件,通过bin/javap.exe文件进行反汇编可以查看出以上四个部分。

栈溢出:当栈的深度大于虚拟机允许会报stackoverflowerror,-xss可设置大小

/** 递归演示如何栈溢出 */
public static int num = 0;
public static void a(){    
    num++;    
    a();
}
public static void main(string[] args) {    
    try{        
        a();    
    }catch (exception ex){        
        system.out.println("调用次数:"+num);   
    }
} 

内存溢出:当栈需要扩展而无法申请空间会报outofmemoryerror

 

本地方法栈

    本地方法栈和虚拟机栈类似,区别在于虚拟机栈主要为jvm执行字节码服务,而本地方法栈为native方法服务,即本地方法服务;所以本地方法栈也是一块内存私有区域,与虚拟机栈相同也有同样的异常问题。

  特点:

  1. 与虚拟机栈基本类似
  2. 区域在于本地方法栈为native方法服务(windows下调用dll文件)
  3. sun hotspot将虚拟机栈和本地方法栈合并
  4. stackoverflowerroroutofmemoryerror

 

线程公有部分

  这部分存在线程安全问题,平常我们所指的内存优化,溢出等问题都是需要关注这个区域。包含堆、方法区(也叫元空间)两个部件。

方法区(元空间)

  类加载器加载类的时候,会将一些类的元数据信息(字节码)保存在这个区域,例如:类变量,静态方法,普通方法等,方法区是线程共享的,多个线程能用到同一个类

  jdk1.7合并方法区到了堆里面

  jdk1.8保留了方法区的概念,只不过实现方式不同,jdk1.8称为元空间,与堆不相连,但是与堆共享物理内存,逻辑上可以认为是在堆中

 特点:

  1. 线程共享
  2. 存储类信息、常量、静态变量、方法描述等信息
  3. hotspot虚拟机中称之为永久代
  4. gc很少回收这个区域
  5. 存在outofmemoryerror,可以通过-xx:maxpermsize设置大小

 

  堆中用于存放所有实例化对象和数组,堆中信息线程共享,所有jvm部件中分配内存中最大的区域,在虚拟机启动时就创建,垃圾回收器主要管理该区域,堆分为新生代(占堆内存1/3)和老年代(占堆内存2/3),新生代更细致可以分为eden、from survivor、to survivor空间,比例8:1:1 ;可以通过-xmx、-xms设置大小

在堆中产生了一个实例对象或数组,可以在栈中声明一个变量,用于指向堆中的对象,该变量的取值等于堆中对象的内存地址,所以我们在打印变量名的时候是一串内存地址

 test test = new test();
 system.out.println(test);  //输出test@1b6d3586

  万物皆对象,当我们在实际开发中,创建了许多对象,为了防止内存泄露,java确保有效的使用内存,会由java虚拟机自动垃圾回收器来管理;且把堆分为新生代和老年代进行管理

新生代与老年代

  新生代是java对象出生的地方,是新对象分配内存的地方,大部分对象存活时间都不需要太久,这个区域会频繁触发minorgc进行垃圾回收;
  而老年代存放的都是存活时间较久或者内存较大的对象,所以full gc不会频繁执行。

minor gc

  发生在新生代中的垃圾回收机制,采用复制算法(扫描存活对象,复制到一块新内存空间中),from survivor 和 to survivor是相对的,也就是说minor gc发生时,eden区和其中一个survivor区会把一些仍然存活的对象放置另外一个survivor 区,然后清理eden区和之前的survivor 区,下次同理,当达到一定 ‘年龄’ 后,新生代会把对象放入老年代(每发生一次minor gc增加1岁,默认15岁)

full gc

  发生在老年代中的垃圾回收机制,采用标记-清除(标记存活的对象,清除未标记的对象,即需要回收的对象),因为老年代中的对象较稳定,所以发生full gc的频率相对minor gc较少,但是一次回收的时间会比minor gc更长

 

《从上帝视角看Java如何运行.doc》

下载本文的Word格式文档,以方便收藏与打印。