大佬带你深入解析java虚拟机:垃圾优先的垃圾回收器(G1 GC)

createh53周前 (02-25)技术教程25

G1 GC

G1 GC是面向服务端应用程序的垃圾回收器,通过新的堆设计和停顿预测模型,可以到达用户指定的一个比较合理的软实时目标。本章将详细分析G1 GC的设计和实现。

G1 GC简介

基于Region的堆

G1 GC全称是Garbage-First Garbage Collector,即垃圾优先的垃圾回收器,可以使用-XX:+UseG1GC开启。G1 GC(以下简称G1)抛弃了既有堆模型,它将整个堆划分为一些大小固定的内存块(Region),通过-XX:G1HeapRegionSize=控制Region大小(注意每个Region的大小只能是1MB、2MB、4MB、8MB、16MB和32MB),如图11-1所示。

G1没有抛弃弱分代假说,在图11-1中,每个Region仍然包含代纪类型,一个特别的类型是巨型Region(Humongous Region),如果用户分配的对象超过了单个Region的大小,那么将使用连续多个Region存放对象,并将这些Region都标记为巨型Region。除了图11-1中包含的五种Region类型外,G1还有一个Archive类型的Region,它包含的是不可变的数据,该类型用于支持AppCDS。有了基于Region的堆划分就会相应需要基于Region的垃圾回收策略,G1包含YGC、FGC和Mixed GC,不同的垃圾回收策略将清理不同类型的Region。

记忆集RSet

G1包含YGC、FGC和Mixed GC三种垃圾回收策略,其中,YGC和FGC与其他垃圾回收器类似:YGC只回收新生代Region,而FGC回收整个堆。独有的Mixed GC是一种Partial GC策略,它会回收所有新生代Region和部分老年代Region。

既然Mixed GC属于Partial GC,那么它也会面临跨代引用问题,因为它回收整个新生代和部分老年代Region,所以一个老年代Region的根集包括GC Root和从老年代Region指向老年代Region的引用(old->old),新生代Region根集包括GC Root和老年代Region指向新生代Region的引用(old->young)。

G1使用RSet记忆集记录这些跨代引用。在记忆集设计中一般包含两种方式:一种是points-into记忆集,它表示“哪些对象引用了我”;另一种是points-out记忆集,它记录的是“我引用了哪些对象”。G1同时使用两种方式,如图11-2所示。

假设有a.field = b,如果使用points-into记忆集,那么b拥有记忆集,它记录a的位置。如果使用points-out记忆集,那么a拥有记忆集,它记录b的位置。G1的记忆集RSet同时使用两种设计,首先使用points-into结构来记忆有哪些其他Region引用自身(即对象b所在Region记录引用自身的对象a所在Region),然后每个Region包含一个points-out的卡表结构,记录指向当前对象的对象的具体位置(即对象b所在Region的卡表的索引)。

在G1堆中,每个Region会关联一个RSet,后置写屏障(g1_write_barrier_post)捕获Mutator线程向对象写入的每个值。如果发现写入操作导致两个对象产生old->old或者old->young关系,那么可以更新RSet,并将对象写入线程局部的DirtyCardQueue(DCQ),当线程局部的DCQ已满后,再将DCQ放入全局的DirtyCardQueueSet(DCQS)。

出于性能考虑,写屏障内的代码应该尽可能简单和高效,g1_write_barrier_post只负责发现那些产生old->old或者old->young关系的修改,并将对象加入DCQ。后续处理DCQ中的对象及更新RSet的操作则由专门的Refine线程负责。Refine线程取出DCQS中的DCQ的对象,找到被该对象引用的对象,然后更新被引用对象所在的Region的RSet,如代码清单11-1所示:

代码清单11-1 更新RSet

void G1ConcurrentRefineOopClosure::do_oop_work(T* p) {
T o = RawAccess::oop_load(p);
if (CompressedOops::is_null(o)){ return; }
oop obj = CompressedOops::decode_not_null(o);
if (HeapRegion::is_in_same_region(p, obj)) {
return; // 如果对象和被引用对象在同一个Region中,则不需要处理
}
// 如果在不同Region中,则需找到被引用者所在Region的RSet
HeapRegionRemSet* to_rem_set = _g1h->heap_region_containing(obj)->rem_set();
// 在被引用者的RSet中添加关系
if (to_rem_set->is_tracked()) {
to_rem_set->add_reference(p, _worker_i);
}
}

停顿预测模型

前面提到Mixed GC回收整个新生代和部分老年代Region,对于部分老年代Region的选择也有些讲究。G1会根据历史数据进行数学运算,计算出本次回收需要选择的老年代Region数量,以此来达到用户设置的-XX:MaxGCPauseMillis时间,即满足用户期望的GC不能超过最长停顿时间。注意,如果这个时间设置得不合理,G1也达不到期望。

本文给大家讲解的内容是深入解析java虚拟机:垃圾优先的垃圾回收器

  1. 下篇文章给大家讲解的是深入解析java虚拟机:新生代垃圾回收
  2. 觉得文章不错的朋友可以转发此文关注小编;
  3. 感谢大家的支持!

相关文章

JAVA系列-GC_java &gt

1. OOM1) 常见OOM异常类型(1) StackOverFlowError栈内存溢出,用于深度方法调用(循环递归);(2) OutOfMemoryError:Java heap space用于变...

漫谈:Java GC的那些事(一)_java gc1

前言与C语言不同,Java内存(堆内存)的分配与回收由JVM垃圾收集器自动完成,这个特性深受大家欢迎,能够帮助程序员更好的编写代码,本文以HotSpot虚拟机为例,说一说Java GC的那些事。Jav...

JVM成神路之性能调优篇:GC调优、Arthas工具详解及线上最佳配置

引言“在当前的互联网开发模式下,系统访问量日涨、并发暴增、线上瓶颈等各种性能问题纷涌而至,性能优化成为了现时代开发过程中炙手可热的名词,无论是在开发、面试过程中,性能优化都是一个常谈常新的话题”。Ja...

Java中9种常见的CMS GC问题分析与解决(一)

目前,互联网上 Java 的 GC 资料要么是主要讲解理论,要么就是针对单一场景的 GC 问题进行了剖析,对整个体系总结的资料少之又少。前车之鉴,后事之师,美团的几位工程师历时一年多的时间,搜集了内部...

关于Java垃圾回收,你必须要知道FullGC是什么

本文共3198字,是本人前几天面试被提问到的一个问题,将在该文中阐述关于Java垃圾回收——Full GC的相关知识,包括定义、触发条件、具体过程。前几天面试的时候,面试官在最后问了我一个有关Full...