垃圾回收之G1收集过程

article/2025/9/1 9:20:03

G1 中提供了 Young GC、Mixed GC 两种垃圾回收模式,这两种垃圾回收模式,都是 Stop The World(STW) 的。

G1 没有 fullGC 概念,需要 fullGC 时,调用 serialOldGC 进行全堆扫描(包括 eden、survivor、o、perm)。

一、G1 堆内存结构

堆内存会被切分成为很多个固定大小区域(Region),每个是连续范围的虚拟内存。

1、Region

堆内存中一个区域 (Region) 的大小,可以通过 -XX:G1HeapRegionSize 参数指定,大小区间最小 1M 、最大 32M ,总之是 2 的幂次方。

默认是将堆内存按照 2048 份均分。

每个 Region 被标记了 E、S、O 和 H,这些区域在逻辑上被映射为 Eden,Survivor 和老年代。

存活的对象从一个区域转移(即复制或移动)到另一个区域。区域被设计为并行收集垃圾,可能会暂停所有应用线程。如上图所示,区域可以分配到 Eden,survivor 和老年代。

此外,还有第四种类型,被称为巨型区域(Humongous Region)。

Humongous 区域主要是为存储超过 50% 标准 region 大小的对象设计,它用来专门存放巨型对象。如果一个 H 区装不下一个巨型对象,那么 G1 会寻找连续的 H 分区来存储。为了能找到连续的 H 区,有时候不得不启动 Full GC 。

2、小对象

G1默认启用了UseTLAB优化,创建对象(小对象)时,优先从TLAB中分配内存,如果分配失败,说明当前TLAB的剩余空间不满足分配需求,则调用allocate_new_tlab方法重新申请一块TLAB空间,之前都是从eden区分配,G1需要从eden region中分配,不过也有可能TLAB的剩余空间还比较大,JVM不想就这么浪费掉这些内存,就会从eden region中分配内存。

3、大对象

要特别注意的是,巨型对象(Humongous Object),即大小超过 3/4 的 Region 大小的对象会作特殊处理,分配到由一个或多个连续 Region 构成的区域。巨型对象会引起其他一些问题。

二、停顿预测模型

Pause Prediction Model 即停顿预测模型。

它在G1中的作用是: >G1 uses a pause prediction model to meet a user-defined pause time target and selects the number of regions to collect based on the specified pause time target.

G1 GC是一个响应时间优先的GC算法,它与CMS最大的不同是,用户可以设定整个GC过程的期望停顿时间,参数-XX:MaxGCPauseMillis指定一个G1收集过程目标停顿时间,默认值200ms,不过它不是硬性条件,只是期望值。

G1根据这个模型统计计算出来的历史数据来预测本次收集需要选择的Region数量,从而尽量满足用户设定的目标停顿时间。

停顿预测模型是以衰减标准偏差为理论基础实现的:

1

2

3

4

5

//  share/vm/gc_implementation/g1/g1CollectorPolicy.hpp

double get_new_prediction(TruncatedSeq* seq) {

    return MAX2(seq->davg() + sigma() * seq->dsd(),

                seq->davg() * confidence_factor(seq->num()));

}

在这个预测计算公式中:davg表示衰减均值,sigma()返回一个系数,表示信赖度,dsd表示衰减标准偏差,confidence_factor表示可信度相关系数。

而方法的参数TruncateSeq,顾名思义,是一个截断的序列,它只跟踪了序列中的最新的n个元素。

三、YoungGC 年轻代收集

在分配一般对象(非巨型对象)时,当所有 eden region 使用达到最大阀值、并且无法申请足够内存时,会触发一次 YoungGC 。

每次 younggc 会回收所有Eden 、以及 Survivor 区,并且将存活对象复制到 Old 区以及另一部分的 Survivor 区。

第一阶段:扫描根

跟 CMS 类似,Stop the world,扫描 GC Roots 对象;

第二阶段:处理 Dirty card,更新 RSet

处理 dirty card queue 中的 card,更新 RSet。此阶段完成后,RSet 可以准确的反映老年代对所在的内存分段中对象的引用。

第三阶段:扫描 RSet

扫描 RSet 中所有 old 区,对扫描到的 young 区或者 survivor 区的引用;

第四阶段:复制扫描出的存活的对象到 survivor2/old 区

Eden 区内存段中存活的对象会被复制到 Survivor 区中空的内存分段,Survivor 区内存段中存活的对象如果年龄未达阈值,年龄会加1,达到阀值会被会被复制到 old 区中空的内存分段。如果 Survivor 空间不够,Eden 空间的部分数据会直接晋升到老年代空间。

第五阶段:处理引用队列、软引用、弱引用、虚引用

处理 Soft,Weak,Phantom,Final,JNI Weak 等引用。

最终 Eden 空间的数据为空,GC 停止工作,而目标内存中的对象都是连续存储的,没有碎片,所以复制过程可以达到内存整理的效果,减少碎片。

四、Mixed GC 混合GC

多次 Young GC 之后,当越来越多的对象晋升到老年代 old region,Old Regions 慢慢累积,直到到达阈值(InitiatingHeapOccupancyPercent,简称 IHOP),我们不得不对 Old Regions 做收集。这个阈值在 G1 中是根据用户设定的 GC 停顿时间动态调整的,也可以人为干预。

对 Old Regions 的收集会同时涉及若干个 Young 和 Old Regions,因此被称为 Mixed GC。

Mixed GC 很多地方都和 Young GC 类似,不同之处是:它还会选择若干最有潜力的 Old Regions(收集垃圾的效率最高的 Regions),这些选出来要被 Evacuate 的 Region 称为本次的 Collection Set (CSet)。

这里需要注意:是一部分老年代,而不是全部老年代,可以选择哪些 old region 进行收集,从而可以对垃圾回收的耗时时间进行控制。

结合Region 的设计,只要把每次的 Collection Set 规模控制在一定范围,就能把每次收集的停顿时间软性地控制在 MaxGCPauseMillis 以内。起初这个控制可能不太精准,随着 JVM 的运行估算会越来越准确。

那来不及收集的那些 Region 呢?多来几次就可以了。所以你在 GC 日志中会看到 continue mixed GCs 的字样,代表分批进行的各次收集。这个过程会多次重复,直到垃圾的百分比降到 G1HeapWastePercent 以内,或者到达 G1MixedGCCountTarget 上限。

1、STAB和TAMS

在 Evacuation 之前,我们要通过并发标记来确定哪些对象是垃圾、哪些还活着。G1 中的 Concurrent Marking 是以 Region 为单位的,为了保证结果的正确性,这里用到了 Snapshot-at-the-beginning(SATB)算法。

SATB 算法顾名思义是对 Marking 开始时的一个(逻辑上的)Snapshot 进行标记。为什么要用 Snapshot 呢?下面就是一个直接标记导致问题的例子:对象 X 由于没有被标记到而被标记为垃圾,导致 B 引用失效。

如果只是对现场情况做标记,可能会漏掉某些对象。SATB 算法为了解决这一问题,在修改引用 X.f = B 之前插入了一个 Write Barrier,记录下被覆写之前的引用地址。这些地址最终也会被 Marking 线程处理,从而确保了所有在 Marking 开始时的引用一定会被标记到。

这个 Write Barrier 伪代码如下:

1

2

3

t = the previous referenced address // 记录原本的引用地址

if (t has been marked && t != NULL) // 如果地址 t 还没来的及标记,且 t 不为 NULL

satb_enqueue(t) // 放到 SATB 的待处理队列中,之后会去扫描这个引用

通过以上措施,SATB 确保 Marking 开始时存活的对象一定会被标记到。

2、Concurrent Marking

G1标记的过程和 CMS 中是类似的,可以看作一个优化版的 DFS:记当前已经标记到的 offset 为 cur,随着标记的进行 cur 不断向后推进。每当访问到地址 < cur 的对象,就对它做深度扫描,递归标记所有应用;反之,对于地址 > cur 的对象,只标记不扫描,等到 cur 推进到那边的时候再去做扫描。

上图中,假设当前 cur 指向对象 c,c有两个引用:a 和 e,其中 a 的地址小于 cur,因而做了扫描;而 e 则仅仅是标记。扫描 a 的过程中又发现了对象 b,b 同样被标记并继续扫描。但是 b 引用的 d 在 cur 之后,所以 d 仅仅是被标记,不再继续扫描。

最后一个问题是:如何处理 Concurrent Marking 中新产生的对象?因为 SATB 算法只保证能标记到开始时 snapshot 的对象,对于新出现的那些对象,我们可以简单地认为它们全都是存活的,毕竟数量不是很多。

2、回收过程

G1垃圾回收周期如下图所示:

G1的Mixed GC回收过程可以分为标记阶段、清理阶段和复制阶段。

(1)标记阶段停顿分析

  • 初始标记阶段:初始标记阶段是指从GC Roots出发标记全部直接子节点的过程,该阶段是STW的。由于GC Roots数量不多,通常该阶段耗时非常短。
  • 并发标记阶段:并发标记阶段是指从GC Roots开始对堆中对象进行可达性分析,找出存活对象。该阶段是并发的,即应用线程和GC线程可以同时活动。并发标记耗时相对长很多,但因为不是STW,所以我们不太关心该阶段耗时的长短。
  • 再标记阶段:重新标记那些在并发标记阶段发生变化的对象。该阶段是STW的。

(2)清理阶段停顿分析

  • 清理阶段清点出有存活对象的分区和没有存活对象的分区,该阶段不会清理垃圾对象,也不会执行存活对象的复制。该阶段是STW的。

(3)复制阶段停顿分析

  • 复制算法中的转移阶段需要分配新内存和复制对象的成员变量。转移阶段是STW的,其中内存分配通常耗时非常短,但对象成员变量的复制耗时有可能较长,这是因为复制耗时与存活对象数量与对象复杂度成正比。对象越复杂,复制耗时越长。

四个STW过程中,初始标记因为只标记GC Roots,耗时较短。

再标记因为对象数少,耗时也较短。清理阶段因为内存分区数量少,耗时也较短。

转移阶段要处理所有存活的对象,耗时会较长。

因此,G1停顿时间的瓶颈主要是标记-复制中的转移阶段STW。

为什么转移阶段不能和标记阶段一样并发执行呢?主要是G1未能解决转移过程中准确定位对象地址的问题。

五、Serial Old GC

如果mixed GC实在无法跟上程序分配内存的速度,导致老年代填满无法继续进行Mixed GC,就会使用serial old GC(full GC)来收集整个GC heap。所以我们可以知道,G1是不提供full GC的。

Serial Old是Serial收集器的老年代版本,是一个单线程收集器,使用标记-整理算法。

1、Serial Old收集

Serial收集器过程如下:

优点:算法简单,内存占用少,CPU不用切换进程,导致上下文切换时间短,总体效率高

缺点:GC阶段卡顿

2、G1产生FGC如何解决

  • 扩展内存
  • 提高CPU性能(回收的快,业务逻辑产生对象的速度固定,垃圾回收越快,内存空间越大)
  • 降低MixedGC触发的阈值,让MixedGC提早发生(默认是45%)

六、对比CMS 

1、G1 相比较 CMS的改进

  • 算法: G1 基于标记--整理算法, 不会产生空间碎片,在分配大对象时,不会因无法得到连续的空间,而提前触发一次 FULL GC 。
  • 停顿时间可控: G1可以通过设置预期停顿时间(Pause Time)来控制垃圾收集时间避免应用雪崩现象。
  • 并行与并发:G1 能更充分的利用 CPU 多核环境下的硬件优势,来缩短 stop the world 的停顿时间。

2、CMS 和 G1 的区别

  • CMS 中,堆被分为 PermGen,YoungGen,OldGen ;而 YoungGen 又分了两个 survivo 区域。在 G1 中,堆被平均分成几个区域 (region) ,在每个区域中,虽然也保留了新老代的概念,但是收集器是以整个区域为单位收集的。
  • G1 在回收内存后,会立即同时做合并空闲内存的工作;而 CMS ,则默认是在 STW(stop the world)的时候做。
  • G1 会在 Young GC 中使用;而 CMS 只能在 O 区使用。

参考资料:

G1 垃圾收集器 | Coding Husky

新一代垃圾回收器ZGC的探索与实践 - 美团技术团队

Java Hotspot G1 GC的一些关键技术 - 美团技术团队

G1理论基础与Full GC、内存抖动经验分享 - 掘金


http://chatgpt.dhexx.cn/article/TFQn3Z4l.shtml

相关文章

G1调优分析

目录 1、畅想GC的目标 2、jvm调优的目标 3、GC调优时机 4、垃圾收集器的选择 5、G1调优策略 6、G1垃圾收集实践 6.1、JVM自动选择垃圾收集器 6.2、G1垃圾收集 6.3、GC日志分析 7、小结 前言 c和java之间有一堵由内存动态分配和垃圾收集技术所围成的墙&#xff0c;墙外面的人想进…

JVM垃圾回收器G1详解

1、概述 在我们应用程序所应对的业务越来越庞大、复杂&#xff0c;用户越来越多&#xff0c;没有GC就不能保证应用程序正常进行&#xff0c;而经常造成STW的GC又跟不上实际的需求&#xff0c;我们需要不断地尝试对GC进行优化。G1&#xff08;Garbage-First&#xff09;垃圾回收…

G1垃圾回收器

1、最大堆大小 G1管理的最大堆大小为64G。每个Region的大小通过 -XX:G1HeapRegionSize 来设置&#xff0c;大小为 1~32MB &#xff0c;默认最多可以有2048个Region&#xff0c;G1能管理的最大堆内存是 32MB*204864G 。 使用G1垃圾回收器最小堆内存应为 1MB*20482GB &#xff…

ZGC都出来了,你还不懂G1?

概念 G1&#xff08;Garbage-First Collector&#xff09;是一种垃圾回收算法&#xff0c;最早在JDK 6 Update 14中作为实验性功能加入&#xff0c;并在JDK 7 Update 4正式JDK&#xff0c;之后在JDK 9 中成为默认垃圾回收算法&#xff0c;在JDK 10中优化了Full GC性能。 G1是一…

G1详解

一 G1收集器 g1收集器是一个面向服务端的垃圾收集器适用于多核处理器、大内存容量的服务端系统。 它满足短时间gc停顿的同时达到一个较高的吞吐量。 JDK7以上版本适用 “ 先介绍两个概念&#xff1a;吞吐量和响应能力&#xff0c;响应能力和吞吐量是评价一个系统的两个重要指标…

G1垃圾回收器详解

文章目录 前言一、思考问题二、官方文档三、基本介绍四、G1的内存模型五、G1的标记过程六、G1的垃圾回收1、G1过程梳理2、Young GC3、Mixed GC4、Full GC 七、参数介绍八、分析各阶段触发时机根据GC日志分析Young GC的触发时机根据GC日志分析并发标记的触发时机根据GC日志分析M…

G1 GC

G1GC基本概念 G1 GC可以看做是CMS GC的重大升级改造G1 GC的全称是Garbage-First&#xff0c;意为垃圾优先&#xff0c;哪一块的垃圾最多就优先清理他。G1 GC最主要的设计目标是&#xff1a;将STW停顿的时间和分布&#xff0c;变成可预期且可配置的。&#xff08;默认200ms&…

G1垃圾回收器-----基本知识及原理解析

G1介绍&#xff08;Garbage first&#xff09; G1主要面向的是服务端的垃圾回收器。在G1之前&#xff0c;JVM的主要垃圾回收器采用的是物理分代的思想&#xff0c;将内存区域严格的划分成年轻代&#xff08;young GC&#xff09;和老年代&#xff08;major GC&#xff09;&…

可控硅BT136典型应用电路

1&#xff0e;双向可控硅SCR可根据负载功率大小选择97A6&#xff08;约1A&#xff09;、TLC336A&#xff08;约3A&#xff09;、BT136-500D&#xff08;约6A&#xff09;中的一个&#xff0c;选择原则是触发电流要小于25mA。 2&#xff0e;C4取值在0.1 ~ 0.47uF之间&#xff0c…

全能电子地图实时路况_全能SUV与城市SUV的区别在哪?日产奇骏对比本田皓影

在如今的市场中&#xff0c;越来越多的车企将重点放在SUV车型中&#xff0c;尤其今年大量家用SUV涌入市场&#xff0c;特别是紧凑级SUV将这片市场瓜分的“支离破碎”。即使车型越来越多&#xff0c;市场被瓜分的越来越小&#xff0c;但是在很多消费者心中&#xff0c;几个主流品…

音质卓越颜值在线,五款高人气头戴式HIFI音质蓝牙耳机排名

随着我们生活水平的逐渐提高,我们对科技产品的要求也就越来越高,就拿耳机来说,对于很多上班族或是年轻人耳机绝对是出门或是旅行的必备品之一,没有音乐的路途那绝对是缺少了灵魂,那自然耳机的地位也就越发的重要。无线,音效,小巧,这几个因素也就成为了我们选择耳机的最…

服务器购买及宝塔部署环境说明(阿里云为例)

服务器相关知识 为什么程序员都需要自己的服务器&#xff1f; 1、你作为一个程序员&#xff0c;必须要发部自己的网站和项目&#xff01; 2、联系Linux的操作。 3、自己的远程仓库、远程数据库、远程tomcat…都可以搭建在服务器上 4、联系&#xff0c;Linux进行任意的环境…

Linux学习一概述和环境搭建(入门概述,环境搭建,走近Linux系统)

此文档学习来自b站遇见狂神说&#xff0c;自己做的学习笔记整合。 狂神说Linux 继续Java全栈开发的Linux&#xff0c;而不是运维级别&#xff01; 我们为什么要在这个时间学习Linux&#xff1f;Java全栈开发的我们要掌握哪些知识&#xff1f;需要准备什么工作&#xff1f; J…

CK6855M1蓝牙离线语音识别灯控模组使用说明书

CK6855M1蓝牙离线语音识别灯控模组使用说明书 一、功能说明 CK6855M1模块是一款专为灯具照明产品设计的离线蓝牙语音识别模组。模组支持红外遥控接收&#xff0c;支持RGBWY灯控制&#xff0c;支持无极调光&#xff0c;支持AD按键调灯以及音频上下曲的控制&#xff0c;支持5.1…

为什么P2P模式下载的人越多速度越快,为什么P2P伤害机械硬盘

台风来临前的夜晚&#xff0c;有点激动不想睡觉&#xff0c;看了几个电影&#xff0c;日本恐怖片&#xff0c;台风雨夜&#xff0c;非常不错&#xff0c;P2P很流畅&#xff0c;观察IP地址大量也是附近的&#xff0c;江浙沪&#xff0c;难道也都在迎台风看电影&#xff1f; 大家…

伊人在线高清视频 index.php,《天元》“畅音阁”首发飞行技能视频

直面一款网游给人感觉的优异度最大成分中的重中之重就是第一感——“视听”印象。一直以来&#xff0c;游戏音乐以及画面成分的优异华丽与否直接关系到了玩家对于此款游戏的好感度&#xff0c;无可厚非。而《天元》特别针对于此&#xff0c;倾情打造出一篇关于对于其所有“视听…

迅雷跃居全球BT市场第一

据torrentfreak报道&#xff0c;根据早些时候海盗湾公布的一些数据表明&#xff0c;全球BT软件的使用者&#xff0c;大约有三分之一来自中国&#xff0c;而来自美国的仅有8%&#xff0c;迅雷成为全球BitTorrent市场份额最大的客户端。 迅雷本身并不是一个专门使用P2P的BT客户端…

11个资源强大的网站!知乎超20万人强烈推荐,再也不怕资源难找

在我们日常工作学习中难免就需要在网站搜索资料&#xff0c;这时候一定需要一个能够帮你搜索一切你想要的资源&#xff0c;从而为你剩下一大半时间&#xff0c;那么今天为大家整理了11个超级好用的黑科技资源搜索网站&#xff0c;帮你解决因为上网找不到合适的资源而发愁&#…

Linux6.8搭建sftp服务

最近因公司工作需要用到sftp服务器&#xff0c;参考网上各种方法&#xff0c;但被网上各种方法尤其是权限设置问题搞得晕头转向&#xff0c;现在将自己搭建过程总结了一下&#xff0c;提供给大家希望有所帮助。 sftp是Secure FileTransfer Protocol的缩写&#xff0c;安全文件传…

107-161JS

107-161 target事件委托正则表达式捕获exec特性 this指向改变this指向ES6定义变量ES6箭头函数ES6解构赋值ES6展开运算符ES6模块化初识面向对象创建对象构造函数注意问题面向对象的原型ES6-Class面向对象继承ES6继承Aajaxajax同步异步请求方式1ajax的封装回调地狱promise基础语法…