垃圾收集器及算法

article/2025/11/5 4:03:34

一、垃圾收集算法

        

         1.分代收集理论

          当前虚拟机的垃圾收集都采用分代收集算法,只是根据对象存货周期的不同将内存分为几块。一般java堆分为新生代和老年代,可以根据各个年代的特点选择合适的垃圾收集算法。比如在新生代中,每次收集都会有大量的对象(99%)死去,所以可以选择复制算法,只需要付出少量对象的复制成本就可以完成每次垃圾收集。而老年代的对象存活几率是比较高的,而且没有额外的空间对它进行分配担保,所以我们必须选择标记清除或标记整理算法进行垃圾收集。但此两种算法会比复制算法慢10倍以上。

        2.标记-复制算法

        复制算法为了解决效率问题而出现,它将内存分为大小相同的两块,每次使用其中的一块。当这一块的内存使用完后,就将还存活的对象复制到另一块去(此时每次移动一次年龄+1,目前在年轻代的默认年龄是15,达到后会移向老年代,调优的时候也可适当降低对象的年龄),然后再将之前使用的空间一次清理掉。这样就使每次的内存回收都是对内存区间的一半进行回收。

         3.标记-清除算法

         算法分为“标记”和“清除”阶段:标记存活的对象,统一回收所有未被标记的对象(一般选择这种),也可以反过来,标记所有要回收的对象。但是会带来两个问题:

        ①效率问题(如果需要标记的对象太多,效率不高)

        ②空间问题(标记清除后会有大量不连续的碎片,影响后续对象的存入,空间利用率降低)

        

         3.标记-整理算法

         根据老年代的特点而出现的一种标记算法,标记过程仍然与“标记清除”算法一样,但后续步骤不是直接对可回收对象回收,而是让活的对象向一端移动,然后直接清理掉端边界以外的内存,有效的解决了标记清理算法的空间利用率问题

        

二、垃圾收集器

        垃圾收集器是内存回收的具体实现。我们能做的就是根据具体应用场景选择适合自己的垃圾收集器。

        1.Serial收集器(-XX: +UseSerialGC  -XX:+UseSerialOldGC)

        Serial (串行)收集器是最基本、历史最悠久的垃圾收集器,这个收集器是一个单线程收集器。它的“单线程”不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程(“Stop The World”),直到收集结束。

        新生代采用复制算法,老年代采用标记-整理算法 

        

         优势:简单高效(与其他收集器的单线程相比),由于没有线程交互的开销,自然可以获取到很高的单线程收集效率。

        Serial Old收集器是Serial收集器的老年代版本,同样是一个单线程收集器;主要有两大用途,一种事JDK1.5以及之前的版本中与Parallel Scavenge收集器搭配使用,另一种用途是作为CMS收集器的后备方案。

        2. Parallel Scavenge收集器 (-XX:+UseParallelGC  -XX:+UseParallelOldGC)

        Parallel收集器就是Serial收集器的多线程版本,除了使用多线程进行垃圾收集外,其余行为(控制参数、收集算法、回收策略等等)和Serial收集器类似。默认的收集线程数跟cpu核数相同,当然也可以用参数(-XX : ParallelGCThreads)指定收集线程数。

Parallel Scavenge收集器关注点是吞吐量(高效率的利用CPU)。CMS等垃圾收集器关注点更多的是用户线程的停顿时间(提高用户体验)。所谓吞吐量就是CPU中利用用户代码的时间与CPU总消耗时间的比值。

        新生代采用复制算法,老年代采用标记-整理算法

        Parallel Old收集器是Parallel Scavenge收集器的老年代版本。使用多线程和标记整理算法。在注重吞吐量以及CPU的场合,都可以优先考虑(Parallel和Parallel Old是 JDK8默认的新生代和老年代收集器

        3.ParNew 收集器(-XX: +UseParNewGC)

        ParNew收集器跟Parallel收集器很类似,区别主要在于他可以和CMS收集器配合使用

        新生代采用复制算法,老年代采用标记-整理算法

        它是许多运行在Server模式下的虚拟机的首要选择,除了Serial收集器外,只有它能与CMS收集器(真正意义上的并发收集器)配合工作。

        4.CMS收集器(-XX :+UseConcMarkSweepGC(old))

        CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。它非常符合在注重用户体验的应用上使用,它是HotSpot虚拟机第一款真正意义上的并发收集器,第一次实现了让垃圾收集线程和用户线程(基本上)同时工作。

        CMS收集器是一种“标记-清除”算法实现的,整个过程分为4个步骤:
        ① 初始标记: (STW)暂停所有的其他线程,并记录下GC Roots直接能引用的对象,速度很快(此阶段不会向下寻找引用的对象)

        ② 并发标记: 并发标记阶段就是从GC Roots的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长但是不需要停顿用户线程,可以与垃圾收集线程一起并发运行。因为用户程序继续运行,可能会导致已经标记过的对象状态发生改变。

        ③ 重新标记:(STW)重新标记阶段就是为了修正并发标记期间因为用户线程继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短。面对并发标记阶段漏标的情况主要用到三色标记里的增量更新算法做重新标记

        ④ 并发清理:开启用户线程,同时GC线程开始对未标记的区域做清扫,这个阶段如果有新增对象会被标记为黑色不做任何处理。

        ⑤ 并发重置:重置本次GC过程中的标记数据

 优点:并发收集、低停顿

 缺点:1.对CPU资源敏感(会和服务抢资源);

           2.无法处理浮动垃圾(在并发标记和并发清理阶段又产生垃圾,这种浮动垃圾只能等下一次gc再清理)

         3.使用的 “标记-清除算法”,会导致收集结束时有大量空间碎片产生,可通过参数 -XX:+UseCMSCompactAtFullCollection可以让jvm在执行完标记清除后再做整理

         4.执行过程中的不确定性,会存在上一次垃圾回收还没执行完,然后垃圾回收又被触发的情况,特别是在并发标记和并发清理阶段会出现,一边回收,系统一边运行,也许没回收完就再次触发full gc,也就是 concurrent mode failure,此时会进入stop the world ,转而用Serial old垃圾收集器来回收。

 但可能会由于动态年龄判断原则导致频繁full gc

 

        对于对象年龄应该为多少才移动到老年代比较合适,本例中一次minor gc要间隔二三十秒,大多数对象一般在几秒内就 会变为垃圾,完全可以将默认的15岁改小一点,比如改为5,那么意味着对象要经过5次minor gc才会进入老年代,整个 时间也有一两分钟了,如果对象这么长时间都没被回收,完全可以认为这些对象是会存活的比较长的对象,可以移动到 老年代,而不是继续一直占用survivor区空间。 对于多大的对象直接进入老年代(参数-XX:PretenureSizeThreshold),这个一般可以结合你自己系统看下有没有什么大对象 生成,预估下大对象的大小,一般来说设置为1M就差不多了,很少有超过1M的大对象,这些对象一般就是你系统初始 化分配的缓存对象,比如大的缓存List,Map之类的对象。

 

 三、垃圾收集器底层算法实现(三色标记)

        在CMS并发标记的过程中,因为标记期间应用线程还在继续跑,对象间的引用可能发生变化,多标和漏标的情况就有可能发生。“三色标记”就是把gcroots可达性分析遍历对象过程中遇到的对象,按照“是否访问过”这个条件标记成以下三种颜色:

        ①黑色:表示对象已经被垃圾收集器访问过,且这个对象的所有引用都已经扫描过。黑色的对象代表已经扫描过,它是安全存货的,如果有其他对象引用指向了黑色对象,无需重新扫描一遍。黑色对象不可能直接(不经过灰色对象)指向某个白色对象。

        ②灰色:表示对象已经被垃圾收集器访问过,但这个对象上至少存在一个引用还没有被扫描过。

        ③白色:表示对象已经被垃圾收集器访问过。显然在可达性分析刚刚开始的阶段,所有的对象都是白色的,若在分析结束的阶段,仍然是白色的对象,即代表不可达

         多标-浮动垃圾

        在并发标记过程中,如果由于方法运行结束导致部分局部变量(gcroot)被销毁,这个gcroot引用的对象之前又被扫描过(被标记为非垃圾对象),那么本轮GC不会回收这部分内存。这部分本应该回收但是没有回收到的内存,被称之为“浮动垃圾”。浮动垃圾并不会影响垃圾回收的正确性,只是需要等到下一轮垃圾回收中才被清除。另外,针对并发标记(还有并发清理)开始后产生新的对象,通常的做法是直接全部当成黑色,本轮不会进行清除。这部分对象期间可能也会变为垃圾,这也算是浮动垃圾的一部分。

        漏标-读写屏障

        漏标会导致被引用的对象被当成垃圾误删除,这是严重bug,必须解决,有两种方案:增量更新(Incremental Update)和原始快照(Snapshot At The Beginning ,SATB)

        增量更新:就是当黑色对象插入新的指向白色对象的引用关系时,就将这个插入的引用记录下来,等并发扫描结束之后,再将这些记录过的引用关系中的黑色对象为根,重新扫描一次。可以理解为,黑色对象一旦新插入了指向白色对象的引用之后,它就变回灰色对象了。如上图(D最开始被B对象引用,但是还没扫到,然后B不再引用了,直接A对其进行了引用,但此时D对象依然是白色的,A对象是黑色的,如果按照原有逻辑,A是黑色对象就不会再进行可达性分析扫描,gc的时候就会直接回收白色对象,所以此时引入了增量更新的概念,会利用写屏障,将A新的成员变量引用对象D记录下来,新增的引用关系存入一个集合中,再次对新增引用关系进行扫描)

        原始快照(SATB):就是当灰色对象要删除指向白色对象的引用关系时(比如要修改为:obj B =null),就将这个要删除的引用记录下来,在并发扫描结束之后再将这些记录过的引用关系中的灰色对象为根,重新扫描一次,这样就能扫描到白色的对象,将白色对象直接标记为黑色(目的就是让这种对象在本轮gc清理中能存活下来,待下一轮gc的时候重新扫描,这个对象也有可能是浮动垃圾)(可理解为B=null之前,将之前的引用记录B=D(原来成员变量的引用对象D记录下来)存在集合中,重扫的时候按照这个集合中的状态进行扫描)

        以上无论是对引用关系记录的插入还是删除,虚拟机的记录操作都是通过写屏障(就是指在赋值操作前后加入一些处理如同AOP)来实现的。

        读屏障:是直接针对第一步,当读取成员变量时,一律记录下来,同时写屏障可以用于记录跨代/区引用的变化,读屏障可以用于支持移动对象的并发执行等

        目前追踪式(可达性分析)的垃圾回收器几乎都借鉴了三色标记的算法思想:比如白色/黑色集合一般都不会出现(但是有其他体现颜色的地方)、灰色集合可以通过栈/队列/缓存日志等方式进行实现、遍历方式可以是广度/深度遍历等等。

对于读屏障,以java HotSpot VM 为例,其并发标记时对漏标的处理方案如下:

        ● CMS: 写屏障+增量更新

        ●  G1,Shenandoah : 写屏障+SATB

        ●  ZGC:  读屏障

        为什么G1用SATB,CMS用增量更新?

        SATB相对增量更新效率会高(同时可能造成更多的浮动垃圾),因为不需要再重新标记阶段再次深度扫描被删除引用的对象,而CMS对增量引用的根对象会做深度扫描,G1因为很多对象都位于不同的region,CMS就一块老年代区域,重新深度扫描对象的话G1的代价会比CMS高,所以G1选择SATB不深度扫描对象,只是简单标记,等到下一轮GC再深度扫描。

        记忆集与卡表

        在新生代做GCRoots可达性扫描过程中可能会碰到跨代引用的对象,这种如果又去对老年代再去扫描效率太低了。 为此,在新生代可以引入记录集(Remember Set)的数据结构(记录从非收集区到收集区的指针集合),避免把整个 老年代加入GCRoots扫描范围。事实上并不只是新生代、 老年代之间才有跨代引用的问题, 所有涉及部分区域收集 (Partial GC) 行为的垃圾收集器, 典型的如G1、 ZGC和Shenandoah收集器, 都会面临相同的问题。 垃圾收集场景中,收集器只需通过记忆集判断出某一块非收集区域是否存在指向收集区域的指针即可,无需了解跨代引 用指针的全部细节。 hotspot使用一种叫做“卡表”(cardtable)的方式实现记忆集,也是目前最常用的一种方式。关于卡表与记忆集的关系, 可以类比为Java语言中HashMap与Map的关系。 卡表是使用一个字节数组实现:CARD_TABLE[ ],每个元素对应着其标识的内存区域一块特定大小的内存块,称为“卡 页”。 hotSpot使用的卡页是2^9大小,即512字节

      一个卡页中可包含多个对象,只要有一个对象的字段存在跨代指针,其对应的卡表的元素标识就变成1,表示该元素变 脏,否则为0. GC时,只要筛选本收集区的卡表中变脏的元素加入GCRoots里。 卡表的维护 卡表变脏上面已经说了,但是需要知道如何让卡表变脏,即发生引用字段赋值时,如何更新卡表对应的标识为1。 Hotspot使用写屏障维护卡表状态。


http://chatgpt.dhexx.cn/article/JqB93OK4.shtml

相关文章

垃圾收集器-CMS

CMS垃圾收集器 文章目录 CMS垃圾收集器前言一、CMS是什么?二、CMS收集的步骤1.初始标记2.并发标记3.重新标记4.并发收集 三、核心参数四、总结 前言 相信大家都或多或少的了解过hotspot虚拟机的垃圾收集器,无论是初代的serialGc(单线程的垃圾收集器)&am…

Java经典垃圾收集器

经典垃圾收集器 1.Serial收集器2.ParNew收集器3.Parallel Scavenge收集器4.Serial Old收集器5.Parallel Old收集器6.CMS收集器7.Garbage First收集器 1.Serial收集器 Serial收集器是最基础,历史最久远的收集器,是一款新生代收集器,新生代收集…

GC 垃圾收集器

GC 垃圾回收算法 和 垃圾收集器之间的关系是什么呢 ? GC算法 (复制 / 标清 / 标整 ) 是内存回收的一种思想 , 垃圾收集器就是 GC算法 的落地实现我们知道没有最完美的 GC算法 , 因此目前为止也没有完美的垃圾收集器 , 只是针对不同的情况选择最适合的收集器来进行分代收集 主要…

7种垃圾收集器

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。 Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、版本的虚拟机所提供的垃圾收集器都可能会有很大差别,并且一般都会提供参数供用户根据…

垃圾收集器简介

HotSpot JVM收集器 上面有7中收集器,分为两块,上面为新生代收集器,下面是老年代收集器。如果两个收集器之间存在连线,就说明它们可以搭配使用。 Serial(串行GC)收集器 Serial收集器是一个新生代收集器,单线程执行&…

【JVM】7种经典的垃圾收集器

文章目录 1. 垃圾收集器概述2. Serial 收集器3. ParNew 收集器4. Paraller Scavenge 收集器5. Serial Old收集器6. Parller Old收集器7. CMS 收集器8. Garbage First 收集器 本文参考:深入理解Java虚拟机:JVM高级特性与最佳实践(第3版&#x…

JVM垃圾收集器

一.概述 GC需要完成的三件事:1.哪些内存需要回收? 2.什么时候回收? 3.如何回收 Java内存运行时区域的各个部分: a. 其中程序计数器、虚拟机栈、本地方法栈三个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进入和退出而有条不紊地执行…

垃圾收集算法与垃圾收集器

典型的垃圾收集算法 1.Mark-Sweep(标记-清除)算法 这是最基础的垃圾回收算法,之所以说它是最基础的是因为它最容易实现,思想也是最简单的。标记-清除算法分为两个阶段:标记阶段和清除阶段。标记阶段的任务是标记出所有…

Java 的七种垃圾收集器

用 C 或 C 这样的编程语言写一个应用时,需要编写代码来销毁内存中不再需要的对象。当应用程序扩展得越来越复杂时,未使用对象被忽略释放的可能性就越大。这会导致内存泄露,最终内存耗尽,在某个时刻将没有更多的内存可以分配。结果…

Java 垃圾收集器

堆内存示意图 垃圾收集算法 1.标记-清除算法 算法分为标记和清除两个阶段。标记出所有需要回收的对象,在标记完成后,统一回收。 缺点: 执行效率不稳定,若堆中有大量对象要被回收,这是必须进行大量标记和清除动作&a…

JVM 垃圾收集器

title: “JVM 垃圾收集器” date: 2022-03-11T16:45:2108:00 draft: false 文章目录 引言术语垃圾收集器介绍Serial 收集器(新生代)ParNew收集器(新生代)Parallel Scavenge收集器(新生代)Serial Old 收集器…

详解ZGC垃圾收集器

从G1垃圾收集器开始,后面的垃圾收集器都不再将堆按照新生代和老年代作为整体进行回收,都采用了局部收集的设计思想。 可能是由于G1作为第一代局部收集的垃圾收集器,所以它继续保留了新生代和老年代的概念,笔者认为从局部收集和分…

JVM——垃圾收集器

目录 引言 垃圾收集器 如何判断对象已死? 引用计数算法: 可达性分析算法: 垃圾收集算法 标记-清除算法 标记-复制算法 标记-整理算法 并发的可达性分析 经典垃圾收集器 内存分配与回收策略 1.对象优先在Eden分配 …

jvm垃圾收集器有哪些

Serial收集器 Serial收集器是最基本,发展最悠久的收集器,在JDK1.3.1之前是虚拟机新生代垃圾回收的唯一选择。这个收集器是一个单线程的。它的单线程的意义并不仅仅说明它只会使用一个CPU或者一条收集线程去完成收集工作,最重要的是&#xff…

经典垃圾收集器(三)

低延迟垃圾收集器 衡量垃圾收集器的三项重要指标:内存占用(Footprint)、吞吐量(Throughput)和延迟(Latency)。三者构成了一个“不可能三角” Shenandoah收集器 Shenandoah相比于G1有什么改进&…

垃圾收集器

如果说垃圾回收算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现,java虚拟机实现规范中对垃圾收集器应该如何实现并没有任何规定,因此不同厂商、不同版本的虚拟机提供的垃圾收集器存在很大的差异,接下来我们主要介绍…

深入理解7种垃圾收集器

**如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。**Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同的厂商、版本的虚拟机所提供的垃圾收集器都可能会有很大差别,并且一般都会提供参数供用户根…

Java中的垃圾收集器

目录 1、Java的垃圾收集器的分类 2、收集器的特点 3、评估GC的性能指标 4、Serial收集器 5、ParNew收集器 6、Parallel Scavenge 吞吐量优先 (与Parallel Old搭配) 7、CMS收集器 8、G1收集器 9、各种收集器的应用场景 垃圾收集器:垃…

java垃圾收集器

目录 简介 Serial 收集器 ParNew 收集器 并行(Parallel) 并发(Concurrent) Parallel Scavenge 收集器 Serial Old 收集器 Parallel Old 收集器 CMS收集器 G1收集器 G1简介 G1细节 G1 Minor GC流程 G1 Mixed GC流程 …

常用垃圾收集器介绍

本节将会介绍一下HotSpot虚拟机中的常用垃圾收集器:Serial,ParNew,Parallel Scavenge,Serial Old,Parallel Old,CMS,G1,会对每个垃圾收集器的概念和常用参数做下介绍。 目录 概述 …