JAVA程序性能优化

article/2025/11/9 8:21:05

制约程序性能的根源

常用的性能评估指标

  • 并发:同一时间多少请求访问:如同一时间10个用户请求,并发就是10
  • TPS:transaction per second:相当于写操作
  • QPS:query per second:相当于读请求,从数据库读出写到缓存一般认为是QPS
  • 耗时:
    端到端耗时,从发起到结束,影响用户体验的耗时,包含了网络耗时;
    服务端耗时,出去了公网的网络带宽,是机房内网串联的耗时;
    应用程序耗时,摒弃了外围的存储,外围的数据库和外围的一些系统,单纯的应用程序的耗时,最小原子化耗时
    95线:95%的请求落在什么范围内
    99线:99%的请求落在什么范围内

制约程序性能的根源到处都在,可以分为以下几部分

  • 网络
  • 应用本身
  • 数据库
  • 缓存
  • 消息
  • 操作系统
  • 内存
  • IO
  • CPU
    在这里插入图片描述
  • 程序计数器(线程私有,每个线程均有一个自己的程序计数器)
    记录虚拟机字节码指令的地址(当前指令的地址,记录当前线程运行到了哪里)
  • java虚拟机栈
    线程私有,每个方法(public,private等等)在执行的时候也会创建一个栈帧,存储了局部变量,操作数,动态链接,方法返回地址;靠入栈和出栈来完成
  • 本地方法栈
    和虚拟机栈类似,主要为虚拟机使用到的Native方法服务

  • 被所有线程共享的一块区域内存,在虚拟机启动的时候创建,用于存放对象实例(所有new的对象)。
  • 方法区
    用于存储已经被虚拟机加载的类信息class,常量,静态变量等
    在这里插入图片描述
  • 元数据区
    替代永久代,类信息class,常量,静态变量等,字符串在1.7开始放到了堆中

GC算法

1.算法本质

  • 标记-清除
    优点:简单
    缺点:碎片化,导致可能某一大对象可以存放,而被碎片化之后不能存放了
  • 复制
    优点:吞吐量高,无碎片化
    缺点:空间利用率低
  • 标记-整理
    优点:兼顾了时间和空间问题
    缺点:效率非最优
    2.算法策略

分代GC回收算法

  • 年轻代:复制算法
    1.Eden(1个,新生代区),新创建对象首先放这里,达到一定阈值触发GC,首次GC把有引用的复制到随机一个Survivor区域如1,清空Eden; ,第二次触发GC时会把使用的Survivor1和Eden在使用的复制到另一个Survivor2中清空前一个有数据的Survivor1,第三次时会把Eden和第二次有数据的Survivor2复制到前面清空的Survivor1,然后清空Survivor2
    2.Survivor(两个,幸存者区)

  • 老年代:标记整理算法,15次的垃圾回收仍存活会从年轻代进入老年代。老年代快满之后会触发老年代的GC;老年代和年轻代同时快满时会触发FullGC

  • 串行Serial,并行Parallel

  • CMS(Concurrent Mark-Sweep Collector)
    1.Initial Mark初始标记:标记可直达的存活对象
    2.Concurrent Mark并发标记:通过遍历第一阶段(Initial Mark)标记出来的存活对象继续递归遍历老年代,并标记可直接或间接达到的所有老年代存活对象
    3.Concurrent Preclean并发预清理:将会重新扫描前一个阶段标记的Dirty对象直接或间接引用的对象,然后清除Card标识
    4.Concurrent Abortable Preclean可中止的并发预处理:尽可能承担更多的并发预处理工作,从而减轻在Final Remark阶段的Stop-the-world,处理from和to区的对象,标记可达的老年代对象,并处理Dirty对象
    5.Final Remark重新标记:重新扫描之前并发处理阶段的所有残留更新对象
    6.Concurrent Sweep并发清理:清理所有未被标记的死亡对象,回收被占用的空间
    7.Concurrent Reset并发重置:清理并恢复在CMS GC过程中的各种状态,重新初始化CMS相关数据结构
    在这里插入图片描述

  • G1,jdk1.9默认
    类似CMS的实现,保留了Initial Mark和Final Remark的两次Stop-the-world;内存空间默认做了优化,分单元区块,会去评审每一块区域的回收价值,确定那一块回收收益最高,控制垃圾回收的时间;每个区块都有rememberedSet(记忆集合) 管理自己区块所有内存使用的GCroot的状态即在做内存分配时就已经知道了内存内的现状,每个对象分别指向了什么对象,在做Final Remark时不需要跨区,减少路径扫描的时耗同事能更快的决策知道每个对象的分布

内存大小的取舍

1.扩大内存可以更少的触发GC
2.内存太大触发GC时候的停顿时间会长

  • 因此要根据实际的业务场景设置一个“合适”的值,并配合压测和线上环境的实际情况不断调优;
  • 达到:吞吐量=花在非GC停顿时间上的工作时间/总时间 >=95%

-Xms 启动JVM时堆内存的大小
-Xmx 堆内存最大限制
两者需要设置一样,防止扩缩容;

-XX:NewSize 年轻代大小,比老年代稍微大些
-XX:MaxNewSize 最大年轻代大小
两者需要设置一样,防止扩缩容;

-XX:SurvivorRatio 表示Eden survivor占比,默认为8,Eden 至少是survivor的两倍
Eden需要比Survivor尽可能的大,防止多次触发young gc导致年龄快速增长到可以进入老年代的case

-XX:MetaspaceSize元空间 初始空间大小
-XX:MetaspaceSizey元空间最大空间,默认是没有限制的,不建议设置

GC优化

1.将进入老年代的对象减少到最低:可通过调整新生代的大小
2.young gc: 40ms以内
3.major gc:stop-the-world时间总和100ms以内:如果触发的不是特别频繁,可放到200ms甚至500ms以内
4.full gc :尽可能少,且时间在1s内
除了cms和g1外其余的串行或并行的GC major gc=full gc

GC策略开启参数

jdk1.9之前建议使用cms;1.9之后默认G1
在这里插入图片描述

CMS变成Full GC条件,尽可能的减少

  • promotion failure :由于内存碎片导致的晋升空间不足,发生在新生代往来年代晋升时
  • Concurrent mode failed:还未完成cms又触发了下一次major gc,发生在内存分配的速度比cms执行速度更短时

cms调优,整个调优看实验情况,具体使用如下参数之间取舍

-XX:ParallelGCThreads=N设置年轻代的并行收集线程数,避免docker踩坑;如果不配置JVM会获取当前主机上的CPU的核数来决策放多少线程数合适,早起版本在docker中读取的是物理机的并非是docker的核
-XX:ParallelCMSThreads=N设置cms的并行收集线程数,避免docker踩坑;清除老年代的并发的线程数,如果指定了上一个参数,这个参数可以根据第一个参数做线性调整,往往不需要设置此参数
-XX:+UseCMSCompactAtFullCollection FullGC情况下的Initial remark 或者Final remark都整理内存碎片
-XX:+CMSFullGCsBeforeCompaction=4 两次FullGC情况下的Initial remark 或者Final remark 4次后才整理内存碎片,与上一个参数配合使用,更好的权衡性能和内存的关系
-XX:+UseCMSInitiatingOccupancyOnly 让阈值驱动cms触发时机
-XX:+CMSInitiatingOccupancyFraction=70 表示老年代70%占满才触发cms;往往与上一个放一起使用,需要上一个参数开启使用防止jvm瞎搞,70较合理
-XX:+CMSParallelRemarkEnabled :final remark阶段并行remark
-XX:+CMSScavengeBeforeRemark remark前先做一次major gc,为了将younggc的内容释放一部分

G1参数调优

-XX:+UseG1GC开启G1参数,1.9之后不需要指定使用
-XX:MaxGCPauseMillis=n GC最大停顿时间,程序可容忍多久的停顿,JVM会尽可能的满足,软性参数
-XX:G1HeapRegionSize=n 每个Region的大小,需要不断试验确定Region的大小

Best pratise

  • 多分析线上case,并设置不同的内存大小观察GC日志,寻找最佳策略
  • 通过改善以上参数避免common类型问题

日志优化

内容是否有意义,有效,并且足够精炼,是否是debug问题的关键,如toString方法只放相对有效的精炼信息

  • 同步日志(刷盘阻塞)/异步日志(内存管道buffer,不需要等到刷盘,写磁盘时可能失败,导致致命的日志缺失)
  • 日志归档时间,如log4j按天,每天0点切换文件(可设置偏移几秒执行),切换文件时会info上锁打zip,然后清空info
  • 日志大小拆分,如200M,也不建议切分太小,会导致查询困难,太大或导致切换上锁时间过长

池化策略(线程池,连接池)

  • Idle数量,与cpu数量贴近,建议IO密集型核心线程数是cpu核数*2;计算密集型核心线程数和cpu核数+1;根据实际线上应用的数量和server(mysql server最大500个)可以承载的最大连接数判断和取舍

http://chatgpt.dhexx.cn/article/WqPlpAOZ.shtml

相关文章

Java性能优化的35个细节(珍藏版)

代码优化,一个很重要的课题。可能有些人觉得没用,一些细小的地方有什么好修改的,改与不改对于代码的运行效率有什么影响呢?这个问题我是这么考虑的,就像大海里面的鲸鱼一样,它吃一条小虾米有用吗&#xff1…

Java 中 10 大简单的性能优化

Java 7 ForkJoinPool和 Java 8 的并行Stream有助于并行化东西,这在您将 Java 程序部署到多核处理器机器上时非常有用。与跨网络上的不同机器进行扩展相比,这种并行性的优势在于您几乎可以完全消除延迟效应,因为所有内核都可以访问相同的内存。…

Java性能优化的七个方向

博客主页:https://tomcat.blog.csdn.net 博主昵称:农民工老王 主要领域:Java、Linux、K8S 期待大家的关注💖点赞👍收藏⭐留言💬 目录 概述复用优化计算优化并行执行变同步为异步惰性加载 结果集优化资源冲…

JAVA性能优化实例

目录 概述 Sql性能优化 多线程 利用内存缓存 功能优化 参考博客 概述 性能优化的几个点,大致可以分为: sql优化使用多线程利用内存,缓存等,将固定不常更改的数据放入在,存取更快的内存当中功能实现逻辑优化 Sql性…

10种简单的Java性能优化学习

10种简单的Java性能优化学习 你是否正打算优化hashCode()方法?是否想要绕开正则表达式?Lukas Eder介绍了很多简单方便的性能优化小贴士以及扩展程序性能的技巧。 最近“全网域(Web Scale)”一词被炒得火热,人们也正在…

Java性能优化实践:分享Java性能优化的实践经验

Java性能优化是一个非常重要的话题,在现代软件开发中扮演着至关重要的角色。在本篇博客中,我将分享一些Java性能优化的实践经验,包括使用JavaProfiler分析程序性能、使用JMH进行基准测试、优化JVM参数等,帮助开发者更好地理解Java…

11 个简单的 Java 性能调优技巧

大多数开发人员理所当然地以为性能优化很复杂,需要大量的经验和知识。好吧,不能说这是完全错误的。优化应用程序以获得最佳性能不是一件容易的事情。但是,这并不意味着如果你不具备这些知识,就不能做任何事情。这里有11个易于遵循…

Java性能优化

文章目录 一、JVM内存模型1.1、程序计数器(Program Counter Register)1.2、JVM虚拟机栈(JVM Stacks)1.3、本地方法栈(Native Method Stacks)1.4、堆(Heap)1.5、方法区(Me…

Java性能优化的50个细节(珍藏版)

在JAVA程序中,性能问题的大部分原因并不在于JAVA语言,而是程序本身。养成良好的编码习惯非常重要,能够显著地提升程序性能。 1. 尽量在合适的场合使用单例 使用单例可以减轻加载的负担,缩短加载的时间,提高加载的效率,但并不是所有地方都适用于单例,简单来说,单例主要…

GNU-ARM程序开发(一)----GNU开发环境和工具

什么是GNU GNU计划,又称革奴计划。是由Richard Stallman在1983年9月27日公开发起的。目标是创建一套完全免费、自由的操作系统,基本原则是源代码共享及思想共享。 所有在GNU计划下开发的软件均为GNU软件。 为保证GNU软件可以自由地“使用、复制、修改和发…

【ARM编程】ARM介绍

01.ARM目录 ARM目录 01.ARM目录02.前言03.计算机体系结构分类04.ARM公司05.ARM应用领域06.ARM基本架构07.ARM各体系架构版本7.1 ARM版本Ⅰ:V1版架构7.2 ARM版本 Ⅱ:V2版架构7.3 ARM版本 Ⅲ:V3版架构7.4 ARM版本 Ⅳ: V4版架构7.5 A…

ARM开发环境

目录 前言一、Ubuntu及linux系统基础知识1.shell命令的运用2.Tool的安装:3.deb是软件包,dpkg是手动安装工具,apt是自动安装工具,4.Linux文件系统5.gcc编译器 二、开发环境搭建1.vim编辑器2.与windows文件互传3.VSCode使用4.NFS网络…

ARM开发环境下载地址大全

MDK5.3.8a(Keil5)最新下载地址 超链接如下,点击直达: Keil MDK (Keil Licensing) (MDK000) (arm.com) 实际网址如下所示: https://developer.arm.com/downloads/view/MDK000 Arm Compiler for Embedded下载地址 超链接如下,点击直…

什么是ARM?

原文 一、ARM是什么? ARM既可以认为是一个公司的名字 ,也可以认为是对一类处理器的统称 ,还可以认为是一种技术的名字 。 ARM公司是专门从事基于RISC技术芯片设计开发 的公司,作为知识产权供应商,本身不直接从事芯片…

X86ARM架构

这里写目录标题 cpu架构arm架构ARM架构图 x86架构arm架构和x86架构的区别CISC Vs RISCWindows如何查看系统是ARM64还是X64架构 32位与64位的区别巨头公司国产cpu公司 cpu架构 CPU 的全称是"中央处理单元",它是计算机的核心,计算都由它来完成。…

ARM开发——常见仿真器

搞嵌入式开发和ARM开发搞了半辈子了,调试程序是不可避免的。接触了那么多的调试规范、调试工具、调试手段,彼此之间的关系却也不是特别清楚,今天就来捋一捋: JTAG协议 JTAG(Joint Test Action Group,联合…

ARM开发---基础认识

本文适合初次接触ARM的的初学者,主要以基础知识点和科普为主. 文章目录 前言一、ARM是什么?二、ARM的特点三、ARM的使用场景1.计算机组成2.架构3.指令集4.指令解析5.工作模式 四、寄存器总结 前言 提起ARM,没有接触过的朋友可能第一反应是英…

【嵌入式】Linux开发工具arm-linux-gcc安装及使用

arm-linux-gcc 知识架构及层次 — 程序编译及调试嵌入式交叉编译器安装配置主机目标板开发模式ARM微处理器/Linux系统下编译器编译器下载及安装 arm-linux-gcc工具使用-E-S-c -o-include file-I dir-I-iprefix prefix 和 -iwithprefix dir-l库名 -L目录gcc 优化 课后作业 Linux…

ARM 编译器 Arm Compiler for Embedded 6 相关工具链简介

目录 1, Introduction to Arm Compiler 6 1.1 armclang 1.2 armasm 1.3 armlink 1.4 armar 1.5 fromelf 1.6 Arm C libraries 1.7 Arm C libraries 1,8 Application development ,ARM程序开发流程 2,ARM 编译器 5和ARM 编译器 6的兼容性 3&…

ARM处理器开发详解

目录 第一章 嵌入式系统基础知识(不考)嵌入式系统特点交叉调试调试器 第二章 嵌入式 ARM 技术概论ARM的基本数据类型(不考)选择ARM芯片的一般原则Cortex-A9内核的八种工作模式流水线(不考)寄存器组织程序状…