解读JVM虚拟机

JAVA乐园

共 8399字,需浏览 17分钟

 ·

2020-10-30 03:08

阅读文本大概需要3分钟。

概要点:

  • java虚拟机概述和基本概念

  • 堆、栈、方法区

  • 了解虚拟机参数

  • 垃圾回收概念和算法、及对象的分代转换

  • 垃圾收集器

java虚拟机的原理:

  • 所谓虚拟机,就是一台虚拟的机器。它是一款软件,用来执行一系列虚拟计算机指令,大体上虚拟机可以分为系统虚拟机和程序虚拟机,大名鼎鼎的Visual Box、VMare就属于系统虚拟机,他们完全是对物理计算机的仿真,提供了一个可运行完整操作系统的软件平台。

  • 程序虚拟机典型代表就是Java虚拟机,它专门为执行单个计算机程序而设计,在java虚拟机中执行的指令我们成为java字节码指令。无论是系统虚拟机还是程序虚拟机,在上面运行的软件都被限制于虚拟机提供的资源中。Java发展至今,出现过很多虚拟机,最初Sun使用的一款叫Classic的Java虚拟机,到现在引用最广泛的是HotSpot虚拟机,除了Sun外,还有BEA的JRockit,目前JRockit和HotSpot都被Oracle收入旗下,大有整合的趋势。

java虚拟机的基本结构

 

结构概念说明:

  • 类加载子系统:负责从文件系统或者网络中加载Class信息,加载的信息 存放在一块称之为方法区的内存空间。

  • 方法区:就是存放类信息、常量信息、常量池信息、包括字符串字面量和数字常量等。

  • java堆:在java虚拟机启动的时候建立java堆,它是java程序最主要的内存工作区域,几乎所有的对象实例都存放到java堆中,堆空间是所有线程共享的。

  • 直接内存:Java的NIO库允许java程序使用直接内存,从而提高性能,通常直接内存速度会优于java堆。读写频繁的场合可能会考虑使用。

  • 每个虚拟机线程都有一个私有的栈,一个线程的java栈在线程创建的时候被创建,java栈中保存着局部变量、方法参数、同时java的方法调用、返回值等。

  • 本地方法栈和java栈非常类似,最大不同为本地方法栈用于本地方法调用。java虚拟机允许java直接调用本地方法(通常使用C编写)。

  • 垃圾收集系统是java的核心,也是必不可少的,java有一套自己进行垃圾清理的机制,开发人员无需手工清理,我们稍后详细说明。

  • PC(Program Counter)寄存器也是每个线程私有的空间,java虚拟机会为每个线程创建PC寄存器,在任意时刻,一个java线程总是在执行一个方法,这个方法被称为当前方法,如果当前方法不是本地方法,PC寄存器就会执行当前正在被执行的指令,如果是本地方法,则PC寄存器值为undefined,寄存器存放如当前执行环境指针、程序计数器、操作栈指针、计算的变量指针等信息。

  • 虚拟机最核心的组件就是执行引擎了,它负责执行虚拟机的字节码。一般会先进行编译成机器码后执行

堆、栈、方法区概念和联系:

  • 堆解决的是数据存储的问题,即数据怎么放、放在哪儿。栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。

  • 方法区则是辅助堆栈的快永久区(Perm),解决堆栈信息的产生,是先决条件。

  • 我们创建一个新的对象,User:那么User类的一些信息(类信息、静态信息都存在于方法区中) 而User类被实例化出来之后,被存储到java堆中,一块内存空间 当我们去使用的时候,都是使用User对象的引用,形如User user = new User(); 这里的user就是存放在java栈中的,即User真实对象的一个引用。

java栈:

  • java栈是一块线程私有的内存空间,一个栈,一般由三部分组成:局部变量表、操作数栈和帧数据区。

  • 局部变量表:用于报错函数的参数及局部变量。操作数栈:主要保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。

  • 帧数据区:除了局部变量表和操作数栈以外,栈还需要一些数据来支持常量池的解析,这里帧数据区保存着访问常量池的指针,方便程序访问常量池。

  • 另外,当函数返回或者出现异常时,虚拟机必须有一个异常处理表,方便发送异常的时候找到异常的代码,因此异常处理表也是帧数据区的一部分。

java方法区:

  • java方法区和堆一样,方法区是一块所有线程共享的内存区域,它保存系统的类信息,比如类的字段、方法、常量池等。

  • 方法区的大小决定了系统可以保存多少个类,如果系统定义太多的类,导致方法区溢出。虚拟机同样会抛出内存溢出错误。方法区可以理解为永久区(Perm)

 虚拟机参数:

  • 在虚拟机运行的过程中,如果可以跟踪系统的运行状态,那么对于问题的故障排查会有一定的帮助。

  • 为此,虚拟机提供了一些跟踪系统状态的参数,使用给定的参数执行java虚拟机,就可以在系统运行时打印相关日志,用于分析实际问题。我们进行虚拟机参数配置,其实主要就是围绕着堆、栈、方法区进行配置。

堆分配参数(一):

  • -XX:+PrintGC 使用这个参数,虚拟机启动后,只要遇到GC就会打印日志。

  • -XX:+UseSerialGC 配置串行回收器

  • -XX:+PrintGCDetails 可以查看详细信息,包括各个区的情况

  • -Xms:设置java程序启动时初始堆大小

  • -Xmx:设置java程序能获得的最大堆大小

  • -Xmx20m -Xms5m -XX:+PrintCommandLineFlags : 可以将隐式或者显示传给虚拟机的参数输出

  • 总结:在实际工作中,我们可以直接将初始的堆大小与最大堆大小设置相等,这样的好处是可以减少程序运行时的垃圾回收次数,从而提高性能。

堆分配参数(二):

  • 新生代的配置 -Xmn:可以设置新生代的大小,设置一个比较大的新生代会减少老年代的大小,这个参数对系统性能以及GC行为有很大的影响,新生代大小一般会设置整个堆空间的1/3到1/4左右。

  • -XX:SurvivorRatio:用来设置新生代中eden空间和from/to空间的比例。含义:-XX:SurvivorRatio=eden/from=eden/to

  • 总结:不同的堆分布情况,对系统执行会产生一定的影响,在实际工作中,应该根据系统的特点做出合理的配置,基本策略:尽可能将对象预留在新生代,减少老年代的GC次数。除了可以设置新生代的绝对大小(-Xmn),还可以使用(-XX:NewRatio)设置新生代和老年代的比例:-XX:NewRatio=老年代/新生代

堆溢出处理:

  • 在java程序的运行过程中,如果堆空间不足,则会抛出内存溢出的错误(Out Of Menory)OOM,一旦这类问题发生在生产环境,可能引起严重的业务中断。

  • java虚拟机提供了-XX:+HeapDumpOnOutOfMemoryError,使用该参数可以在内存溢出时导出整个堆信息,与之配合使用的还有参数, -XX:HeapDumpPath,可以设置导出堆的存放路径。

栈配置:

  • Java虚拟机提供了参数-Xss来指定线程的最大栈空间,整个参数也直接决定了函数可调用的最大深度。

方法区:

  • 和java堆一样,方法区是一块所有线程共享的内存区域,它用于保存系统的类信息,方法区(永久区)可以保存多少信息可以对其进行配置。

  • 在默认情况下,-XX:MaxPermSize为64MB,如果系统运行时生产大量的类,就需要设置一个相对合适的方法区,以免出现永久区内存溢出的问题。-XX:PermSize=64M -XX:MaxPermSize=64M

直接内存配置:

  • 直接内存也是java程序中非常重要的组成部分,特别是广泛用在NIO中,直接内存跳过了java堆,使java程序可以直接访问原生堆空间,因此在一定程度上加快了内存空间的访问速度。但是说直接内存一定就可以提高内存访问速度也不见得,具体情况具体分析。

  • 相关配置参数:-XX:MaxDirectMemorySize,如果不设置默认值为最大堆空间,即-Xmx。直接内存使用达到上限时,就会触发垃圾回收,如果不能有效的释放空间,也会引起系统的OOM.

垃圾回收概念和其算法:

  • 谈到垃圾回收(Garbage Collection,简称GC),需要先澄清什么是垃圾,类比日常生活中的垃圾,我们会把他们丢入垃圾桶,然后倒掉。

  • GC中的垃圾,特指存于内存中、不会再被使用的对象,而回收就是相当于把垃圾“倒掉”。垃圾回收有很多种算法:如引用计数法、标记压缩法、复制算法、分代、分区的思想。

垃圾收集算法(一):

  • 引用计数法:这是个比较古老而经典的垃圾收集算法,其核心就是在对象被其他所引用时计数器加1,而当引用失效时则减1,但是这种方式有非常严重的问题:无法处理循环引用的情况、还有就是每次进行加减操作比较浪费系统性能。标记清除法:就是分为标记和清除俩个阶段进行处理内存中的对象,当然这种方式也有非常大的弊端,就是空间碎片问题,垃圾回收后的空间不是连续的,不连续的内存空间的工作效率要低于连续的内存空间。

  • 复制算法:其核心思想就是将内存空间分为两块,,每次只使用其中一块,在垃圾回收时,将正在使用的内存中的存留对象复制到未被使用的内存块中去,之后去清除之前正在使用的内存块中所有的对象,反复去交换俩个内存的角色,完成垃圾收集。(java中新生代的from和to空间就是使用这个算法)

  • 标记压缩法:标记压缩法在标记清除法基础之上做了优化,把存活的对象压缩到内存一端,而后进行垃圾清理。(java中老年代使用的就是标记压缩法) 考虑一个问题:为什么新生代和老年代使用不同的算法?

垃圾收集算法(二):

  • 分代算法:就是根据对象的特点把内存分成N块,而后根据每个内存的特点使用不同的算法。对于新生代和老年代来说,新生代回收频率很高,但是每次回收耗时都很短,而老年代回收频率较低,但是耗时会相对较长,所以应该尽量减少老年代的GC.

  • 分区算法:其主要就是将整个内存分为N多个小的独立空间,每个小空间都可以独立使用,这样细粒度的控制一次回收都少个小空间和那些个小空间,而不是对整个空间进行GC,从而提升性能,并减少GC的停顿时间。

垃圾回收时的停顿现象:

  • 垃圾回收器的任务是识别和回收垃圾对象进行内存清理,为了让垃圾回收器可以高效的执行,大部分情况下,会要求系统进入一个停顿的状态。

  • 停顿的目的是终止所有应用线程,只有这样系统才不会有新的垃圾产生,同停顿保证了系统状态在某一个瞬间的一致性,也有益于更好标记垃圾对象。因此在垃圾回收时,都会产生应用程序的停顿。

对象如何进入老年代:

  • 一般而言对象首次创建会被放置在新生代的eden区,如果没有GC介入,则对象不会离开eden区,那么eden区的对象如何进入老年代呢?

  • 一般来讲,只要对象的年龄达到一定的大小,就会自动离开年轻代进入老年代,对象年龄是由对象经历数次GC决定的,在新生代每次GC之后如果对象没有被回收则年龄加1.虚拟机提供了一个参数来控制新生代对象的最大年龄,当超过这个年龄范围就会晋升老年代。-XX:MaxTenuringThreshold,默认情况下为15。

  • 总结:根据设置MaxTenuringThreshold参数,可以指定新生代对象经过多少次回收后进入老年代。另外,大对象(新生代eden区无法装入时,也会直接进入老年代)。JVM里有个参数可以设置对象的大小超过在指定的大小之后,直接晋升老年代。-XX:PretenureSizeThreshold

  • 总结:使用PretenureSizeThreshold可以进行指定进入老年代的对象大小,但是要注意TLAB区域优先分配空间。

对象创建流程图:

 垃圾收集器:

  • 在java虚拟机中,垃圾回收器不仅仅只有一种,什么情况下该使用哪种,对性能又有什么样的影响,这都是我们需要了解的。

  • 串行垃圾回收器

  • 并行垃圾回收器

  • CMS回收器

  • G1回收器

串行回收器:

  • 串行回收器是指使用单线程进行垃圾回收的回收器。每次回收时,串行回收器只有一个工作线程,对于并行能力较弱的计算机来说,串行回收器的专注性和独占性往往有更好的性能表现。

  • 串行回收器可以在新生代和老年代使用,根据作用于不同的堆空间,分为新生代串行回收器和老年代串行回收器。使用-XX:+UseSerialGC 参数可以设置使用新生代串行回收器和老年代串行回收器

并行回收器(ParNew回收器):

  • 并行回收器在串行回收器基础上做了改进,他可以使用多个线程同时进行垃圾回收,对于计算能力强的计算机而言,可以有效的缩短垃圾回收所需的实际时间。

  • ParNew回收器是一个工作在新生代的垃圾收集器,他只是简单的将串行回收器多线程化,他的回收策略和算法和串行回收器一样。

  • 使用 -XX:+UseParNewGC 新生代ParNew回收器,老年代则使用串行回收器 ParNew回收器工作时的线程数量可以使用

  • -XX:ParallelGCThreads参数指定,一般最好和计算机的CPU相当,避免过多的线程影响性能。

并行回收器(ParallelGC回收器):

  • 新生代ParallelGC回收器,使用了复制算法的收集器,也是多线程独占形式的收集器,但ParallelGC回收器有个非常重要的特点,就是它非常关注系统的吞吐量。

  • 提供了俩个非常关键的参数控制系统的吞吐量

  • -XX:MaxGCPauseMillis:设置最大垃圾收集停顿时间,可用把虚拟机在GC停顿的时间控制在MaxGCPauseMillis范围内,如果希望减少GC停顿时间可以将MaxGCPauseMillis设置的很小,但是会导致GC频繁,从而增加了GC的总时间,降低了吞吐量。所以需要根据实际情况设置该值。

  • -XX:GCTimeRatio:设置吞吐量大小,它是一个0到100之间的整数,默认情况下他的取值是99,那么系统将花费不超过1/(1+n)的时间用于垃圾回收,也就是1/(1+99) = 1%的时间。

  • 另外还可以指定 -XX:+UseAdaptiveSizePolicy打开自适应模式,在这种模式下,新生代的大小、eden、from/to的比例,以及晋升老年代的对象年龄参数会被自动调整,以达到在堆大小、吞吐量和停顿时间之间的平衡点。

并行回收器(ParallelOldGC回收器):

  • 老年代ParallelOldGC回收器也是一种多线程的回收器,和新生代的ParallelGC回收器一样,也是一种关注吞吐量的回收器,他使用了标记压缩算法进行实现。

  • -XX:+UseParallelOldGC 进行设置

  • -XX:+ParallelGCThreads 也可以设置垃圾收集时的线程数量。

CMS回收器:

  • CMS全称为:Concurrent Mark Sweep 意为并发标记清除,他使用的是标记清除法,主要关注系统停顿时间。

  • 使用 -XX:+UseConcMarkSweepGC 进行设置。

  • 使用 -XX:ConcGCThreads 设置并发线程数量。

  • CMS并不是独占的回收器,也就说CMS回收的过程中,应用程序仍然在不停的工作,又会有新的垃圾不断的产生,所以在使用CMS的过程中应该确保应用程序的内存足够可用。CMS不会等到应用程序饱和的时候才去回收垃圾,而是在某一阀值的时候开始回收,回收阀值可用指定的参数进行配置,-XX:CMSInitiatingOccupancyFraction来指定,默认为68,也就是说当老年代的空间使用率达到68%的时候,会执行CMS回收。如果内存使用率增长的很快,在CMS执行的过程中,已经出现了内存不足的情况,此时CMS回收就会失败,虚拟机将启动老年代串行回收器进行垃圾回收,这会导致应用程序中断,知道垃圾回收完成后才会正常工作,这个过程GC的停顿时间可能较长,所以 - XX:CMSInitiatingOccupancyFraction的设置要根据实际的情况。

  • 标记清除法有个缺点就是存在内存碎片的问题,那么CMS有个参数设置-XX:+UseCMSCompactAtFullCollecion可以使CMS回收完成之后进行一次碎片整理,-XX:CMSFullGCsBeforeCompaction参数可以设置进行多少次CMS回收之后,对内存进行一次压缩。

G1回收器:

  • G1回收器(Garbage-First)是在jdk1.7中正式使用的垃圾回收器,从长期目标来看是为了取代CMS回收器,G1回收器拥有独特的垃圾回收策略,G1属于分代垃圾回收器,区分新生代和老年代,依然有eden和from/to区,它并不要求整个eden区或者新生代、老年代的空间都连续,它使用了分区算法。

  • 并行性:G1回收期间可多线程同时工作。

  • 并发性:G1拥有与应用程序交替执行能力,部分工作可与应用程序同时执行,在整个GC期间不会完全阻塞应用程序。

  • 分代GC:G1依然是一个分代的收集器,但是它是兼顾新生代和老年代一起工作,之前的垃圾收集器他们或者在新生代工作,或者在老年代工作,因此这是一个很大的不同。空间整理:G1在回收过程中,不会像CMS那样在若干次GC后需要进行碎片整理,G1采用了有效复制对象的方式,减少空间碎片。

  • 可预见性:由于分区的原因,G1可以只选取部分区域进行回收,缩小了回收的范围,提升了性能。

  • 使用 -XX:+UseG1GC 应用G1收集器

  • 使用 -XX:MaxGCPauseMillis 指定最大停顿时间

  • 使用 -XX:ParallelGCThreads 设置并行回收的线程数量

Tomcat性能影响实验:

  • 配置环境说明:Tomcat7

  • 一个JSP网站 测试网站吞吐量(1个指标、停顿时间,内存的使用情况,包括回收的效率....)

  • 工具:Apache JMeter 下载地址:http://jmeter.apache.org/download_jmeter.cgi

  • 实验原理:通过JMeter对Tomcat增加压力,不同的虚拟机参数应该会有不同的表现

  • 目的:观察不同配置参数对吞吐量的影响

测试串行回收器:

  • -XX:+PrintGCDetails -Xmx32M -Xms32M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseSerialGC -XX:PermSize=32M

  • 测试结果显示吞吐量为:1152 115

扩大堆内存以提升系统性能:

  • -XX:+PrintGCDetails -Xmx512M -Xms32M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseSerialGC

  • -XX:PermSize=32M -Xloggc:d:/gc.log

  • 测试结果显示吞吐量为:1557 155

调整初始堆大小:

  • -XX:+PrintGCDetails -Xmx512M -Xms64M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseSerialGC

  • -XX:PermSize=32M -Xloggc:d:/gc.log

  • 测试结果显示吞吐量为:2100 209

测试ParNew回收器的表现:

  • -XX:+PrintGCDetails -Xmx512M -Xms64M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseParNewGC -XX:PermSize=32M -Xloggc:d:/gc.log

  • 测试结果显示吞吐量为:2200 220

使用ParallelOldGC回收器:

  • -XX:+PrintGCDetails -Xmx512M -Xms64M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseParallelGC -XX:+UseParallelOldGC

  • -XX:ParallelGCThreads=8 -XX:PermSize=32M -Xloggc:d:/gc.log

  • 测试结果显示吞吐量为:3336 330

测试CMS回收器的性能:

  • -XX:+PrintGCDetails -Xmx512M -Xms64M

  • -XX:+HeapDumpOnOutOfMemoryError

  • -XX:+UseConcMarkSweepGC -XX:ConcGCThreads=8

  • -XX:PermSize=32M -Xloggc:d:/gc.log

  • 测试结果显示吞吐量为:2100  209

suorce:https://www.cnblogs.com/haha66/p/13821842.html




往期精彩



01 漫谈发版哪些事,好课程推荐

02 Linux的常用最危险的命令

03 互联网支付系统整体架构详解

04 优秀的Java程序员必须了解的GC哪些

05 IT大企业有哪些病,别被这些病毁了自己?

关注我每天进步一点点

你点的在看,我都当成了喜欢


浏览 22
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报