jvm-运行时数据区

jvm-运行时数据区

丁起男 14 2022-11-25

jvm-运行时数据区

jvm定义了若干种程序运行期间会使用到的运行时数据区,其中有一些会随着虚拟机启动而创建,随着虚拟机退出而销毁。另外一些则是于线程一一对应的,这些与线程对应的数据区会随着线程开始和结束而创建或销毁

  • 线程独享:程序计数器、虚拟机栈、本地方法栈
  • 线程共享:堆、堆外内存(永久代或元空间(方法区)、代码缓存(jit编译)

程序计数器(PC寄存器)

jvm中的pc寄存器是对物理pc寄存器的一种抽象模拟

  • 它是一块很小的内存空间,几乎可用忽略不记。也是运行速度最快的内存区域
  • 在jvm规范中,每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程生命周期一致
  • 任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的java方法的jvm指令地址;或者,如果是在执行native方法,则是未指定值(undefned)
  • 它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成
  • 字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令
  • 它是唯一一个在java虚拟机规范中没用任何OutOtMemoryError情况的区域

为什么使用pc寄存器纪录当前线程的执行地址

因为cpu需要不停的切换各个线程,这时候切换回来以后就得知道接着从哪开始继续执行

jvm的字节码解释器就需要通过改变pc寄存器的值来明确下一条应该执行什么样的字节码指令

pc寄存器为什么设定为线程私有

因为cpu会不停的做任务切换,为了能够准确的纪录各个线程正在执行的昂起字节码地址,最好的办法自然是为每一个线程都分配一个pc寄存器,这样一来各个线程之间便可以独立计算,从而不会出现互相干扰的情况

虚拟机栈

java虚拟机栈,早期也叫java栈。每个线程在创建时都会创建一个虚拟机栈(线程私有),其内部保存一个个的栈帧,对应一次次的java方法调用

生命周期:和线程一致

作用:主管java程序的运行,它保存方法的局部变量(基本类型和对象的引用)、部分结果,并参与方法的调用和返回

特点

  • 栈是一种快速有效的分配存储方式,访问速度仅次于程序计数器
  • jvm直接对java栈的操作只有两个(先进先出原则):
    • 每个方法执行,伴随着进栈(入栈、压栈)
    • 执行结束后的出栈工作
  • 对栈来说不存在垃圾回收问题(没用cg,但会出现oom)

栈中的异常

jvm规范允许java栈的大小是动态的或者是固定不变的

  • 如果采用固定大小的java虚拟机栈,那每一个线程的java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过java虚拟机栈允许的最大容量,java虚拟机会抛出一个StackOverflowError(栈溢出)异常(可以使用-Xss设置栈大小)
  • 如java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那么java虚拟机将会抛出一个OutOfMemoryError(内存不足)异常

栈中存储了什么

  • 每个线程都有自己的栈,栈中的数据都是以栈帧(Stack Frame)的格式存在
  • 在这个线程上正在执行的每个方法都各自对应一个栈帧
  • 栈帧是一个内存区域,是一个数据集,维系着方法执行过程中的各种数据信息

栈帧

  • 在一条活动线程中,一个时间点上只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧(current frame),与当前栈对应的方法就是当前方法(current frame),定义这个方法的类就是当前类型(current class)
  • 执行引擎运行的所有字节码指令只针对当前栈帧进行操作
  • 如果在该方法中调用了其他方法,对应的新的栈帧就会被创建出来,放在栈的顶端,成为新的当前栈帧
  • 不同线程所包含的栈帧是不允许互相引用的,即不可能在一个栈帧之中引用另外一个线程的栈帧
  • 如果当前方法调用了其他方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着,虚拟机会丢弃当前栈帧,使得前一个栈帧重新成为当前栈帧
  • java方法有两种返回函授的方式,一种是正常的函数返回,使用return命令;另一种是抛出异常。不管哪一种方式,都会导致栈帧被弹出

每个栈帧存储着

  • 局部变量表
  • 操作数栈
  • 动态连接
  • 方法返回地址
  • 一些附加信息

局部变量表

局部变量表也被称为局部变量数组或本地变量表

定义为一个数字数组,主要用于存储方法参数和定义在方法内的局部变量,这些数据类型包括基本数据类型、对象引用和returnAddress类型

由于局部变量表是建立在线程栈上,是线程的私有数据,因此不存在数据安全问题

局部变量表所需的容量大小是在编译期确定下来的,在方法运行期间是不会改变局部变量表的大小的

slot

局部变量表,最基本的存储单元是slot(变量槽)

在局部变量表里,32位以内的类型只占用一个slot(包括returnAddress类型),64位的类型(long和double)占用两个slot

jvm会为局部变量表中的每一个slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值(如果访问的是64bit的slot,则使用前一个索引)

当一个实例方法被调用的时候,它的方法参数和方法内部定义的局部变量将会按照顺序被复制到局部变量表的每一个slot上

如果当前栈帧是由构造方法或者实例方法创建的,那么该对象引用this会放在index为0的slot处,其余的参数按照参数表顺序继续排列

这也就是为什么静态方法不能使用this的原因,因为没用声明在局部变量表中

栈帧中的局部变量表中的槽位是可以重用的,如果一个局部变量过了其作用域,那么在其作用域之后声明的新的局部变量就可以重用过期局部变量的槽位,从而达到节省资源的目的

操作数栈

每一个独立的栈帧中除了包含局部变量表以外,还包含一个后进后出的操作数栈,也可以称之为表达式栈

操作数栈,在方法执行的过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈(push)/出栈(pop)。操作数栈虽然基于数组实现,但不能按索引方式访问,只能通过出栈和入栈来完成一次数据访问

操作数栈主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间

操作数栈是jvm执行引擎的一个工作区,当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的

每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了

栈中的任何一个元素都可以是任意的java类型(32bit的类型占一个栈深度,64bit的类型占2个栈深度)

如果被调用的方法带有返回值的话,其返回值也将被压入当前栈帧的操作数栈中,并更新pc寄存器中下一条需要执行的字节指令

操作数栈中元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译期间进行验证,同时在类加载过程中的类校验阶段要再次验证

jvm的解释器引擎是基于栈的执行引擎,其中的栈指的就是操作数栈

动态连接

指向运行时常量池的方法引用

每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态连接(dynamic linking)

java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用(symbolic reference)保存在class文件的常量池里。比如:描述一个方法调用了另一个方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用

方法返回地址

存放调用该方法的pc寄存器的值

无论帆帆通过那种方式退出,在方法退出以后都需要返回到该方法被调用的位置

  • 方法正常退出时:调用者的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令地址
  • 方法异常退出时:返回地址是要通过异常表来确定,栈帧中一般不会保持这部分信息

两种最大的区别是:异常退出不会给调用者返回任何的值

本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置pc寄存器值等,让调用者方法继续执行下去

一些附加信息

栈中中还允许携带与jvm实现相关的一些附加信息。例如,对程序调试提供支持的信息

本地方法栈

虚拟机栈用于管理java方法的调用,而本地方法栈用于管理本地方法的调用

本地方法栈,是线程私有的

允许设置成固定或者动态的内存大小

  • 请求的栈容量超过本地方法栈的最大容量,则抛出StackOverflowError
  • 如果设置成动态扩展,且无法申请到足够内存时,则抛出OutOfMemoryError

当某个线程调用一个本地方法时,它就进入了一个全新且不受jvm限制的世界,它和jvm有同样的权限

并不是所有jvm都支持本地方法。因为jvm规范并没有明确要求本地方法栈的使用语言、具体实现方式、数据结构等

在hotspot中,直接将本地方法栈和虚拟机栈合二为一

什么是本地方法

使用native关键字修饰,且没用方法体的方法就是本地方法

一个本地方法就是一个java调用非java代码的接口,该方法的实现由非java语言实现,比如c

一个jvm实例只存在一个堆内存,堆也是java内存管理的核心区域

java堆区在jvm启动的时候即被创建,其空间大小也就确定了。是jvm管理的最大的一块内存空间(大小是可以调节的)

《java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的

所有线程共享java堆,在这里还可以花费线程私有的缓冲区(thread local allocation buffer,tlab)

栈中保存引用,这个引用指向对象或者数组在堆中的位置

方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除

堆,是gc执行垃圾回收的重点区域

堆空间大小设置

  • -Xms:设置堆的初始内存,等价于-XX:InitialHeapSize(设置的是年轻待和老年代)
    • -X:是jvm的运行参数
    • ms:是memory start
  • -Xmx:设置堆的最大内存,等价于-XX:MaxHeapSize。如果堆中的内存超过设置的值,则抛出OutOfMemoryError异常

通常会将-Xms和-Xmx配置相同的值,目标是为了能够在java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能

默认情况下

  • 初始内存大小=物理内存/64
  • 最大内存大小=物理内存/4

查看设置的参数:

  • jps + jstat -gc 进程id
  • -XX:+PrintGCDetails

年轻代和老年代

jvm中的java对象可以分为两类

  • 一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
  • 另一类对象的生命周期却非常长,在某些极端的情况下还能够与jvm的生命周期保持一致

java堆区可以进一步分为年轻代和老年代,其中年轻代又可以分为eden区和survivor0空间和survivor1空间(也叫from区和to区)

配置新生代和老年代的占比

  • 默认-XX:NewRatio=2:表示新生代占1,老年代占2,新生代占整个堆的1/3
  • 可以修改-XX:NewRatio=4:表示新生代占1,老年代占4,新生代占整个堆的1/5

可以使用-Xmn设置新生代最大内存大小(如果这种方式和比例方式冲突,这种方式优先级更高)

设置新生代eden区和两个survivor的占比

在hotspot中,eden空间和另外两个survivor空间默认比例是8:1:1

开发人员可以通过-XX:SurvivorRatio调整这个空间比例

可以使用-XX:-UseAdaptiveSizePolicy关闭自适应内存分配策略

对象分配过程

  1. new的对象先放在伊甸园区。此区有大小限制
  2. 当伊甸园区空气填满时,程序又需要创建对象,jvm的垃圾回收器将对伊甸园区进行垃圾回收(minor gc),将伊甸园区中的不再被其他对象所引用的对象进行销毁。再加载新的对象放在伊甸园区
  3. 然后将伊甸园区的剩余对象移动到幸存者0区
  4. 如果再次触发垃圾回收,此时上次幸存下来的放到幸存者0区的,如果没用回收,就会放到幸存者1区
  5. 如果再次经历垃圾回收,此时会重新放回幸存者0区,接着再去幸存者1区
  6. 默认15次后会进入到养老区(通过-XX:MaxTenuringThreshold进行设置)
  7. 在养老区,相对悠闲。当养老区内存不足时,再次触发gc(major gc),进行养老区的内存清理
  8. 若养老区执行了gc后依然无法进行对象的保存,抛出oom异常

内存分配规则

  • 优先分配到eden
  • 大对象直接分配到老年代
  • 长期存活的对象分配到老年代
  • 动态对象年龄判断:如果幸存者区中所有对象大小的总和大于survivor空间的一半,年龄大于或等于该年龄的对象可用直接进入老年代,无需等到MaxTenuringThreshold中要求的年龄
  • 空间分配担保-XX:HandlePromotionFailure,幸存者区无法容纳的对象,放入老年代

gc

针对hotspot的实现,它里面的gc按照回收区域又分为两大种类:一种是部分收集(partial gc),一种是整堆收集(full gc)

  • 部分收集:不是完整收集各个java堆的垃圾收集。其中又分为
    • minor gc/young gc:只是新生代的垃圾收集
    • major gc/old gc:只是老年代的垃圾收集(只有cms gc会有单独的老年代行为)
    • mixed gc:混合收集,收集整个新生代和部分老年代的垃圾收集(只有 g1 gc会有这种行为)
  • 整堆收集:收集整个java堆和方法区的垃圾收集

minor gc触发机制

  • 当年轻代空间不足时,就会触发minor gc,这里的年轻代指的是eden区满,survivor满不会触发gc(每次minor gc会清理年轻代的内存)
  • 因为java对象大多数都具备朝生夕死的特性,所以minor gc非常频繁,一般回收速度也比较快
  • minor gc会引发stw,暂停其他用户的线程,等待垃圾回收结束,用户线程才恢复运行

major gc触发机制

  • 出现major gc,经常会伴随至少一次的minor gc(但并非绝对,在ParallelScavenge收集器的收集策略里就有直接进行major gc的策略)
  • major gc的速度一般会比minor gc慢10倍以上,stw的时间更长
  • 如果major gc后,内存还不足,就报oom了

full gc触发机制

  • 调用System.gc()时,系统建议执行full gc,但不是必须执行
  • 老年代空间不足
  • 方法区空间不足
  • 通过minor gc后进入老年代的平均大小大于老年代的可用内存
  • 由eden区,from区向to区复制时,对象大小大于to区可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小

full gc是开发或调优中尽量要避免的。这样暂停时间会短一些

tlab

thread local allocation buffer

  • 堆区是线程共享区域,任何线程都可用访问到堆区的共享数据
  • 由于对象实例的创建在jvm中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的
  • 为避免多个线程操作同一地址,需要使用加锁等机制,进而影响分配速度

什么是tlab

  • 从内存模型而不是垃圾收集的角度,对eden区继续进行划分,jvm为每个线程分配了一个私有缓冲区域,它包含在eden区内
  • 多个线程同时分配内存时,使用tlab可用避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略
  • 尽管不是所有的对象实例都能够在tlab中成功分配内存,但jvm确实将tlab作为内存分配的首选
  • 在程序中,开发人员可以通过选项-XX:UseTLAB设置是否开启tlab空间(默认开启)
  • 默认情况下,tlab空间非常小,仅占整个eden的1%(可以通过-XX:TLABWasteTargetPercent设置tlab空间所占用eden空间的百分比大小)
  • 一旦对象在tlab空间分配失败,jvm就会尝试通过加锁机制确保数据操作的原子性,从而直接在eden空间分配

openjdk衍生出来的jvm都提供了tlab的设计

常用参数

参数 说明
-XX:+PrintFlagsInitial 查看所有的参数默认初始值
-XX:+PrintFlagsFinal 查看所有的参数的最终值(可能会存在修改)
-Xms 初始堆空间(默认为物理内存的1/64)
-Xmx 最大堆空间内存(默认物理内存的1/4)
-Xmn 设置新生代的大小(初始值及最大值)
-XX:NewRatio 配置新生代和老年代在堆的占比(默认2)
-XX:SurvivorRatio 设置新生代中Eden和s0/s1空间的比例(默认8)
-XX:MaxTenuringThreshold 设置新生代垃圾的最大年龄(默认15)
-XX:+PrintGCDetails 输出详细的GC处理日志(打印gc简要信息:-XX:+PrintGC-verbose:gc
-XX:HandlePromotionFailure 是否设置空间分配担保,jdk7之后该参数失效,默认为true

空间分配担保

在发生minor gc之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象的总空间

  • 如果大于,则此次minor gc是安全的
  • 如果小于,则会查看HandlePromotionFailure设置的值是否允许担保失败
    • 如果值为true,那么会继续检查老年代最大可用连续空间是否大于历次晋升到老年代的对象的平均大小
      • 如果大于,则尝试进行一次minor gc,但这次minor gc依然是有风险的
      • 如果小于,则改为进行一次full gc
    • 如果值为false,则改为进行一次full gc

逃逸分析

  • 如何将堆上的对象分配到栈,需要使用逃逸分析手段
  • 这是一种可以有效减少java程序中同步负载和内存堆分配压力的跨函数全局数据流分析算法
  • 通过逃逸分析,hotspot编译期能够分析出一个新的对象的引用的使用范围从而决定是否要将这个对象分配到堆上
  • 逃逸分析的基本行为就是分析对象动态作用域
    • 当一个对象再方法中被定义后,对象只再方法内部使用,则认为没用发生逃逸
    • 当一个对象再方法中被定义后,它被外部方法所引用,则认为发生逃逸,例如作为调用参数传递到其他地方中
  • 没法发生逃逸的对象,则可以分配到栈上,随着方法执行的结束,栈空间就被移除

从jdk7开始默认开启了逃逸分析

如果是较早版本可以使用-xx:+DoEscapeAnalysis显示的开启逃逸分析

通过-XX:+PrintEscapeAnalysis查看逃逸分析的筛选结果

代码优化

  • 栈上分配:jit编译期在编译期根据逃逸分析,发现一个对象如果并没有逃逸出方法的话,就可能被优化成栈上分配。分配完成后,继续在调用栈内执行,线程结束后,栈空间被回收,局部变量对象也被回收。这样就无需进行垃圾回收了(hotspot暂不支持)

  • 同步省略:在动态编译同步块的时候,jit编译期可以借助逃逸分析来判断同步块所使用的锁对象是否只能够被一个线程访问。如果是,则jit编译期在编译这个同步块的时候就会取消对这部分代码的同步。这样就能大大提高并非和性能。这个取消同步的过程就叫同步省略,也叫锁消除

  • 分离对象或标量替换:有的对象可能不需要作为一个连续的内存结构存储在也可以被访问到,那么对象的部分(或全部)可以不存储在内存,而是存储在栈中

    • 标量:是指一个无法再分解成更小的数据的数据。java中原始数据类型就是标量

      相对的,可以分解的叫做聚合量,java中对象就是聚合量

    • 如果讲过逃逸分析,发现一个对象不会被外界访问的话,那么经过jit优化,就会把这个对象拆解成若干个其中包含的成员来代替

    • 通过参数-XX:+EliminateAllOcations开启标量替换(默认打开),允许将对象打散分散分配再栈上

方法区

《java虚拟机规范》中明确说明:“尽管所有的方法区在逻辑上是属于堆的一部分,但一些简单的实现可能不会选择去进行垃圾收集或者进行压缩”,但对于hotspot jvm而言,方法区还有一个别名叫做non-heap(非堆),目的就是要和堆分开。所以,方法区看作是一块独立于java堆的内存空间

  • 方法区和堆一样,是各个线程共享的内存区域
  • 方法区在jvm启动的时候被创建,并且它的实际的物理内存内存空间和堆一样都是可以不连续的
  • 方法区的大小,跟堆空间一样,可以选择固定大小或者可扩展
  • 方法区的大小决定了系统可以保存多少个类,如果系统定义了太多的类,导致方法区溢出,虚拟机同样会抛出内存溢出错误(oom)
  • 关闭jvm就会释放这个内存区域

大小设置

方法区的大小不必是固定的,jvm可以根据应用的需要动态调整

jdk7及以前:

  • -XX:PermSize:设置永久代初始分配空间。默认值是20.75m
  • -XX:MaxPermSize:设置永久代的最大可分配空间。32位机器是64m,64位机器是82m

jdk8及以后:

  • 使用-XX:MetaspaceSize-XX:MaxMetaspaceSize指定,替代上述原有的两个参数
  • 默认值依赖于平台,Windows下:MetaspaceSize是21m,MaxMetaspaceSize是物理内存

对于一个64位的服务器端jvm来说,其默认的-XX:MetaspaceSize值为21mb。这就是初始的高水位线,一旦触及这个水位线,full gc将会被触发并卸载没用的类,然后这个高水位线会被重置。新的高水位线的值取决于gc后释放了多少元空间

如果初始化的高水位线设置过低,上述调整会发生很多次。建议将-XX:MetaspaceSize设置为一个相对较高的值

内部结构

方法区用于存储被虚拟机加载的类型信息、常量、静态变量、即时编译期编译后的代码缓存等

类型信息

堆每个加载的类型(类、接口、枚举、注解),jvm必须在方法区中存储以下类型信息

  • 这个类型的完整有效名称(全名=包名.类名)
  • 这个类型直接父类的完整有效名(对于接口或Object,都没用父类)
  • 这个类型的修饰符
  • 这个类型直接接口的一个有序列表

域(属性)信息

  • jvm必须在方法区中保存类型的所有域的相关信息以及声明顺序
  • 域的相关信息包括:域名称、域类型、域修饰符

方法信息

  • 方法名称
  • 方法的返回类型
  • 方法参数的数量和类型(按顺序)
  • 方法的修饰符
  • 方法的字节码、操作数栈、局部变量表及大小(abstract和native除外)
  • 异常表(abstract和native除外):每个异常处理的开始位置、结束位置、代码处理在程序计数器中的偏移地址、被捕获的异常类的常量池索引

non-final的类变量

  • 静态变量和类关联在一起,随着类的加载而加载,他们成为类数据逻辑上的一部分
  • 类变量被类的所有实例共享,即使没用类实例时你也可以访问它

全局常量(static final)

被声明为final的类变量的处理方式则不同,每个全局常量在编译的时候就会被分配

运行时常量池

  • 运行时常量池是方法区的一部分
  • 常量池是class文件的一部分,用于存放编译期生成的各种字面量于符号引用,这部分内容将在类加载后存放到方法区的运行时常量池
  • 在加载类和接口到虚拟机后,就会创建对应的运行时常量池
  • jvm为每个已加载的类型都维护一个常量池。池中的数据项像数组一样,是通过索引访问的
  • 运行时常量池中包含多种不同的常量,包括编译期就以及明确的数字字面量,也包括到运行期解析后才能获得的方法或字段引用。此时不再是常量池中的符号地址了,这里会转为真实地址
  • 运行时常量池,型对于class常量池的一项重要特征是:具备动态性。如string.intern()
  • 运行时常量池类似于传统编程语言中的符号表(symbol table),但是它所包含的数据比符号表更丰富一些
  • 当创建类或接口的运行时常量池时,如果构造运行时常量池,如果构造运行时常量池所需的空间超过了方法区所能提供的最大值,则jvm会抛出oom异常

常量池

一个有效的字节码文件中除了包含类的版本信息、字段、方法以及接口等描述信息外,还包含一项信息就是常量池表(constant pool table),包含各种字面量和对类型、域和方法的符号引用

常量池存储类型:数量值、字符串值、类引用、字段引用、方法引用

常量池可以看作是一张表,虚拟机指令根据这个张常量表找到要执行的类名、方法名、参数类型、字面量等类型

演进

首先,只有hotspot才有永久代

版本 变化
6及之前 有永久代,静态变量存在永久代
7 有永久代,但以及逐步“去永久代”,字符串常量池、静态变量移除,保存在堆中
8及之后 无永久代,类信息、字段、方法、常量保存在本地内存的元空间,但字符串常量池、静态变量仍然在堆

StringTable为什么要调整:

jdk7中加stringTable放到了堆空间中。因为永久代的回收效率很低,在full gc的时候才会触发。而full gc是老年代空间不足,永久代不足时才会触发。这就导致stringTable回收效率不高。而我们开发中会有大量的字符串被创建,回收效率低,导致永久代内存不足。放到堆里,能及时回收

垃圾收集

方法区的垃圾收集主要收集两部分的内容:常量池中废弃的常量和不再使用类型

常量

方法区中主要存放的两大常量:字面量和符号引用

字面量比较接近java语言层面常量的概念,如文本字符串、被声明为final的常量值等。而符号引用则属于编译原理方面的概念,包括下面三类常量:

  1. 类和接口的全限定名
  2. 字段的名称和描述符
  3. 方法的名称和描述符

hotspot虚拟机堆常量池的回收很明确,只要常量池中没用被任何地方引用,就可以回收

回收常量于回收java堆中的对象非常类似

判断一个常量是否废弃相对简单,而要判断一个类型是否属于不再使用的条件就比较苛刻了,需要同时满足以下三个条件

  1. 该类所有的实例都以及被回收
  2. 加载该类的加载器以及被回收
  3. 该类对应的Class对象没用在任何地方被引用

满足上述三个条件的类,仅仅允许被回收,而不像对象一样,没用引用了就必然会回收

直接内存

  • 直接内存不是虚拟机运行时数据区的一部分,也不是《java虚拟机规范》中定义的内存区域
  • 直接内存是java堆外的、直接向系统申请的内存空间
  • 来源于nio,通过存在堆中的DirectByteBuffer操作native内存
  • 通常,访问直接内存的速度会优于java堆。即读写性能高
    • 因此处于性能考虑,读写频繁的场景可能会考虑使用直接内存
    • java的nio库允许java程序使用直接内存,用于数据缓冲区
  • 直接内存也可能导致oom异常
  • 由于直接内存在java堆外,因此它的大小不会直接受限于-Xmx指定的最大堆大小,但是系统内存是有限的,java堆和直接内存的总和依然受限于操作系统能给出的最大内存
  • 缺点
    • 分配回收成本较高
    • 不受jvm内存回收管理
  • 直接内存大小可用通过MaxDirectMemorySize设置
  • 如果不指定,默认与堆的最大值-Xmx参数值一致