引言
-
《JVM 内存分析工具 MAT 的深度讲解与实践——入门篇》介绍 MAT 产品功能、基础概念、与其他工具对比、Quick Start 指南。
-
《JVM 内存分析工具 MAT 的深度讲解与实践——进阶篇》展开并详细介绍 MAT 的核心功能,并在具体实战场景下讲解帮大家加深体会。
-
《JVM 内存分析工具 MAT 的深度讲解与实践——高阶篇》总结复杂内存问题的系统性分析方法,并通过一个综合案例提升大家的实战能力。
一、MAT 工具简介
MAT(全名:Memory Analyzer Tool),是一款快速便捷且功能强大丰富的 JVM 堆内存离线分析工具。其通过展现 JVM 异常时所记录的运行时堆转储快照(Heap dump)状态(正常运行时也可以做堆转储分析),帮助定位内存泄漏问题或优化大内存消耗逻辑。
1.1 MAT 使用场景及主要解决问题
-
内存溢出,JVM堆区或方法区放不下存活及待申请的对象。如:高峰期系统出现 OOM(Out of Memory)异常,需定位内存瓶颈点来指导优化。
-
内存泄漏,不会再使用的对象无法被垃圾回收器回收。如:系统运行一段时间后出现 Full GC,甚至周期性 OOM 后需人工重启解决。
-
内存占用高。如:系统频繁 GC ,需定位影响服务实时性、稳定性、吞吐能力的原因。
1.2 基础概念
Heap Dump:Java 进程堆内内存在一个时间点的快照,支持 HPROF 及 DTFJ 格式,前者由 Oracle 系列 JVM 生成,后者是 IBM 系列 JVM 生成。其内容主要包含以下几类:
-
对象实例信息:对象所属类名、基础类型和引用类型的属性等。
-
所有类信息:类加载器、类名、继承关系、静态属性等。
-
GC Root:GC Root 代表通过可达性分析来判定 JVM 对象是否存活的起始集合。JVM 采用追踪式垃圾回收(Tracing GC)模式,从所有 GC Roots 出发通过引用关系可以关联的对象就是存活的(所以不可回收),其余的不可达的对象(Unreachable object:如果无法从 GC Root 找到一条引用路径能到达某对象,则该对象为Unreachable object)可以回收。一般是未执行完的线程自身,或运行线程的调用栈上的对象(如局部变量、方法参数)、System class loader 加载的类、native code 保留的活动对象等。
-
线程栈及局部变量:快照生成时刻的所有线程的线程栈帧,以及每个线程栈的局部变量。
Shallow Heap:代表一个对象结构自身的大小,不包括其属性引用对象所占的内存。如 java.util.ArrayList 对象的 Shallow Heap 包含8字节的对象头、8字节的对象数组属性 elementData 引用 、 4字节的 size 属性、4字节的 modCount 属性(从 AbstractList 继承及对象头占用内存大小),有的对象可能需要加对齐填充但 ArrayList 自身已对齐不需补充,注意不包含 elementData 具体数据占用的内存大小。
Retained Set:一个对象的 Retained Set,指的是该对象被 GC 回收后,所有能被回收的对象集合(如下图所示,G的 Retain Set 只有 G 并不包含 H,原因是虽然 H 也被 G 引用,但由于 H 也被 F 引用 ,G 被垃圾回收时无法释放 H);另外,当该对象无法被 GC 回收,则其 Retained set 也必然无法被 GC 回收。
Retained Heap:一个对象被 GC 回收后,可释放的内存大小,等于释放对象的 Retained Heap 中所有对象的 Shallow Heap 的和(如下图所示,E 的 Retain Heap 就是 G 与 E 的 Shallow Heap 总和,同理不包含 H)。
Dominator tree:如果所有指向对象 Y 的路径都经过对象 X,则 X 支配(dominate) Y(如下图中,C、D 均支配 F,但 G 并不支配 H)。Dominator tree 是根据对象引用及支配关系生成的整体树状图,支配树清晰描述了对象间的依赖关系,下图左的 Dominator tree 如下图右下方支配树示意图所示。支配关系还有如下关系:
-
Dominator tree 中任一节点的子树就是被该节点支配的节点集合,也就是其 Retain Set。
-
如果 X 直接支配 Y,则 X 的所有支配节点均支配 Y。
-
outgoing references:对象引用的外部对象(注意不包含对象的基本类型属性。基本属性内容可在 inspector 查看)。
-
incoming references:直接引用了当前对象的对象,每个对象的 incoming references 可能有 0 到多个。
二、MAT 功能概述及对比
2.1 MAT 功能概述
-
全局概览信息:堆内存大小、对象个数、类的个数、类加载器的个数、GC root 个数、线程概况等全局统计信息。
-
Histogram:罗列每个类实例的内存占比,包括自身内存占用量(Shallow Heap)及支配对象的内存占用量(Retain Heap),支持按 package、class loader、super class、class 聚类统计,最常用的功能之一。
-
Dominator tree:按对象的 Retain Heap 排序,也支持按多个维度聚类统计,最常用的功能之一。
-
Leak Suspects:直击引用链条上占用内存较多的可疑对象,可解决一些基础问题,但复杂的问题往往帮助有限。
-
Top Consumers:展现哪些类、哪些 class loader、哪些 package 占用最高比例的内存。
类别二、对象间依赖
-
References:提供对象的外部引用关系、被引用关系。通过任一对象的直接引用及间接引用详情(主要是属性值及内存占用),进而提供完善的依赖链路详情。
-
Dominator tree:支持按对象的 Retain Heap 排序,并提供详细的支配关系,结合 references 可以实现大对象快速关联分析;
-
Thread overview:展现转储 dump 文件时线程栈帧等详细状态,也提供各线程的 Retain Heap 等关联内存信息。
-
Path To GC Roots:提供任一对象到 GC Root 的链路详情,帮助了解不能被 GC 回收的原因。
类别三、对象状态
-
最核心的是通过 inspector 面板提供对象的属性信息、类继承关系信息等数据,协助分析内存占用高与业务逻辑的关系。
-
集合状态的检测,如:通过 ArrayList 或数组的填充率定位空集合空数组造成的内存浪费、通过 HashMap 冲突率判定 hash 策略是否合理等。
类别四、条件检索
-
OQL:提供一种类似于SQL的对象(类)级别统一结构化查询语言。(举例,查找 size=0 且未使用过的 ArrayList:select * from java.util.ArrayList where size=0 and modCount=0;查找所有的String的length属性的:select s.length from instanceof String s)
-
内存分布及对象间依赖的众多功能,均支持按字符串检索、按正则检索等操作。
-
按虚拟内存地址寻址,根据对象的十六进制地址查找对象。
以上是 MAT 最核心的功能,为了便于记忆与回顾,整理了如下脑图,其中红色框标红的内容是最最常用的功能,熟练掌握基本可以 Cover 80%以上的离线堆内内存分析问题。
2.2 常见内存分析工具对比
注:下图中 Y 表示支持,N 表示不支持,时间截至发稿前。
产品功能 |
MAT |
JProfiler |
Visual VM |
jhat |
jmap |
hprof |
对象间关联、深浅堆、GC Root、支配树、线程分析 |
Y |
N |
N |
N | N |
N |
离线分析 |
Y |
N |
Y |
Y |
N | N |
内存实时分配情况 |
N |
Y | Y | Y |
Y | Y |
OQL |
Y |
N |
Y |
N |
N | N |
内存分配堆栈、热点 |
N |
Y |
N | N |
N | N |
堆外内存分析 |
N |
N | N |
N | N |
N |
注 2:一般堆外内存溢出排查可结合 gperftools 与 btrace 排查,此类文章较多不展开介绍。
三、Quick Start 及使用技巧
3.1 Quick Start
-
使用 JDK 提供的 jmap 工具,命令是 jmap -dump:format=b,file=<dumpfile> <pid>。当进程接近僵死时,可以添加 -F 参数强制转储:jmap -F -dump:format=b,file=<dumpfile> <pid>。
-
本地运行的 Java 进程,直接在 MAT 使用 File → accquire heap dump 功能获取。
-
启动 Java 进程时配置JVM参数:-XX:-HeapDumpOnOutOfMemoryError,当发生 OOM 时无需人工干预会自动生成 dump文件。指定目录用 -XX:HeapDumpPath=<filepath> 来设置。
5. MAT 呈现概要视图(Overview),包含三个部分:
-
全局概览信息,堆内存大小、类数量、实例数量、Class Loader数量。
-
Unreachable Object Histogram,展现转储快照时可被回收的对象信息(一般不需要关注,除非 GC 频繁影响实时性的场景分析才用到) -
Biggest Objects by Retained Size,展现经过统计过的哪几个实例所关联的对象占内存总和较高,以及具体占用的内存大小,一般相关代码比较简单情况下,往往可以直接分析具体的引用关系异常,如内存泄漏等。此外也包含了最大对象和链接支持继续深入分析。
6. 继续使用 MAT 各种工具。如果代码比较复杂,需要继续使用 MAT 各种工具并结合业务代码进一步分析内存异常的原因。最常用的几项如下(具体案例、场景、使用方式在《JVM 内存分析工具 MAT 的深度讲解与实践——进阶篇》详细介绍):
-
查看堆整体情况的:Histogram、Dominator tree、Thread details等(各项功能入口如下)。
-
MAT 分析过的 Top Consumers 、Leak Suspects等。
-
对象级别分析的 Path to GC Root、incoming references、outgoing references 等。
3.2 使用技巧及注意事项
-
先禁用入口流量,再执行 dump 动作。 -
选择影响较小时 dump 内存。 -
使用脚本捕获指定事件时 dump 内存。
-
大文件分析方法:开发机配置不足无法分析,可在服务器先执行分析后,基于分析后的索引文件直接查看结果,一般 dump 文件不高于分析机主存 1.2 倍可直接在开发机分析;若 dump 文件过大,可以使用 MAT 提供的脚本在配置高的高配机器先建立索引再直接展现索引分析结果(一般是 Linux 机器,可以使用 MAT 提供的脚本:./ParseHeapDump.sh $HEAPDUMP,堆信息有 unreachable 标记的垃圾对象,在 dump 时也保存了下来,默认不分析此部分数据,如需要在启动脚本 ParseHeapDump.sh 中加入:-keep_unreachable_objects)。
-
如果不关注堆中不可达对象,使用“live”参数可以减小文件大小,命令是 jmap -dump:live,format=b,file=<dumpfile> <pid>
-
Dump 前主动手动执行一次 FULL GC ,去除无效对象进一步减少 dump 堆转储及建立索引的时间。
-
Dump文件巨大,建立索引后发现主视图中对象占用内存均较小,这是因为绝大部分对象未被 GC Roots 引用可释放。
-
Dump 时注意指定到空间较大的磁盘位置,避免打满分区影响服务。
-
建立 dump 索引机器的磁盘空间需要足够大,一般至少是 dump 文件的两倍,因为生成的中间索引文件也较大,如下图:
四、其他
-
JDK 版本问题:如遇“VMVersionMismatchException”,使用启动目标进程的 JDK 版本即可。
-
部分核心功能主界面未展现,问题足够复杂时需打开,如 MAT 默认不打开 inspector,如需根据对象数据值做业务分析,建议打开该视图。
-
配置了 HeapDumpOnOutOfMemoryError 参数,但 OutOfMemoryError 时但没有自动生成 dump 文件,可能原因有三个:
-
应用程序自行创建并抛出 OutOfMemoryError
-
进程的其他资源(如线程)已用尽
-
C 代码(如 JVM 源码)中堆耗尽,这种可能由于不同的原因而出现,例如在交换空间不足的情况下,进程限制用尽或仅地址空间的限制,此时 dump 文件分析并无实质性帮助。
-
至此本文讲解了 MAT 实践必备的初级内容,在下一篇《JVM 内存分析工具 MAT 的深度讲解与实践——进阶篇》会展开并详细介绍 MAT 丰富的核心功能,每个功能点讲解都会从具体场景聊起,帮助大家在实战场景下加深体会实现进阶。
参考内容
MAT官网:https://help.eclipse.org/2020-09/index.jsp
本文仅供学习!所有权归属原作者。侵删!文章来源: Q的博客 -Q的博客 :http://mp.weixin.qq.com/s/6_9GRSaUm-6qePP0OBdclg
文章评论