spring boot 引起的“堆外内存泄漏”
yuyutoo 2024-10-11 23:54 13 浏览 0 评论
背景
组内一个项目最近一直报swap区域使用过高异常,笔者被叫去帮忙查看原因。发现配置的4G堆内内存,但是实际使用的物理内存高达7G,确实有点不正常,JVM参数配置是:
-XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M -XX:+AlwaysPreTouch -XX:ReservedCodeCacheSize=128m -XX:InitialCodeCacheSize=128m, -Xss512k -Xmx4g -Xms4g,-XX:+UseG1GC -XX:G1HeapRegionSize=4M
复制
但是使用的虚拟内存和物理内存使用情况如下:
排查过程
步骤一:先使用java层面的工具定位是不是堆内内存、code区域或者使用unsafe.allocateMemory和DirectByteBuffer申请的堆外内存
笔者在项目中添加“-XX:NativeMemoryTracking=summary ”JVM参数重启项目,查看查到的内存分布如下:
发现这个命令显示的committed的远内存小于物理内存。因为之前就对NativeMemoryTracking有所了解和测试,知道NativeMemoryTracking可以追踪到堆内内存、code区域、通过unsafe.allocateMemory和DirectByteBuffer申请的内存,但是追踪不到其他native code(c代码)申请的堆外内存。这一步也可以使用arthas去查看:
为了防止误判,笔者适应了pmap查看内存分布,发现大量的64M的地址,而这些地址空间不在NativeMemoryTracking所给出的地址空间里面。基本上就断定就是这些64M的内存导致的。
步骤二:使用系统层面的工具定位堆外内存
因为基本上确定是native code引起之后,java层面的工具基本上就失效了,只能使用系统层面的工具去查找问题。首先使用了gperftools去查看,截图如下:
上图可以看出,使用malloc申请的的内存最高到3G之后就释放了,之后始终维持在700M-800M。第一反应就是难道native code 中没有使用malloc申请,直接使用mmap/brk申请的?(gperftools原理就使用动态链接的方式替换了操作系统默认的内存分配器(glibc))
直接使用strace对mmap/brk进行追踪发现,并没有申请内存,此时陷入了比较迷茫的状态。于是想着能不能看看内存里面是啥东西,就用gdb去dump这些64M的内存下来看看,内容如下:
从内容上来看像解压后的jar信息。读取jar信息应该是在项目启动的时候,那么在项目启动之后使用strace作用就不是很大了,于是在项目启动的时候就使用strace,发现确实申请了很多64M内存空间,截图如下:
使用该mmap申请的地址空间在pmap对应如下:
根据strace显示的线程Id,去jstack一下java进程,找到线程栈如下:
这里基本上就可以看出问题来了,这里使用了Reflections进行扫包,底层使用了spring boot loader去加载了jar。因为需要解压jar肯定需要Inflater类,这个需要用到堆外内存,然后使用btrace去追踪这个方法如下:
在代码中找到扫包的地方,发现没有配置扫包路径,默认的是扫描所有jar,修改为扫描特定的jar路径。上线测试,内存正常,问题修复。
步骤三:为什么堆外内存没有释放掉呢
到步骤二的时候,问题已经解决了,但是有几个疑问:
为什么堆外内存没有释放
为什么内存大小都是64M,jar大小不可能这么大,而且都是一样大
为什么gperftools最终显示使用的的内存大小是700M左右,解压包真的没有使用malloc申请内存吗?
直接看了一下spring boot loader那一块源码,发现spring对jdk的JarFile的进行了包装。他使用Inflater却没有手动去释放,依赖于Inflater中的finalize机制,在gc的时候释放。于是怀疑gc的时候没有调用finalize。带着这样的怀疑,我把Inflater进行包装在spring loader里面替换成我包装的Inflater,在finalize进行打点监控,发现finalize在young gc 的时候确实被调用了啊。去看了一下Inflater对应的C代码,初始化的使用了malloc 申请内存,调用end的时候调用了free去释放内存了。于是怀疑free的时候没有真正释放内存。然后想着把spring boot包装JarFile 替换成jdk 自带的 JarFile,发现替换之后内存问题解决。
然后再返过来看gperftools的内存分布情况。发现使用spring loader的时候,内存使用一直在增加,突然某个点内存使用下降了好多。这个点应该就是gc引起的,内存应该释放了。但是操作系统层面没有看到内存变化,怀疑没有释放到操作系统,被内存分配器持有了。
发现和不使用gperftools内存地址分布差别很明显,2.5G地址使用smaps发现他是属于native stack。物理内存地址分布如下:
到此基本上可以确定是内存分配器在捣鬼,搜索了一下glibc 64M,发现从glibc 从2.11 开始对每个线程引入内存池(64位机器大小就是64M内存),原文如下:
按照文中所说去修改MALLOC_ARENA_MAX环境变量,发现没什么效果,去查看tcmalloc(gperftools使用的内存分配器)也使用了内存池方式。
因为glibc 内存分配器代码太多,懒得去看,为了验证就自己简单写个内存分配器。使用动态链接替换掉glibc 的内存分配器,代码如下(因为都是从main中分配内存,没有考虑线程安全,realloc,calloc代码类似没截图了):
通过在自定义分配器当中埋点可以发现其实程序启动之后程序实际申请的堆外内存其实始终在700M-800M之前,tcmalloc 也有相关埋点也是在700M-800M左右。但是从操作系统角度来看进程占用的内存差别很大(这里只是监控堆外内存)。
笔者做了一下测试,使用不同分配器进行不同程度的扫包,占用的内存如下:
为什么自定义的malloc 申请800M,最终占用的物理内存在1.7G呢?
因为自定义内存采用的是mmap分配内存,mmap分配内存的单位是page,也就是page的整数倍,笔者使用的系统pagesize=4k,也就说如果用户申请了1一个字节,也会分配一个page,存在着巨大的空间浪费,可以通过埋点查看系统申请了多少页。埋点发现最终在536k左右吧。那实际上向系统申请的内存 = 512k * 4k = 2G,为什么这个数据由大于1.7G内,因为操作系统采取的是延迟加载的方式,也就是说通过mmap向系统申请内存的时候系统仅仅返回地址并没有分配真实的物理地址,只有在使用的时候系统产生一个缺页中断然后在加载这个page到内存当中,这也是使用pmap看到的物理和虚拟内存的区别。
总结
整个内存分配的流程如上图。在扫描包的时候,spring loader不会主动去释放堆外内存,导致在扫描过程中,堆外内存占用量一直持续飙升。当发生gc 的时候会依赖于finalize机制一并去释放了堆外内存。但是glibc为了性能考虑,并没有真正把内存归返到操作系统,而是留下来当做内存池了,导致应用层以为发生了“内存泄漏”。
转?自?: perfma性?能?领?域垂?直社?区
原?文?链?接: https://toutiao.io/k/o802afr
相关推荐
- 网络规划建设原来也可以这么简单!
-
废话少说,直接上干货。天气炎热,请各位看官老爷静心阅读。整体思路下图是关于网络建设的所有相关领域,接下来我为大家逐一讲解。网络分层...
- 网络规划设计师笔记-第 1 章 计算机网络原理
-
计算机网络原理1.1计算机网络概论(P1-10)...
- 别输在远见上,网工这样做职业规划,比啥都强
-
01职业中的规划,人生中的buff“职业规划“这个词,其实对很多年轻人,包括曾经年轻的我来说,都不屑一提。...
- 网络规划设计师学习中(个人自学笔记分享1),有一起学习的吗?
-
网络规划设计师,上午考试内容学习:第一章:计算机网络概述(上部分):如果你也在一起学习,那么我们来一起学习吧!坚持1年,争取明年一次性通过!...
- 在微服务中使用 ASP.NET Core 实现事件溯源和 CQRS
-
概述:事件溯源和命令查询责任分离(CQRS)已成为解决微服务设计的复杂性的强大架构模式。基本CQRS表示形式在本文中,我们将探讨ASP.NETCore如何使你能够将事件溯源和CQRS...
- 用 Nginx 部署 ASP.NET Core 应用程序
-
用Nginx部署ASP.NETCore应用程序步骤如下:在Linux中安装.NETCore运行时和Nginx:...
- Asp.net Core启动流程讲解(一)(asp.net core 入门)
-
asp.netcore默认项目包括项目根目录级的Startup.cs、Program.cs、appsettings.json(appsettings.Development.json)launch...
- 十天学会ASP之第五天(十天学会asp教程)
-
学习目的:学会数据库的基本操作1(写入记录)数据库的基本操作无非是:查询记录,写入记录,删除记录,修改记录。今天我们先学习写入记录。先建立一个表单:<formname="form1"met...
- ASP.NET Core 的 WebApplication 类
-
ASP.NETCore提供了3个主机类(Host)。这些类用于配置应用、管理生命周期和启动Web服务。...
- ASP.NET Core中的键控依赖注入(.net依赖注入原理)
-
大家好,我是深山踏红叶,今天我们来聊一聊ASP.NETCore中的FromKeyedServices,它是在.Net8中引入的。这一特性允许通过键(如字符串或枚举)来注册和检索依赖注入(D...
- Asp.net常用方法及request和response-a
-
asp.net教程asp.net常用方法:1、Request.UrlReferrer请求的来源,可以根据这个判断从百度搜的哪个关键词、防下载盗链、防图片盗链,可以伪造(比如迅雷)。(使用全局一般处理...
- asp.net常考面试题(aspnet题库)
-
asp.net常考面试题一,列举ASP.Net页面之间传递值的几种方式?1,使用QueryString,如:......?id=1;response.Redirect()......2,使用Sessi...
- 在Windows系统搭建.NET Core环境并创建运行ASP.NET网站
-
微软于6月27日在红帽DevNation峰会上正式发布了.NETCore1.0、ASP.NET1.0和EntityFrameworkCore1.0,其将全部支持Windows、OSX和...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)