线上内存溢出分析 内存溢出案例
yuyutoo 2024-10-13 09:13 7 浏览 0 评论
线上内存溢出分析
系统变慢,打开页面变卡,使用top命令查看cpu和内存情况后,发现在使用系统时,CPU 飙高。
针对此问题,展开排查。
排查产生原因
首先,使用 arthas 工具或者使用 jstack 查看 java 运行中的线程状态,查看哪些线程占用cpu过高,在使用时,发现为gc线程。
然后,使用 jstat 或者 arthas 中的 dashboard 命令 进行确认,发现堆中新生代老年代空间已满,每过十几秒就在进行一次full gc。所以,可以分析出CPU飙高的原因为内存溢出。
内存溢出原因分析
因为要进行内存溢出情况,需要拿出堆转储信息,所以,在无人使用系统时,使用 jmap 命令获取堆转储信息:
jmap -dump:format=b,file=heapdump.hprof pid
需要注意的是,使用 jmap 时,会使 JVM 处于 STW(stop the world) 状态,所以尽量不要在生产上有人使用时使用该命令,否则会导致非常长的时间停顿。
在拿到堆转储信息后,使用MAT(Memory Analyzer Tool)工具进行分析,装载文件后,得到如下图中的内容:
发现DefaultSVNRepositoryPoll引出的对象占用了3.6个G的空间(整个JVM分配空间为4个G),所以可以确定,是这个类生产 RunnableSecheduleFuture 对象的问题。
对 DefaultSVNRepositoryPool 进行分析,找问题
在前面已经分析出是DefaultSVNRepositoryPool引出的内存溢出,所以直接在IDEA中搜索到这个类,进入到该类,查看是否有相关 RunnableSecheduleFuture 方法。
- 首先确认哪里引用到了该类
一切还要从SVN上传文件说起,SVN上传文件有几个步骤:
//1. 判断路径是否存在;
SVNClientManipulator rp = new SVNClientManipulator(user);
//2. 得到版本库;
SVNRepository rps = rp.getRepository(svnDao.getSvnUrlByRepository(repository) +
repository + "/" + newPath);
//3. 判断是否存在;
SVNNodeKind nodeKind = rps.checkPath("", -1);
if (nodeKind == SVNNodeKind.NONE) {//如果存在则更新路径;
svnConfigDevelopService.addDir(svnDao.getSvnUrlByRepository(repository) +
repository + "/" + newPath, desc, rp, true);
}
importFolder = newPath;
// 4. 上传文件
String msg = svnCommonService.addFileToSVN(svnFilePath, gdFileName,
repository, "/" + importFolder + "/", user, desc);
其中对获取SVNClientManipulator时,其实是获取一个client客户端,整个过程可以用一个简单的sequence图来说明:
- 然后对DefaultSVNRepositoryPool内部排查
在引用到的 DefaultSVNRepositoryPool 的构造方法内,可以看到
这里有两个Timer,作为全局的变量,可以看到作用是从10秒开始,每10秒执行一次 TimeOutTask() 方法。而这里的 myScheduledTimeoutTask 正是 ScheduledFuture 类型的。
如果不确认该类是否为溢出的对象,可以再进入到scheduleWithFixedDelay中。可以看到返回的正是RunnableScheduledFuture 对象。
此时就可以由刚才的seq图往回推
最终问题有可能出现在在 svnCommonService 中创建了过多的 SVNClientManipulator 。
SVN上传代码排查
是否为上述分析的原因,需要在svnCommonService代码中确认。
- 对现有的SVN上传代码过程分析
svnFileJsonArray 将json解析为array,循环每个数组中的内容,进行文件上传。
首先SVNClientManipulator的创建发生在循环内,也就是说一次请求上传多个文件,则会创建多个客户端。此处为导致问题的主要原因。
其次,在代码内没有发现同步区域,而且大部分内容是需要查询表、插入表,在高并发的情况下可能会出现 mysql 的 lock wait 异常,最终导致文件无法上传的错误。
最后,现有因为代码是一个请求创建一个线程,n次请求就产生n个线程,这在高请求量的情况下出现问题的概率非常大。
基于以上三点进行代码上的修改
问题代码修改
- 针对SVNClientManipulator的创建发生在循环内
将json中取出一人或者直接传进一个处理人,创建client,减少client的创建次数
- 针对一次请求创建一个线程,修改为使用线程池,默认线程池的coreSize为8,核心数*2
- 针对同步代码块,使用sycronized进行同步代码块。
进阶修改:
上述修改后,可以满足过程,但是实际上大部分代码会使用sycronized进行包裹,同时进行的线程只有一个,所以提前创建多线程是占用内存的时间的。
最终修改为:
- 使用单线程处理请求,单线程处理业务代码,避免了加锁和解锁的消耗
- 仅仅在上传文件时,使用线程池进行文件上传
插曲:为什么DefaultSVNRepositoryPool没有回收掉
这里涉及到客户端连接SVN的状态,默认连接状态时 keepAlive 的,但是不需要手动进行连接的关闭。
一个客户端启动一个全局的Timer,这个Timer每10秒检测一下是否可以关闭连接,可以关闭连接的条件是 这个连接在 60 秒内没有再次访问过SVN。
但是,因为task是需要线程进行执行的,当创建非常多的pool时,timer可能取不到CPU时间片来执行task,所以就在一直等待,导致链上的所有对象,虚拟机都无法进行回收,最终导致内存溢出。
其他
一、JVM调优参数
线上分为三台机器,而应用占其中一台,总内存为16g,针对此环境修改JAVA_OPTS
JAVA_OPTS="-server -Xms8192m -Xmx8192m
-XX:PermSize=1024M -XX:MaxPermSize=1024M -Duser.language=zh -Djava.util.Arrays.useLegacyMergeSort=true
-Djava.awt.headless=true
-Xloggc:/app/okit/java/gc-%t.log
-XX:+UseGCLogFileRotation
-XX:NumberOfGCLogFiles=5
-XX:GCLogFileSize=50M -XX:+PrintGCTimeStamps
-XX:+PrintGCDetails
-XX:HeapDumpPath=./java_dump.hprof
-XX:+HeapDumpOnOutOfMemoryError"
针对其中参数含义解释:
- -XX:+UseGCLogFileRotation GCLog文件输出
- -XX:NumberOfGCLogFiles=5 GCLog文件数量
- -XX:GCLogFileSize=20M GCLog文件大小
- -XX:+PrintGCTimeStamps 打印GC耗时
- -XX:+PrintGCDetails 打印GC回收的细节
- -XX:HeapDumpPath=./java_pid.hprof :堆内存快照的存储文件路径。文件名一般为java__heapDump.hprof。
- -XX:+HeapDumpOnOutOfMemoryError 在OOM时,自动输出一个dump文件
二、JDK自带工具使用
- jps
JPS(Java Virtual Machine Process Status Tool),可以显示进行中的Java线程。
使用方式:jps [options] [hostid]
- jstat -gc
jstat(Java Virtual Machine statistics monitoring tool),能够查看JVM的使用情况
使用方式:jstat [ generalOption | outputOptions vmid [ interval [ s|ms ] [ count ] ] ]
如: jstat -gc -h3 31736 1000 10
- jstack
jstack(Java stack trace)是Java的堆栈分析工具。
两个功能:
- 针对活着的进程做本地的或远程的线程dump;
- 针对core文件做线程dump。
使用方式:jstack [ option ] pid
可将堆栈输出到指定文件中:jstack -l PID >> jstack.out
- jmap
jmap(Java memory map),它可以生成 java 程序的 dump 文件, 也可以查看堆内对象示例的统计信息、查看 ClassLoader 的信息以及 finalizer 队列。
jmap -dump:format=b,file=heapdump.hprof pid
- JVisualVM
用来监测JVM内存和线程使用情况,可以远程连接
三、其他分析工具
- MAT
用来分析堆转储信息,能够分析内存溢出问题
- Arthas
可以实现JDK中工具所有功能,更直观。还能够线上热部署。
相关推荐
- 如何在HTML中使用JavaScript:从基础到高级的全面指南!
-
“这里是云端源想IT,帮你...
- 推荐9个Github上热门的CSS开源框架
-
大家好,我是Echa。...
- 硬核!知网首篇被引过万的论文讲了啥?作者什么来头?
-
整理|袁小华近日,知网首篇被引量破万的中文论文及其作者备受关注。知网中心网站数据显示,截至2021年7月23日,由华南师范大学教授温忠麟等人发表在《心理学报》2004年05期上的学术论文“中介效应检验...
- 为什么我推荐使用JSX开发Vue3_为什么用vue不用jquery
-
在很长的一段时间中,Vue官方都以简单上手作为其推广的重点。这确实给Vue带来了非常大的用户量,尤其是最追求需求开发效率,往往不那么在意工程代码质量的国内中小企业中,Vue占据的份额极速增长...
-
- 【干货】一文详解html和css,前端开发需要哪些技术?
-
网站开发简介...
-
2025-02-20 18:34 yuyutoo
- 分享几个css实用技巧_cssli
-
本篇将介绍几个css小技巧,目录如下:自定义引用标签的符号重置所有标签样式...
- 如何在浏览器中运行 .NET_怎么用浏览器运行代码
-
概述:...
- 前端-干货分享:更牛逼的CSS管理方法-层(CSS Layers)
-
使用CSS最困难的部分之一是处理CSS的权重值,它可以决定到底哪条规则会最终被应用,尤其是如果你想在Bootstrap这样的框架中覆盖其已有样式,更加显得麻烦。不过随着CSS层的引入,这一...
-
- HTML 基础标签库_html标签基本结构
-
HTML标题HTML标题(Heading)是通过-...
-
2025-02-20 18:34 yuyutoo
- 前端css面试20道常见考题_高级前端css面试题
-
1.请解释一下CSS3的flexbox(弹性盒布局模型),以及适用场景?display:flex;在父元素设置,子元素受弹性盒影响,默认排成一行,如果超出一行,按比例压缩flex:1;子元素设置...
- vue引入外部js文件并使用_vue3 引入外部js
-
要在Vue中引入外部的JavaScript文件,可以使用以下几种方法:1.使用``标签引入外部的JavaScript文件。在Vue的HTML模板中,可以直接使用``标签来引入外部的JavaScrip...
- 网页设计得懂css的规范_html+css网页设计
-
在初级的前端工作人员,刚入职的时候,可能在学习前端技术,写代码不是否那么的规范,而在工作中,命名的规范的尤为重要,它直接与你的代码质量挂钩。网上也受很多,但比较杂乱,在加上每年的命名都会发生一变化。...
- Google在Chrome中引入HTML 5.1标记
-
虽然负责制定Web标准的WorldWideWebConsortium(W3C)尚未宣布HTML5正式推荐规格,而Google已经迁移到了HTML5.1。即将发布的Chrome38将引入H...
- HTML DOM 引用( ) 对象_html中如何引用js
-
引用对象引用对象定义了一个同内联元素的HTML引用。标签定义短的引用。元素经常在引用的内容周围添加引号。HTML文档中的每一个标签,都会创建一个引用对象。...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)