“这是我参与更文挑战的第5天,活动详情查看: 更文挑战”
上篇介绍了JVM监控及诊断工具-命令行上篇,在介绍下JVM监控及诊断工具-GUI下篇之前,先谈谈内存泄漏问题。
内存泄露
内存泄露的理解与分类
何为内存泄漏(memory leak)
可达性分析算法来判断对象是否是不再使用的对象,本质都是判断一个对象是否还被引用。那么对于这种情况下,由于代码的实现不同就会出现很多内存泄漏问题(让JVM误以为此对象还在引用中,无法回收,造成内存泄漏)。
主要关注两点:
- 是否还被使用?是
- 是否还被需要?否
内存泄漏(memory leak)的理解
严格来说,只有对象不会再被程序用到了,但是GC又不能回收他们的情况,才叫内存泄漏。但实际情况很多时候一些不太好的实践(或疏忽)才导致对象的生命周期变得很长甚至导致OOM,也可以叫做宽泛意义上的“内存泄漏”。
内存泄漏与内存溢出的关系
- 内存泄漏(memory leak)申请了内存用完了不释放,比如一共有1024M的内存,分配了512M的内存一直不回收,那么可以用的内存只有512M了,仿佛泄漏掉了一部分;通俗一点来讲,内存泄漏就是【占着茅坑不拉屎】。
- 内存溢出(out of memory)申请内存时,没有足够的内存可以使用;通俗一点儿讲,一个厕所就三个坑,有两个站着茅坑不走的(内存泄漏),剩下最后一个坑,厕所表示接待压力很大,这时候一下子来了两个人,坑位(内存)就不够了,内存泄漏变成了内存溢出了。
内存泄漏与内存溢出的关系
内存泄漏的增多,最终会导致内存溢出。
泄漏的分类
- 经常发生:发生内存泄漏的代码会被多次执行,每次执行,泄漏一块内存;
- 偶然发生:在某些特定情况下才会发生;
- 一次性:发生内存泄漏的方法只会执行一次;
- 隐式泄漏:一直占着内存不释放,直到执行结束;严格的说这个不算内存泄漏,因为最终释放掉了,
图例
Java中内存泄漏的8种情况
静态集合类
静态集合类,如HashMap、LinkedList等等。如果这些容器为静态的,那么它们的声明周期与JVM程序一致,则容器中的对象在程序结束之前将不能被释放,从而造成内存泄漏。简单而言,长生命周期的对象有短生命周期对象的引用,尽管短生命周期的对象不再使用,但是因为长生命周期对象持有它的引用而导致不能被回收。
public class MemoryLeak {
static List list = new ArrayList();
public void oomTests() {
Object obj = new Object();// 局部变量
list.add(obj);
}
复制代码
单例模式
单例模式,和静态集合导致内存泄漏的原因类似,因为单例的静态特性,它的生命周期和JVM的生命周期一样长,所以如果单例对象如果持有外部对象的引用,那么这个外部对象也不会被回收,那么就会造成内存泄漏。
内部类持有外部类
内部类持有外部类,如果一个外部类的实例对象的方法返回了一个内部类的实例对象。这个内部类对象被长期引用了,即使那个外部类实例对象不再被使用,但由于内部类持有外部类的实例对象,这个外部类对象将不会被垃圾回收,这也会造成内存泄漏。
各种连接,如数据库连接、网络连接和IO连接等
各种连接,如数据库连接、网络连接和IO连接等。在对数据库进行操作的过程中,首先需要建立与数据库的连接,当不再使用时,需要调用close方法来释放与数据库的连接。只有连接被关闭后,垃圾回收器才会回收对应的对象。否则,如果在访问数据库的过程中,对Connection、Statement或ResultSet不显性的关闭,将会造成大量的对象无法被回收,从而引起内存泄漏。
变量不合理的作用域
变量不合理的作用域。一般而言,一个变量的定义的作用范围大于其使用范围,很可能会造成内存泄漏。另一方面,如果没有及时地把对象设置为null,很有可能导致内存泄漏的发生。
改变哈希值
改变哈希值,当一个对象被存储进HashSet集合中以后,就不能修改这个对象中的那些参与计算哈希值的字段了。否则对象修改后的哈希值与最初存储进HashSet集合中时的哈希值就不同了,在这种情况下,即使在contains方法使用该对象的当前引用作为的参数去HashSet集合中检索对象,也将返回找不到对象的结果,这也会导致无法从HashSet集合中单独删除当前对象,造成内存泄漏。这也是String为什么被设置成了不可变类型,我们可以放心的把String存如HashSet,或者把String当做HashMap的key值;
缓存泄漏
内存泄漏的另一个常见来源是缓存,一旦你把对象引用放入到缓存中,他就很容易遗忘。比如:之前项目在一次上线的时候,应用启动奇慢知道夯死,就是因为代码中加载一个表中的数据到缓存(内存)中,测试环境只有几百条数据,但是生产环境有几百万的数据。
对于这个问题,可以使用WeakHashMap代表缓存,此种Map的特点,当除了自身有对key的引用外,此key没有其他引用那么此map会自动丢弃此值。
监听器和回调
内存泄漏另一个常见来源是监控器和其他回调,如果客户端在你实现的API中注册回调,却没有显示的取消,那么就会积聚。
需要确保回调立即被当作垃圾回收的最佳方法是只保存它的弱引用,例如将他们保存为WeakHashMap中的键。
内存泄漏案例分析
案例代码
public class Stack {
private Object[] elements;
private int size = 0;
private static final int DEFAULT_INITIAL_CAPACITY = 16;
public Stack() {
elements = new Object[DEFAULT_INITIAL_CAPACITY];
}
public void push(Object e) {
elements[size++] = e;
}
// 存在内存泄漏问题
public Object pop() {
if (size == 0)
throw new EmptyStackException();
return elements[--size];
}
private void ensureCapacity() {
if (size == elements.length)
elements = Arrays.copyOf(elements, size * 2 + 1);
}
}
复制代码
分析
上述程序并没有明显的错误,但是这段程序有一个内存泄漏,随着GC活动的增加,或者内存占用的不断增加,程序性能的降低就会表现出来,严重时可导致内存泄漏,但是这种失败情况相对较少。代码的主要问题在pop函数,下面通过这张图示展示,假设这个栈一直增长,增长后如下图所示。
当进行大量的pop操作时,由于引用未进行置空,gc是不会释放的,如下图所示
从上图中可以看出,如果栈先增长,在收缩,那么从栈中弹出的对象将不会被当作垃圾回收,即使程序不再使用栈中的这些对象,他们也不会回收,因为栈中任然保存着这些对象的引用,俗称过期引用,这个内存泄漏很隐蔽。
解决办法
public Object pop() {
if (size == 0)
throw new EmptyStackException();
Object result = elements[--size];
elements[size] = null;
return result;
}
复制代码
一旦引用过期,清空这些引用,将引用置空。
总结
本篇介绍了内存泄漏是什么?怎么发生的?内存泄漏与内存溢出的关系,最后用一个简单的案例演示内存泄漏问题。下一篇再介绍JVM监控及诊断工具-GUI下篇。
欢迎大家关注公众号(MarkZoe)互相学习、互相交流。