死磕内存篇2 --JAVA进程是怎么突然挂掉的

JVM内存不足导致进程死掉. Native memory allocation (mmap) failed to map

一台服务器上部署很多JAVA进程已经是微服务的常态，但也有些坑。

背景，测试服务器上的一些JAVA进程突然挂掉，查看call back的日志发现如下：

# There is insufficient memory for the Java Runtime Environment to continue.
# Native memory allocation (mmap) failed to map 1786867712 bytes for committing reserved memory.
# Possible reasons:
# The system is out of physical RAM or swap space
# In 32 bit mode, the process size limit was hit
# Possible solutions:
# Reduce memory load on the system
# Increase physical memory or swap space
# Check if swap backing store is full
# Use 64 bit Java on a 64 bit OS
# Decrease Java heap size (-Xmx/-Xms)
# Decrease number of Java threads
# Decrease Java thread stack sizes (-Xss)
# Set larger code cache with -XX:ReservedCodeCacheSize=
# This output file may be truncated or incomplete.
#
# Out of Memory Error (os_linux.cpp:2673), pid=28610, tid=139813184919296
#
# JRE version: Java(TM) SE Runtime Environment (8.0_40-b26) (build 1.8.0_40-b26)
# Java VM: Java HotSpot(TM) 64-Bit Server VM (25.40-b25 mixed mode linux-amd64 compressed oops)
#

很明显是由于服务器的内存不足造成

内存不够用分两种情况

推测：内存不够用分两种情况

推测 1， JAVA程序使用的内存申请超出了JVM分配的, 此类只会抛出

java.lang.OutOfMemoryError: Java heap space，JAVA进程是不会有影响，下次也可以继续接受请求提供服务

推测 2， JVM尝试去像操作系统申请一块内存超出系统的可使用（RSS）内存时，此时linux会结束JAVA进程，并抛出如上错误。

这种场景也常见：如在一台16G内存的服务器上跑着两个服务，两个服务同时启动各自分配10G内存，因为JVM的垃圾回收机制一般情况下是不会有问题，能正常服务，当两个服务同时需要用到的内存超出16G时，将会被linux干掉一个服务.

（注: JVM启动时，通过-Xmx等参数分配的内存只会影响到VIRT ，详见上一篇博客《JAVA进程和linux内存间的大小关系》

证实：

去证实是最重要的，上面的都是我的推测

一台内存是1G的linux服务器

 total used free shared buffers cached
Mem:      984 119 864 0 2 20
-/+         buffers/cache: 97 886
Swap:      2044 45 1999

物理内存+swap内存在 3G左右 (886+1999)

加入JAVA程序，因为是要观察JAVA的内存超出是否会终止JAVA的进程，故思路如下设计

1，用一个线程去申请分配内存

2，主线程不停报告存活状态

程序如下

package org.hejinbin.memory.test;

import java.io.IOException;

/**
 * 用于演示内存不足导致JAVA进程退出, 注意:输入的size勿导致超出int （1024 * 1024 * size）
 *
 * @author 何锦彬 QQ 277803242（包子） 2016.12.29
 */
public class Test {
    public static void main(String[] args) throws IOException, InterruptedException {

        new Thread(new Runnable() {

            public void run() {

                try {
                    //接收测试内存的大小,单位m
                    byte[] byteSize = new byte[50];
                    System.out.print("input want to allocation memory:");
                    int temp = System.in.read(byteSize);
                    String sizeStr = new String(byteSize, 0, temp);
                    int size = Integer.parseInt(sizeStr.trim());
                    System.out.println(1024 * 1024 * size);
                    byte[] bt = new byte[1024 * 1024 * size];
                    System.out.println("succ..allocation: " + size + "m");
                    //阻30分,防止垃圾回收
                    Thread.sleep(1000 * 60 * 30);
                } catch (Exception e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }

            }
        }).start();

        while (true) {
            //1分钟后报告
            Thread.sleep(1000 * 60);
            System.out.println(Thread.currentThread().getId() + ": i‘m alive");
        }
    }
}

证实推测1：

运行程序，输入1000 (这里只要超过了年龄代内存其实就会抛出异常)

输出 alive, 证明了推测1，使用内存超出了并不会导致JAVA进程死掉

证实推测2：

打开窗口1 ，运行，输入

[email protected]:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test

input want to allocation memory:

打开窗口2 ，运行，输入

[email protected]:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test

input want to allocation memory:

然后在窗口1输入1500

运行如下：

input want to allocation memory:1500
succ..allocation: 1500m

然后在窗口2，输入1500

input want to allocation memory:1500
succ..allocation: 1500m

此时发现窗口1的JAVA进程被杀掉了，完整如下

[email protected]:/home/hejinbin# java -Xmx3048m -Xms3048m org.hejinbin.memory.test.Test
input want to allocation memory:1500
succ..allocation: 1500m
Killed

证实了推测2

结论：如今微服务流行（趁点热度）。很多进程同时在一台服务器上跑，必须注意，分配给JAVA的内存只和一定在服务器的可用内存之内。不然很有可能突然被linux干掉一个进程

最后还有个以为，为啥我的进程被killed之后，并没有产生hs_err_pid*.log的日志呢?

时间： 2024-11-20 00:52:17

死磕内存篇2 --JAVA进程是怎么突然挂掉的的相关文章

UNIX再学习 -- 死磕内存管理

malloc/free简化实现:malloc 和 sbrk 关系:虚拟内存机制. 一个内存管理 C 语言部分讲,UNIX部分讲,Linux部分还讲,死磕到底!! 一.mallc/free简化实现上篇文章已经讲解了动态内存分配/释放函数,参看:UNIX再学习 – 内存管理下面来讲一下,它的自定义函数实现,其中有三个部分: 1.内存控制块内存控制块用于管理每次分配的内存块,记录该内存块的字节大小.忙闲状态,以及相关内存控制块的首地址. 代码如下所示 typedef struct mem_cont

linux内存不足导致java进程被kill掉

记得之前在国内现金贷贷超放量时,后台java进程莫名奇妙就没了, 查看 /var/log/message 出现如下日志,标明,Linux 系统自身把 Java 进程杀掉了 Jun 28 02:58:27 hilife-dev001 kernel: Out of memory: Kill process 14561 (java) score 52 or sacrifice child 当 Linux 系统内存不足时,系统会把当前系统占用系统内存过高的进程当做流氓进程,然后系统发出信号将这个流氓进程

【死磕Java并发】-----Java内存模型之分析volatile

前篇博客[死磕Java并发]-–深入分析volatile的实现原理中已经阐述了volatile的特性了: volatile可见性:对一个volatile的读,总可以看到对这个变量最终的写: volatile原子性:volatile对单个读/写具有原子性(32位Long.Double),但是复合操作除外,例如i++; JVM底层采用"内存屏障"来实现volatile语义下面LZ就通过happens-before原则和volatile的内存语义两个方向介绍volatile. volat

死磕 java同步系列之终结篇

简介同步系列到此就结束了,本篇文章对同步系列做一个总结. 脑图下面是关于同步系列的一份脑图,列举了主要的知识点和问题点,看过本系列文章的同学可以根据脑图自行回顾所学的内容,也可以作为面试前的准备. 如果有需要高清无码原图的同学,可以关注公众号"彤哥读源码",回复"sync"领取. 总结所谓同步,就是保证多线程(包括多进程)对共享资源的读写能够安全有效的运行. 根据同步的运用场景的不同,实现同步的方式也是随之一起变化,但是总结下来,这些实现方式之间又有一些共通之

死磕 java原子类之终结篇（面试题）

概览原子操作是指不会被线程调度机制打断的操作,这种操作一旦开始,就一直运行到结束,中间不会有任何线程上下文切换. 原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序不可以被打乱,也不可以被切割而只执行其中的一部分,将整个操作视作一个整体是原子性的核心特征. 在java中提供了很多原子类,笔者在此主要把这些原子类分成四大类. 原子更新基本类型或引用类型如果是基本类型,则替换其值,如果是引用,则替换其引用地址,这些类主要有: (1)AtomicBoolean 原子更新布尔类型,内部使用in

死磕 java原子类之终结篇

概览原子操作是指不会被线程调度机制打断的操作,这种操作一旦开始,就一直运行到结束,中间不会有任何线程上下文切换. 原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序不可以被打乱,也不可以被切割而只执行其中的一部分,将整个操作视作一个整体是原子性的核心特征. 在java中提供了很多原子类,笔者在此主要把这些原子类分成四大类. atomic 原子更新基本类型或引用类型如果是基本类型,则替换其值,如果是引用,则替换其引用地址,这些类主要有: (1)AtomicBoolean 原子更新布尔类型

死磕 java同步系列之AQS终篇（面试）

问题 (1)AQS的定位? (2)AQS的重要组成部分? (3)AQS运用的设计模式? (4)AQS的总体流程? 简介 AQS的全称是AbstractQueuedSynchronizer,它的定位是为Java中几乎所有的锁和同步器提供一个基础框架. 在之前的章节中,我们一起学习了ReentrantLock.ReentrantReadWriteLock.Semaphore.CountDownLatch的源码,今天我们一起来对AQS做个总结. 状态变量state AQS中定义了一个状态变量state

死磕 java集合之终结篇

概览我们先来看一看java中所有集合的类关系图. 这里面的类太多了,请放大看,如果放大还看不清,请再放大看,如果还是看不清,请放弃. 我们下面主要分成五个部分来逐个击破. List List中的元素是有序的.可重复的,主要实现方式有动态数组和链表. java中提供的List的实现主要有ArrayList.LinkedList.CopyOnWriteArrayList,另外还有两个古老的类Vector和Stack. 关于List相关的问题主要有: (1)ArrayList和LinkedList有

死磕 java同步系列之redis分布式锁进化史

问题 (1)redis如何实现分布式锁? (2)redis分布式锁有哪些优点? (3)redis分布式锁有哪些缺点? (4)redis实现分布式锁有没有现成的轮子可以使用? 简介 Redis(全称:Remote Dictionary Server 远程字典服务)是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API. 本章我们将介绍如何基于redis实现分布式锁,并把其实现的进化史从头到尾讲明白,以便大家在面试的时候能讲清楚