Java 线程转储

软件维护是一个枯燥而又有挑战性的工作。只要软件功能符合预期,那么这个工作就是好的。设想一个这样的情景,你的电话半夜也一直在响(这不是一个令人愉快的感受,是吧?)
任何软件系统,无论它当初是被设计的多好,也无论它经历了怎样的质量测试,仍然是有可能出现运行时性能问题。原因可能是内部功能限制或者外部环境影响。软件系统是在某种假定的情景和先入为主的观念之上被建立的。然而,当他们实际运行时,这些假定的情况可能是错误的,由此就会引起系统故障。
企业的J2EE系统通常拥有庞大的用户基数,并且涉及多种系统间的交互,一个常见的运行时问题报告是系统的速度降低或者系统“挂起”。在这样的情形下,常用的故障处理手段就是分析java线程的转储来找到引起系统减速或者挂起的线程。这篇文章就是讨论java的堆栈跟踪信息,匿名线程和怎样读取线程转储的通用方法。

异常和堆栈信息
我们当中的所有人在学习/开发的过程中都会遇到或者曾经遇到过异常。异常是java报告运行时错误的一种方式。异常分为两部分:消息和堆栈信息。消息是告诉你什么出错了。堆栈信息提供了一个涉及到的所有类的完整的调用流程来作为运行时错误的一部分。
下面的例子是一个ArrayIndexOutOfBoundsException(数组下标越界异常)的堆栈信息:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 4
at Test.run(Test.java:13)
at Test.<init>(Test.java:5)
at Test.main(Test.java:20)
在上面的异常中,第一行“ Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 4”告诉你JVM在尝试访问数组下标为4的元素的值时遇到这个异常。遇到异常的java线程是“main”。
接下来让我们读一下堆栈信息。翻阅异常信息的规则是从第一行(消息行)了解是什么异常,然后接着读下去,来了解调用流程。上面的例子中,调用流程开始于Test.java的第20行(main方法),然后他调用了Test的构造方法。构造方法在堆栈信息中用<init>表示。然后它跳转到Test类的run()方法,然后在13行遇到了这个抛出的异常。
从上面的堆栈信息中,我们能够得出结论,在Test.java中,尝试读取的值超过了传递的数组的大小。

tnjin
翻译于 8个月前
2人顶
顶 翻译的不错哦!
java线程转储
java的线程转储可以被定义为JVM中在某一个给定的时刻运行的所有线程的快照。一个线程转储可能包含一个单独的线程或者多个线程。在多线程环境中,比如J2EE应用服务器,将会有许多线程和线程组。每一个线程都有它自己的调用堆栈,在一个给定时刻,表现为一个独立功能。线程转储将会提供JVM中所有线程的堆栈信息,对于特定的线程也会给出更多信息。
java虚拟机进程和java线程
java虚拟机,或者称为JVM,是一个操作系统级别的进程。java线程是JVM进程的子进程或者轻量级进程(Solar中的叫法)。
生成java线程转储
线程转储可以通过向JVM进程发送一个SIGQUIT信号来生成。有两种不同方式来向进程发送这个信号:
在Unix中,使用“kill -3<pid>”命令,pid表示JVM进程的ID。
在Windows中,在JVM运行时按下CTRL+BREAK键。

tnjin
翻译于 8个月前
1人顶
顶 翻译的不错哦!
java线程状态
每一个java线程总是处于其生命周期的四个状态之一。
Runnable-线程正在运行,或者准备好获取CPU时间后运行。JRockit线程转储中把这种状态当做Active。
Waiting on Monitor-线程休眠,或者在等待一个对象,或者等待被其他线程唤醒。在线程对象中调用sleep()方法,或者在一个对象中调用wait()方法时就会有这种情况发生。
举个例子,在WebLogc服务器中,空闲的执行线程处于这种状态,他们会一直等待直到一个Socket reader线程有新的任务才唤醒他们。堆栈信息就会如下所示:
"ExecuteThread: ‘2‘ for queue: ‘weblogic.admin.RMI‘" daemon prio=5 tid=0x1752F040 nid=0x180c in Object.wait() [1887f000..1887fd8c]
at java.lang.Object.wait(Native Method) waiting on <04134D98> (a weblogic.kernel.ExecuteThread)
at java.lang.Object.wait(Object.java:426)
at weblogic.kernel.ExecuteThread.waitForRequest(ExecuteThread.java:126)
locked <04134D98> (a weblogic.kernel.ExecuteThread)
at weblogic.kernel.ExecuteThread.run(ExecuteThread.java:145)
在某些别的版本的JVM中称这种状态是CW,Object.wait()(像上面那样)。JRockit称之为WAITING。

tnjin
翻译于 8个月前
1人顶
顶 翻译的不错哦!
Waiting for Monitor Entry——线程在等待获取一个对象的锁(其他线程可能持有这个同步锁)。这种情况发生在当两个或者更多线程尝试执行一段同步代码时。注意“锁”总是针对于一个对象而不是针对一个单独的方法。
这种情况的线程的简单堆栈信息如下:
"ExecuteThread: ‘24‘ for queue: ‘DisplayExecuteQueue‘" daemon prio=5 tid=0x5541b0 nid=0x3b waiting for monitor entry [49b7f000..49b7fc24]
at weblogic.cluster.replication.ReplicationManager.createSecondary (ReplicationManager.java:908)
- waiting to lock <6c4b9130> (a java.lang.Object)
at weblogic.cluster.replication.ReplicationManager.updateSecondary (ReplicationManager.java:715)
at weblogic.servlet.internal.session.ReplicatedSessionData.syncSession (ReplicatedSessonData.java:459)
- locked <6c408700> (a weblogic.servlet.internal.session.ReplicatedSessionData)
at weblogic.servlet.internal.session.ReplicatedSessionContext.sync (ReplicatedSessionContext.java:134)
- locked <6c408700> (aweblogic.servlet.internal.session.ReplicatedSessionData)
at weblogic.servlet.internal.ServletRequestImpl.syncSession (ServletRequestImpl.java:2418)
at weblogic.servlet.internal.WebAppServletContext.invokeServlet (WebAppServletContext.java:3137)
at weblogic.servlet.internal.ServletRequestImpl.execute (ServletRequestImpl.java:2544)
at weblogic.kernel.ExecuteThread.execute(ExecuteThread.java:153)
at weblogic.kernel.ExecuteThread.run(ExecuteThread.java:134)
在以上堆栈信息中,你可以看到这个线程持有一个对象锁 (6c408700) ,并在等待另一个对象锁(6c4b9130)。
某些别的版本的JVM可能不会在堆栈信息中给出对象的ID和锁的信息。同样的状态,在某些JVM版本中可能被称为“MW”。JRockit称之为LOCKED。

tnjin
翻译于 8个月前
2人顶
顶 翻译的不错哦!
分析一个Java线程
为了可以理解/分析线程转储,首先要理解线程转储的各个部分。让我们先拿一个简单的线程堆栈为例,并且去了解他的每个部分。
"ExecuteThread: ‘1‘ " daemon prio=5 tid=0x628330 nid=0xf runnable [0xe4881000..0xe48819e0]
at com.vantive.vanjavi.VanJavi.VanCreateForm(Native Method)http://www.enterdesk.com/special/sexygirl/?
at com.vantive.vanjavi.VanMain.open(VanMain.java:53)美女
at jsp_servlet._so.__newServiceOrder.printSOSection( __newServiceOrder.java:3547)
at jsp_servlet._so.__newServiceOrder._jspService (__newServiceOrder.java:5652)
at weblogic.servlet.jsp.JspBase.service(JspBase.java:27)
at weblogic.servlet.internal.ServletStubImpl.invokeServlet (ServletStubImpl.java:265)
at weblogic.servlet.internal.ServletStubImpl.invokeServlet (ServletStubImpl.java:200)
at weblogic.servlet.internal.WebAppServletContext.invokeServlet (WebAppServletContext.java:2495)
at weblogic.servlet.internal.ServletRequestImpl.execute (ServletRequestImpl.java:2204)
at weblogic.kernel.ExecuteThread.execute (ExecuteThread.java:139)
at weblogic.kernel.ExecuteThread.run(ExecuteThread.java:120)
In the above Thread Dump, the interesting part to is the first line. The rest of the stuff is nothing more than a general stack trace. Lets analyze the first line here
Execute Thread : 1 说明了线程的名字
daemon 表明这个线程是一个守护线程
prio=5 线程的优先级 (默认是5)
tid Java的线程Id (这个线程在当前虚拟机中的唯一标识).
nid 线程本地标识. 也就是Solaris中的LWP,线程在操作系统中的标识
runnable 线程的状态 (参考上面的)
[x..y] 当前运行的线程在堆中的地址范围
这个线程转储的剩余部分是调用堆栈。在这个例子中,这个线程(Execute Thread 1)是操作系统守护线程,当前正在执行一个本地方法vanCreateForm()。
使用线程转储
在这部分,我将描述几个用例来说明线程转储是非常有用的。
 
坏孩子
翻译于 8个月前
1人顶
顶 翻译的不错哦!
高CPU占用率
诊断
应用程序看起来几乎让CPU的占用率达到了100%,但是系统吞吐量却明显下降。开始于高负载的CPU性能很差。
线程转储
通过所有的线程转储,可以看到一个或多个线程在同一个操作中罢工了。
解决办法
为一个特定的调用流程(比如说网页上的form提交),在流程完成之前,生成一系列的线程转储(大约5~7个)
查找线程转储中的“runnable”线程。如果每一个线程看起来运行良好(每一个线程调用的方法都不相同),这些线程就是正在处理事务中,而且有可能并不是这次事件的罪魁祸首。如果通过所有的线程转储,发现线程正在执行同一个方法(同样的行号),几乎就可以确定这就是罪魁祸首了。那就可以查看代码,来做代码级别的分析了。你肯定也能从代码中找到解决问题的灵感。

tnjin
翻译于 8个月前
1人顶
顶 翻译的不错哦!
低CPU负载率和很长的响应时间
诊断
这通常在一个高I/O限制的系统处于高负载的时候发生。CPU的占用率很低,只有几个线程在消耗CPU的时间片。然而应用的响应时间却很长。
线程转储
一部分或者全部运行线程看起来就像是在一个I/O操作中罢工了,比如文件读/写或者数据库的操作。
解决方法
了解你系统中的I/O操作。使用缓存以减少应用与数据库之间的交互。

tnjin
翻译于 8个月前
1人顶
顶 翻译的不错哦!
应用/服务宕机
诊断
一个应用或者一个运行这个应用的服务JVM宕机(变得停止响应)
线程转储
在获得的所有线程转储中,可以看到所有的运行线程都在同一个操作中罢工了。服务器没有可用的线程,因为没有一个线程能够完成他自己的操作。
或许有很多线程在等待一个锁。当一个运行的线程持有一个对象锁不释放,而其他的线程恰好在等待这个对象锁的时候就会发生。
解决方法
检查死锁,通常简单情况下(线程A在等待线程B,同时B也在等待A),JVM通常会检测到死锁。但是,你需要了解在这个时刻锁的状态,以确认这时候是否涉及到一个复杂的死锁了。
复查同步方法/代码块,尽可能的将不需要同步的代码移出同步区,以减少同步区的大小。
这种问题还有一个可能,就是访问一个远程的资源/组件的响应超时设置的太长。在访问远程对象时设置一个合理的超时时间,这样就能够在远程系统失去响应时抛出一个可以捕获的异常。
如果所有的线程在等待一个资源(比如EJB/DB连接),考虑增加这些资源的对象池大小。
工具
对于线程转储分析,既有商业工具也有开源工具。其中有一个叫做Samurial的工具。它是一个轻量级的开源工具,和Java web启动程序一样,也是从命令提示行里启动。想要了解更多信息和文档,请访问http://yusuke.homeip.net/samurai/en/index.html。

tnjin
翻译于 8个月前
1人顶
顶 翻译的不错哦!
总结
在生产环境中维护一个J2EE企业应用是一个艰巨的任务。在生产环境中,随着事务的动态变化,J2EE企业应用的变化可能会表现出运行不稳定。影响一个J2EE应用的主要因素就是高负载。虽然大多数的系统被设计成可伸缩的,但是环境条件的限制仍然有可能让这些系统变得不响应。
Java线程转储是识别,诊断,检测和解决典型生产问题的绝佳机制。由于应用概览和其他机制的存在,分析java的线程转储将会让我们对常见生产级别的问题有一个明确的早期认识,从而能够节省时间,并让我们的产品应用提供更好的用户体验。

Java 线程转储

时间: 2024-08-23 05:58:53

Java 线程转储的相关文章

Java 死锁诊断 -- 线程转储

java线程转储 java的线程转储可以被定义为JVM中在某一个给定的时刻运行的所有线程的快照.一个线程转储可能包含一个单独的线程或者多个线程.在多线程环境中,比如J2EE应用服务器,将会有许多线程和线程组.每一个线程都有它自己的调用堆栈,在一个给定时刻,表现为一个独立功能.线程转储将会提供JVM中所有线程的堆栈信息,对于特定的线程也会给出更多信息. java虚拟机进程和java线程 java虚拟机,或者称为JVM,是一个操作系统级别的进程.java线程是JVM进程的子进程或者轻量级进程(Sol

Java线程与多线程教程

本文由 ImportNew - liken 翻译自 Journaldev. Java线程是执行某些任务的轻量级进程.Java通过Thread类提供多线程支持,应用可以创建并发执行的多个线程. 应用中有两类线程——用户线程和守护线程.当启动应用时,main线程是创建的第一个用户线程,我们可以创建多个用户线程和守护线程.当所有用户进程执行完毕时,JVM终止程序. 可以对不同的线程设置不同的属性,但并不保证高优先级的线程在低优先级线程之前执行.线程调度器是操作系统的部分实现,当一个线程启动后,它的执行

Java线程面试题合集(含答案)

来源:Java线程面试题 下面是我自己收集整理的Java线程相关的面试题,可以用它来好好准备面试. 参考文档: <Java核心技术 卷一> Java线程面试题 Top 50:http://www.importnew.com/12773.html JAVA多线程和并发基础面试问答: http://ifeve.com/java-multi-threading-concurrency-interview-questions-with-answers/ 15个顶级Java多线程面试题及回答:http:

线程转储分析

一.线程状态 在具体分析线程转储数据之前,我们首先要明确线程的状态.java.lang.Thread.State枚举类中定义了如下几种类型: NEW:线程创建尚未启动. RUNNABLE:包括操作系统线程状态中的Ready和Running,可能在等待时间片或者正在执行. BLOCKED:线程被阻塞. WAITING:不会分配CPU执行时间,直到别的线程显式的唤醒,否则无限期等待.LockSupport.park(),没有设置Timeout参数的Object.wait()和Thread.join(

使用线程转储研究运行时的应用程序

性能分析工具运行程序需要在jvm调试模式下启动,这对实际已经在用的生产应用并不适合: 还好,可以让JVM产生一个完全的线程转储,它可以显示所有线程的状态和调用堆栈: Unix系统上了可以执行kill -3 <PID>来得到: Windows系统按组合键Ctrl+Break: 执行命令并不会杀掉java进程: 这里以window为例,一按快捷键,刷刷刷: more: F:\360\workspacemy\CovertJava\srcbin>java covertjava.chat.Chat

java线程数过高原因分析

作者:鹿丸不会多项式  出处:http://www.cnblogs.com/hechao123   转载请先与我联系. 一.问题描述 前阵子我们因为B机房故障,将所有的流量切到了A机房,在经历了推送+自然高峰之后,A机房所有服务器都出现java线程数接近1000的情况(1000是设置的max值),在晚上7点多观察,java线程数略有下降,但还是有900+的样子,而此时,单台服务器的TPS维持在400/s,并不是一个特别大的量.然后将A机房一台机器下线,继续观察,到了晚上9点多,那台下线的机器,j

Java面试问题,如何避免Java线程中的死锁?

如何避免Java中的死锁?是流行的Java面试问题之一,也是多线程的流行话题之一.尽管问题看起来很简单,但是一旦深入,大多数Java开发人员就会陷入困境. 面试问题以“什么是死锁?”当两个或多个线程正在等待彼此释放所需资源(锁定)并陷入无限时间的阻塞时,这种情况称为死锁,它只会在多任务或多线程的情况下发生. 如何检测Java中的死锁? 虽然这可能有很多答案,但我的版本是,如果我看到嵌套的同步块,或者从其他同步方法调用一个同步方法,或者试图在不同的对象上获得锁,那么如果开发人员不是非常小心,就很可

java 线程详解

5月7号  周末看了一下线程方面的内容 ,边看视频边看书还附带着参考了很多人的博客,一天的收获,写下来整理一下:感觉收获还是挺多的:过段时间可能看完java  这几大块要去看一下关于spring boot  的内容顺便  也整理一下:附上我参考的 几本书: 关于java  线程,首先要了解一下线程和进程之间的关系.区别以及他们之间的概念: 首先是线程: 什么是线程? 线程是在程序执行过程中能够执行部分代码的一个执行单元,也看看做是一个轻量级的进程:线程是程序内的程序控制流只能使用程序内分配给程序

Java线程工作内存与主内存变量交换过程及volatile关键字理解

Java线程工作内存与主内存变量交换过程及volatile关键字理解 1. Java内存模型规定在多线程情况下,线程操作主内存变量,需要通过线程独有的工作内存拷贝主内存变量副本来进行.此处的所谓内存模型要区别于通常所说的虚拟机堆模型: 2. 线程独有的工作内存和进程内存(主内存)之间通过8中原子操作来实现,如下图所示: 原子操作的规则(部分): 1) read,load必须连续执行,但是不保证原子性. 2) store,write必须连续执行,但是不保证原子性. 3) 不能丢失变量最后一次ass