Linux进程死锁定位

最近定位一个服务问题时发现telnet某个端口，无法链接。无奈之下只能一步步排查。

端口是否存在

ss -l|grep LISTEN|grep 9999

如果端口存在那么可以观察该端口上的recv-q send-q 如果是发生死锁一般情况下这两个队列只会增加（当然当服务处理过慢时也会导致包堆积）

Recv-Q Send-Q Local Address:Port Peer Address:Port
0 1024 *:5200 *:*

另外可以通过一下命令统计各类socket 状态的数据
```
ss |awk ‘BEGIN{arr[""]=0}{arr[$1]++}END{for(i in arr) print i,arr[i]}‘
LAST-ACK 1305
ESTAB 341643
State 1
FIN-WAIT-1 7553
CLOSING 3
FIN-WAIT-2 908
CLOSE-WAIT 60067
```
如果你的服务是多个进程那么，如果只是一个进程死锁，那么很容易就可以看出来该进程的cpu消耗时间应该小于其他进程，当然这个取决于进程的运行时间。下面的进程中，id=1903的进程就是疑似死锁问题。
```
root 1901 1 0 11:09 ? 00:00:00 ./client -f ../conf/client.ini -d
```

root 1902 1901 15 11:09 ? 00:31:55 ./client -f ../conf/client.ini -d

root 1903 1901 1 11:09 ? 00:02:25 ./client -f ../conf/client.ini -d

root 1904 1901 15 11:09 ? 00:31:19 ./client -f ../conf/client.ini -d

root 1905 1901 15 11:09 ? 00:31:17 ./client -f ../conf/client.ini -d

定位哪里死锁

经过一步步盘查之后，怀疑进程死锁，ok。最好的定位方法就是attach到进程，然后bt一下既可以看到进程hang在哪里。。。

$gdb attach 1903

#0 0x00007f105892105e in __lll_lock_wait_private () from /lib64/libc.so.6

#1 0x00007f10588c6cad in _L_lock_2164 () from /lib64/libc.so.6

#2 0x00007f10588c6a67 in __tz_convert () from /lib64/libc.so.6

#3 0x00007f105890da5d in __vsyslog_chk () from /lib64/libc.so.6

#4 0x00007f105889948e in __libc_message () from /lib64/libc.so.6

#5 0x00007f105889ee66 in malloc_printerr () from /lib64/libc.so.6

#6 0x00007f10588c6909 in tzset_internal () from /lib64/libc.so.6

#7 0x00007f10588c6a89 in __tz_convert () from /lib64/libc.so.6

#8 0x00000000004c0917 in shift_fd (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:95

#9 write_log (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:138


上面这个问题导致是因为进程抛出了SEGV信号之后，在处理信号的方法中使用了非线程安全的localtime，而该方法中会枷锁。

原文地址：https://blog.51cto.com/14354846/2439516

时间： 2024-10-12 03:33:48

Linux进程死锁定位的相关文章

Linux进程管理简谈

Linux系统进程管理简谈进程是什么? 简单来说进程是一个正在执行的程序的一个副本,存在生命周期,有段指令和代码在不断运行. linux内核存储信息的固定格式:task struct 进程的相关信息存储在链表中多个任务的task struct组件的链表:task list 进程的创建:父进程创建子进程(内核创建init进程,剩余一切进程有init及其子进程进程创建) 父进程创建子进程时向内核调用fork()来创建子进程并且通过调用clone()复制父进程的信息给子进程 Linux进程的优先级

Linux进程及作业管理

一.进程查看及其管理工具 --------------------------------------------- ps命令:报告当前进程的快照信息 ps - report a snapshot of the current processes. 选项: -A:显示所有进程与-e相同的效果 -a:不与终端相关的所有进程 -u:与用户相关的进程 -x:通常和a,u结合使用,显示出来比较全面的信息 -f:做一个更为完整的输出常用的组合: ps -ef 以完整的信息显示所有进程信息

linux 进程间信号量管理程序之sem_timedwait使用

在开发过程中,有三个独立运行的程序模块,三个模块都对sqlite数据库进行读写操作.sqlite在linux共享性较差,所以需要加入互斥信号量解决三个模块访问数据库该问题.另外,在加入信号量后,信号量sem初始化为1,如果三个模块任意一个在读或写数据库时ctrl+c掉(调试过程需要),有时会造成信号量sem保持sem_wait后的值,也就是为0:这就造成了死锁. 为了解决上述情况,决定在某一个模块使用sem_timedwait(sem_t *sem,const struct timespec *

Linux进程概念与管理

一.Linux进程概念 1.进程:Process,是运行中的程序的一个副本,有生命周期,都由其父进程创建 Linux内核存储进程信息的固定格式:taskstruct 多个任务的的taskstruct组件的链表:task list 2.进程优先级:0-139 0:一般不使用 1-99:实时优先级:数字越大优先级越高,系统自动安排 100-139:静态优先级:数字越小优先级越高,可手动更改 3.Nice值:-20至19,对应于100到139 普通用户只能将自己的优先级调低,root用户可以随意调制

Linux进程与作业管理（一）

Linux进程控制程序设计

一.进程控制理论基础进程:是一个具有一定独立功能的程序的一次运行活动.程序是静态的,程序在运行的时候是进程. 1.进程的特点: 动态性:区别于程序的显著特性并发性:多个进程可以同时执行独立性:独立的异步性:进程与进程之间可以进行异步操作 2.进程三态: 进程的ID(PID):标志进程的唯一数字. 父进程ID(PPID) 启动进程的用户ID(UID) 3.进程互斥进程互斥是指当有若干进程都要使用某一共享资源时,任何时刻最多允许一个进程使用,其他要使用该资源的进程必须等待,直到占用该资源者

12个Linux进程管理命令介绍

12个Linux进程管理命令介绍当程序可以执行文件存放在存储中,并且运行的时候,每个进程会被动态得分配系统资源.内存.安全属性和与之相关的状态.可以有多个进程关联到同一个程序,并同时执行不会互相干扰.Linux提供了许多命令来让用户来高效掌控上述的操作. 执行中的程序称作进程.当程序可以执行文件存放在存储中,并且运行的时候,每个进程会被动态得分配系统资源.内存.安全属性和与之相关的状态.可以有多个进程关联到同一个程序,并同时执行不会互相干扰.操作系统会有效地管理和追踪所有运行着的进程. 为了管

[linux]进程（二）--进程地址空间

7,linux进程命名空间的概念关于命名空间具体可以参考深入linux内核架构2.3.2章节 linux的命名空间属于操作系统级虚拟化,各个命名空间互相隔离,互相不可见,不同命名空间的进程PID可以相同,因此从操作系统层面看可能有相同的uid和pid,父命名空间同时还可以包含子命名空间,子命名空间不知道父命名空间的存在,但是父命名空间知道子命名空间的存在. 命名空间的实现:为了task_struct的精简,内核引入了struct nsproxy来统一管理进程所属的命名空间,在task_stru

ELF文件的加载过程(load_elf_binary函数详解)--Linux进程的管理与调度（十三）

日期内核版本架构作者 GitHub CSDN 2016-06-04 Linux-4.6 X86 & arm gatieme LinuxDeviceDrivers Linux进程管理与调度-之-进程的描述加载和动态链接从编译/链接和运行的角度看,应用程序和库程序的连接有两种方式. 一种是固定的.静态的连接,就是把需要用到的库函数的目标代码(二进制)代码从程序库中抽取出来,链接进应用软件的目标映像中: 另一种是动态链接,是指库函数的代码并不进入应用软件的目标映像,应用软件在编译/链接阶段并