linux 磁盘空间被占满但找不到目标文件的问题处理 lsof命令

lsof简介

在终端下输入lsof即可显示系统打开的文件,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能。

直接输入lsof部分输出为:

每行显示一个打开的文件,若不指定条件默认将显示所有进程打开的所有文件。

lsof输出各列信息的意义如下:

  COMMAND:进程的名称

  PID: 进程标识符

  USER:进程所有者

  FD: 文件描述符,应用程序通过文件描述符识别该文件。如cwd、txt等 TYPE:文件类型,如DIR、REG等

  DEVICE:指定磁盘的名称

  SIZE:文件的大小

  NODE:索引节点(文件在磁盘上的标识)

  NAME:打开文件的确切名称

FD 列中的文件描述符cwd 值表示应用程序的当前工作目录,这是该应用程序启动的目录,除非它本身对这个目录进行更改,txt 类型的文件是程序代码,如应用程序二进制文件本身或共享库,如上列表中显示的 /sbin/init 程序。

其次数值表示应用程序的文件描述符,这是打开该文件时返回的一个整数。初始打开每个应用程序时,都具有三个文件描述符,从 0 到 2,分别表示标准输入、输出和错误流。

与 FD 列相比,Type 列则比较直观。文件和目录分别称为 REG 和 DIR。而CHR 和 BLK,分别表示字符和块设备;或者 UNIX、FIFO 和 IPv4,分别表示 UNIX 域套接字、先进先出 (FIFO) 队列和网际协议 (IP) 套接字。

lsof使用实例

(1) 查找谁在使用文件系统

在卸载文件系统时,如果该文件系统中有任何打开的文件,操作通常将会失败。那么通过lsof可以找出那些进程在使用当前要卸载的文件系统,如下:

# lsof /GTES11

COMMAND PID USER FD
TYPE DEVICE SIZE NODE NAME

bash 4208 root cwd DIR 3,1 4096 2 /GTES11/

vim 4230 root cwd DIR 3,1 4096 2 /GTES11/

在这个示例中,用户root正在其/GTES11目录中进行一些操作。一个 bash是实例正在运行,并且它当前的目录为/GTES11,另一个则显示的是vim正在编辑/GTES11下的文件。要成功地卸载/GTES11,应该在通知用户以确保情况正常之后,中止这些进程。 这个示例说明了应用程序的当前工作目录非常重要,因为它仍保持着文件资源,并且可以防止文件系统被卸载。这就是为什么大部分守护进程(后台进程)将它们的目录更改为根目录、或服务特定的目录(如 sendmail 示例中的 /var/spool/mqueue)的原因,以避免该守护进程阻止卸载不相关的文件系统。

(2) 恢复删除的文件

当Linux计算机受到入侵时,常见的情况是日志文件被删除,以掩盖攻击者的踪迹。管理错误也可能导致意外删除重要的文件,比如在清理旧日志时,意外地删除了数据库的活动事务日志。有时可以通过lsof来恢复这些文件。

当进程打开了某个文件时,只要该进程保持打开该文件,即使将其删除,它依然存在于磁盘中。这意味着,进程并不知道文件已经被删除,它仍然可以向打开该文件时提供给它的文件描述符进行读取和写入。除了该进程之外,这个文件是不可见的,因为已经删除了其相应的目录索引节点。

在/proc 目录下,其中包含了反映内核和进程树的各种文件。/proc目录挂载的是在内存中所映射的一块区域,所以这些文件和目录并不存在于磁盘中,因此当我们对这些文件进行读取和写入时,实际上是在从内存中获取相关信息。大多数与 lsof 相关的信息都存储于以进程的 PID 命名的目录中,即 /proc/1234 中包含的是 PID 为 1234 的进程的信息。每个进程目录中存在着各种文件,它们可以使得应用程序简单地了解进程的内存空间、文件描述符列表、指向磁盘上的文件的符号链接和其他系统信息。lsof 程序使用该信息和其他关于内核内部状态的信息来产生其输出。所以lsof 可以显示进程的文件描述符和相关的文件名等信息。也就是我们通过访问进程的文件描述符可以找到该文件的相关信息。

当系统中的某个文件被意外地删除了,只要这个时候系统中还有进程正在访问该文件,那么我们就可以通过lsof从/proc目录下恢复该文件的内容。

假如由于误操作将/var/log/messages文件删除掉了,那么这时要将/var/log/messages文件恢复的方法如下:

首先使用lsof来查看当前是否有进程打开/var/logmessages文件,如下:

# lsof |grep /var/log/messages

syslogd 1283 root 2w
REG 3,3 5381017 1773647 /var/log/messages (deleted)

从上面的信息可以看到 PID 1283(syslogd)打开文件的文件描述符为 2。同时还可以看到/var/log/messages已经标记被删除了。因此我们可以在
/proc/1283/fd/2 (fd下的每个以数字命名的文件表示进程对应的文件描述符)中查看相应的信息,如下:

# head -n 10
/proc/1283/fd/2

Aug 4 13:50:15
holmes86 syslogd 1.4.1: restart.

Aug 4 13:50:15 holmes86 kernel: klogd 1.4.1, log source = /proc/kmsg started.

Aug 4 13:50:15 holmes86 kernel: Linux version 2.6.22.1-8
([email protected]) (gcc version 4.2.0) #1 SMP Wed Jul 18
11:18:32 EDT 2007 Aug 4 13:50:15 holmes86 kernel: BIOS-provided physical RAM
map: Aug 4 13:50:15 holmes86 kernel: BIOS-e820: 0000000000000000 -
000000000009f000 (usable) Aug 4 13:50:15 holmes86 kernel: BIOS-e820: 000000000009f000
- 00000000000a0000 (reserved) Aug 4 13:50:15 holmes86 kernel: BIOS-e820:
0000000000100000 - 000000001f7d3800 (usable) Aug 4 13:50:15 holmes86 kernel:
BIOS-e820: 000000001f7d3800 - 0000000020000000 (reserved) Aug 4 13:50:15
holmes86 kernel: BIOS-e820: 00000000e0000000 - 00000000f0007000 (reserved) Aug
4 13:50:15 holmes86 kernel: BIOS-e820: 00000000f0008000 - 00000000f000c000
(reserved)

从上面的信息可以看出,查看 /proc/8663/fd/2
就可以得到所要恢复的数据。如果可以通过文件描述符查看相应的数据,那么就可以使用 I/O 重定向将其复制到文件中,如:
# cat /proc/1283/fd/2
> /var/log/messages

对于许多应用程序,尤其是日志文件和数据库,这种恢复删除文件的方法非常有用。

(3) 磁盘空间被占满,文件已经删除,但是空间未被释放的问题

磁盘空间已满,但是找不到占空间的文件。空间没释放
或者说 inode 用完,用以下命令查看

# df -Th

Filesystem                      Type   Size 
Used Avail Use% Mounted on

/dev/mapper/vg_mysql120-lv_root
ext4    50G   45G 
1.8G  97% /

tmpfs                           tmpfs   32G    
0   32G   0% /dev/shm

/dev/sda1                       ext4   485M  
32M  428M   7% /boot

/dev/mapper/vg_mysql120-lv_home
ext4   468G   78G 
367G  18% /home

# df
-i

Filesystem                        Inodes IUsed    IFree IUse% Mounted on

/dev/mapper/vg_mysql120-lv_root  3276800 32722 
3244078    1% /

tmpfs                            8224606     1 
8224605    1% /dev/shm

/dev/sda1                         128016    38  
127978    1% /boot

/dev/mapper/vg_mysql120-lv_home 31129600 19867
31109733    1% /home

注:在生产环境常见的问题就是,有维护人员或者开发同事使用tail命令实时查看日志。然后另外的人使用rm命令删除,这有就好导致磁盘空间不会真正的释放,因为你要删除的文件,还有进程在使用,文件句柄没有释放,即tail

文件句柄以及空间释放问题

# lsof |grep deleted             --查看

如果你知道文件名,那就可以直接使用如下命令

# lsof |grep  testfile

但是如果你不知道是哪个文件,或者是很多文件都有这样的情况,那你需要使用如下命令

注:这个deleted表示该已经删除了的文件,但是文件句柄未释放,这个命令会把所有的未释放文件句柄的进程列出来

遇到这类问题,重启被删除文件的服务即可。

(4) 实用命令

lsof
`which httpd`   --那个进程在使用apache的可执行文件

lsof
/etc/passwd     --那个进程在占用/etc/passwd

lsof
/dev/cdrom      --那个进程在占用光驱

lsof
-p 30297        --显示那些文件被pid为30297的进程打开

lsof
-u1000          --查看uid是100的用户的进程的文件使用情况

lsof
-utony          --查看用户tony的进程的文件使用情况

lsof
-u^tony         --查看不是用户tony的进程的文件使用情况(^是取反的意思)

lsof
-i              --显示所有打开的端口

lsof
-i:80           --显示所有打开80端口的进程

使用-i显示所有连接

有些人喜欢用netstat来获取网络连接,但是我更喜欢使用lsof来进行此项工作。结果以对我来说很直观的方式呈现,我仅仅只需改变我的语法,就可以通过同样的命令来获取更多信息。

# lsof -i

COMMAND PID USER FD TYPE DEVICE SIZE NODE
NAME

dhcpcd 6061 root 4u IPv4 4510 UDP *:bootpc

sshd   7703 root 3u IPv6 6499 TCP *:ssh (LISTEN)

sshd   7892 root 3u IPv6 6757 TCP 10.10.1.5:ssh->192.168.1.5:49901 (ESTABLISHED)

使用-i 6仅获取IPv6流量

# lsof -i 6

仅显示TCP连接(同理可获得UDP连接)

你也可以通过在-i后提供对应的协议来仅仅显示TCP或者UDP连接信息。

# lsof -iTCP

COMMAND 
PID  USER   FD   TYPE DEVICE SIZE NODE NAME

sshd     7703 root  3u    IPv6 6499 TCP *:ssh
(LISTEN)

sshd     7892 root  3u    IPv6 6757 TCP 10.10.1.5:ssh->192.168.1.5:49901 (ESTABLISHED)

使用-i:port来显示与指定端口相关的网络信息

或者,你也可以通过端口搜索,这对于要找出什么阻止了另外一个应用绑定到指定端口实在是太棒了。

# lsof -i:22

COMMAND 
PID USER   FD   TYPE DEVICE SIZE NODE NAME

sshd 7703 root 3u  IPv6 6499 TCP *:ssh (LISTEN)

sshd 7892 root 3u  IPv6 6757 TCP 10.10.1.5:ssh->192.168.1.5:49901 (ESTABLISHED)

找出监听端口

找出正等候连接的端口。

# lsof -i -sTCP:LISTEN

你也可以grep
“LISTEN”来完成该任务。

# lsof -i | grep -i
LISTEN

iTunes    
400 daniel  
16u  IPv4 0x4575228  0t0 TCP *:daap (LISTEN)

找出已建立的连接

你也可以显示任何已经连接的连接。

# lsof -i -sTCP:ESTABLISHED

你也可以通过grep搜索“ESTABLISHED”来完成该任务。

# lsof -i | grep -i
ESTABLISHED

firefox-b 169
daniel  49u IPv4 0t0 TCP 1.2.3.3:1863->1.2.3.4:http (ESTABLISHED)

原文地址:https://www.cnblogs.com/xl999/p/10204033.html

时间: 2024-10-12 03:57:24

linux 磁盘空间被占满但找不到目标文件的问题处理 lsof命令的相关文章

linux磁盘空间被占满,但是找不到大文件

在一次排查问题中,df -h 发现磁盘空间满了, 但是任凭各个文件目录下  du -sh * 也找不到大文件,于是立马虚心求教大拿,大拿一个命令就解决了,什么命令这么nb+神奇呢? lsof -n | grep deleted  查看到占用的进程 kill -9 进程号 再df -h就没问题了,以下是公司大拿给出来的解释: 当我们使用rm在linux上删除了大文件,但是如果有进程打开了这个大文件,却没有关闭这个文件的句柄,那么linux内核还是不会释放这个文件的磁盘空间 原文地址:https:/

Linux磁盘空间被占用,而且找不到占用文件

新公司的测试服务器磁盘空间空余很小,日志很多,也很大,做个日志压缩脚本,在夜里4:30自动运行,第二天后发现磁盘空间又满了,只好删除没用的日志,清空空间,可诡异的是怎么删除没用的文件,空间还是占用很大. 用du根目录下,发现这些文件加一块占用空间也很小. 用lsof检查后才发现原因是有文件被删除,而进程还活着,因而造成还占用空间的现象 结果很明显,nohup的日志文件进程还在 根据lsof列出的进程号,kill这些进程后,空间就释放出来了.

磁盘空间被占满导致前台的验证码无法显示

昨晚上11点多,公司的后台程序员打电话说登陆页面的验证码突然显示不出来了,我查看了一下,并和测试机上的代码做了一下比较(测试机上能正常显示,这是外包做的网站,不是自己写的),请求的地址都是一样的,地址文件也是一样的,请求也是成功的,只是没有数据的返回,之后还把实际上的文件用测试机上的文件覆盖了,还是不能正常显示,重启了服务器还是不能显示.折腾了很久,后来发现服务器上的磁盘被占满了,删除了一些多余的文件之后终于能正常显示了.之后查了一下说原来磁盘空间被占满,会出现web程序报错的情况.

Linux磁盘空间占满故障处理

Linux磁盘占满 当磁盘被某大文件占满时,而且此大文件正在被某些进程读写并占用着,此时无法删除和置空此文件,只能先找到占用大文件的进程,然后终止进程,最后置空此文件. 实例如下:在/boot分区中创建大文件test,将boot分区的磁盘占满,通过另外一个终端进入主机,vim编辑此test文件,模拟大文件被vim进程占用,然后删除和清空此test文件. 终端1 [[email protected] ~]# df -h  /boot/                                

处理Linux磁盘空间满问题

对于 Linux 磁盘满的问题,我们通常的处理思路是用 du 查找可清理的大文件,然后临时删掉让磁盘使用率先降下来,从而尽快保证磁盘能继续写入. 但是,有一些情况的处理效果不太一样,du/df 呈现的结果可能还会让人迷惑不解. 下面,我就分享下几个工作中遇到过的较离奇的磁盘满问题. 一.被忽略的隐藏文件 1.认识 swapfile Linux 的交换文件 swapfile 的产生场景较普遍,而且也是以隐藏文件的形式存在的,因此这里主要聊聊 swapfile 这一类的隐藏文件. 当用 vim 打开

linux磁盘空间使用问题

linux磁盘空间用满的处理方法 linux下空间满可能有两种情况 可以通过命令 df -h  查看磁盘空间占用,实际上是查看磁盘块占用的文件(block) df -i  查看索引节点的占用(Inodes) 磁盘块和索引节点其中之一满,都会导致无法创建文件,提示磁盘空间已满. 所以请注意,查看磁盘还有空间,但是创建文件提示空间满,可能是inodes节点已满 通过命令:find / -size +100M |xargs ls -lh 列出系统内大于100M的文件 du -h --max-depth

linux磁盘空间查看inode

服务器一般是要求长期连续运行的,自动执行任务生成的各种文件及日志,可能使空间占满,从而造成业务故障,所以要定时清理. 一般来说,Linux空间占满有如两种情况: 1.空间被占满了 用df -k 可以看到使用100%,这种 情况下,满的分区无法新建文件,也无法输出日志,需要输日志的进程一般都会停止工作 2.inode占满了 inode如何理解呢,就是一个文件 对应一个inode,而linux各个分区可用的inode一般是有限的,使用df -i 可以查看使用情况.一般经常出现硬盘空间没占满,但ino

Linux 磁盘空间大小统计du命令常见用法

在 Linux下,可以对某个文件或文件夹所占空间大小进行统计,这里将一些常用用法汇总如下: 1.对指定文件或文件夹进行统计,缺省单位为kbyte(k或千字节),下例对文件夹testa进行统计: [[email protected] ~]$ du -s testa 1589308    testa 2.对文件夹统计的正确做法,如果想知道某个文件夹所占空间的大小,用什么命令?直接用du可以吗? 可以是可以,但是,它会将该文件夹底下所有目录都统计一遍,显然,这不是我们想要的.正确的做法是使用 -s操作

物理磁盘空间使用已满导致数据库hang起

情况描述 一天公司小张过来咨询,说是数据库查询报错了:乍一看好像是数据库有坏快了,为了排查更加详细的错误信息,决定查看一下告警日志,发现问题所在,原来是数据库的物理磁盘空间满了 Writing to the above trace file is disabled for now on... Tue Jul 29 17:30:32 2014 Non critical error ORA-48181 caught while writing to trace file "/u01/app/orac