文件的查找与压缩归档

文件的查找与压缩归档


  • locate
  • find
  • 压缩与归档

locate

主要用途

查询系统上预建的文件索引数据库

locate - find files by namelocate [OPTION]... PATTERN...

locate查询文件时,会去搜索/var/lib/mlocate/mlocage.db, 这个数据库会在系统空闲时自动周期性进行,一般一天一次更新,手动更新命令为updatedb, 索引的构建需要遍历整个根文件系统,比较消耗资源。但locate有如下特性:

1. 模糊查找,速度快
2. 非实时查找,搜索的是文件的全路径,而非文件名
3. 可能只搜索用户具有读取与执行权限的目录

常用参数

  1. -d: --database, 指定数据库所在的目录
  2. -i: --ignore-case, 搜索时忽略大小写
  3. -n N: 只列举前N个匹配项目
  4. -r: --regexp, 搜索时支持正则表达式

使用示例

查找/etc/目录下以sh开头的文件:

[[email protected] ~#]locate /etc/sh       
/etc/shadow
/etc/shadow-
/etc/shells
[[email protected] ~#]locate -r "/etc/\<sh"  # 正则,锚定词首
/etc/shadow
/etc/shadow-
/etc/shells
[[email protected] ~#]

更新数据库

[[email protected] ~#]locate ~/a
/root/anaconda-ks.cfg
[[email protected] ~#]updatedb
[[email protected] ~#]locate ~/a
/root/a.sh
/root/anaconda-ks.cfg
[[email protected] ~#]

忽略字符大小写

[[email protected] ~#]locate -i ~/d
/root/Desktop/root/Documents/root/Downloads
/root/d1
/root/dd
/var/lib/pcp/pmdas/root/domain.h
[[email protected] ~#]

find

主要用途

实时查找文件

find - search for files in a directory hierarchy
find [-H] [-L] [-P] [-D debugopts] [-Olevel] [path...] [expression]

find命令是一个实时查找工具,通过遍历指定路径而完成对文件的查找;在使用该命令时,如果不选定参数,则在当前目录下查找子目录与文件并显示之;另外,任何位于参数之前的字符串,都将视为欲查找的目录名。由于是实时遍历查找,find有如下特性:

精确实时查找,速度慢
可能只搜索用户具备读取和执行权限的目录

find语法:

find [OPTION]... [查找路径] [查找条件] [处理动作]查找路径:指定具体目标路径,默认为当前目录
查找条件:指定的查找标准,可以是文件名、大小、类型、权限等标准进行;默认为找出指定路径下的所有文件
处理动作:对符合条件的文件做操作,默认输出至屏幕

查找条件

1. 根据文件名和inode查找
2. 根据属主、属组查找
3. 根据文件类型查找
4. 根据逻辑组合条件查找
5. 根据文件大小来查找
6. 根据时间戳来查找 
7. 根据权限来查找

处理动作

1. -print: 默认动作,显示至屏幕
2. -ls: 类似于对查找到的文件执行 ls -l 命令
3. -delete: 删除查找到的文件
4. -fls file: 查找到的所有长格式的信息保存至指定文件中
5. -ok COMMMAND {} \;   对查找到的每个文件执行由COMMAND指定的命令,且都会交互式要求用户确认
6. -exec COMMAND {} \;  对查找到的每个文件执行由COMMAND指定的命令;
7. {}: 用于引用查找至的文件名称自身
8. find 传递查找到的文件至后面指定的命令时,查找到所有符号条件的文件一次性传递给后面的命令
9. 有些命令不能接受过多的参数,此时命令执行可能会失败,用 xargs 来规避此问题
    find |xargs COMMAND

常用参数

文件名和inode类:

  1. -name "文件名称": 支持使用glob, *, ?, [], [^]
  2. -iname "文件名称": 不区分字母大小写
  3. -inum n: 按inode号查找
  4. -somefile name: 相同的inode号文件
  5. -links n: 链接数为n的文件
  6. -regex "PATTERN": 以PATTERN匹配整个文件路径字符串,而不仅仅是文件名称

属主属组类:

  1. -user USERNAME: 查找属主为指定用户(UID)的文件
  2. -group GROUPNAME: 查找属组为指定组(GID)的文件
  3. -uid UserID: 查找属主为指定的UID号的文件
  4. -gid GroupID: 查找属组为指定的GID号的文件
  5. -nouser: 查找没有属主的文件
  6. -nogroup: 查找没有属组的文件

文件类型类:

b      block (buffered) special

c      character (unbuffered) special

d      directory

p      named pipe (FIFO)f      regular file

l      symbolic  link

s      socket

逻辑组合条件类:

组合条件:
    与:-a
    或:-o
    非:-not, !
    
摩根定律:
    (非P) 或(非Q) = 非(P且Q)
    (非P) 且 (非Q) = 非(P或Q)
示例:
    !A -o !B = !(A -a B)
    !A -a !B = !(A -o B)

文件大小类:

-size [+|-]#UNIT
    常用单位:k,M,G 
#UNIT: (#-1,#]
    如:5M 表示 (4M,5M]
-#UNIT: [0,#-1]
    如:-5M 表示 [0,5M]
+#UNIT: (#,oo)
    如:+5M 表示 (6M,oo)

关于文件大小类的解释:为什么-size 5M 还是找精确的5M而是表示(4M,5M], 试想文件的大小指什么?是指文件数据的大小还是包括了元数据后的大小,那你找元数据的大小有意义吗?但文件的大小肯定是包含元数据大小的,而我们一般以文件大小找文件时往往考虑的是文件数据的大小;另外,精确查找一定大小的文件意义不大;所以这里的大小会有1个单位的浮动。

时间戳类:

以”天”为单位:
    -atime [+|-]#        
        #: [#,#+1)
        +#: [#+1,oo)        
        -#: [0,#)
    -mtime    
    -ctime

以“分钟”为单位:
    -amin    
    -mmin    
    -cmin

关于时间戳类的解释:为什么-atime 3 表示的是 [3,4),这个就很好解释了,我们这儿所说的时间是指时间段而非时刻,一“天”与一“分钟”都是指一个时间段,只有[3,4)这个半闭半开的区间才能完整地表示第三天。

权限类:

-perm [/|-]MODE
    MODE: 精确匹配权限
    /MODE: 任何一类(u,g,o)对象的权限中只要能一位匹配即可,属于或关系。以前用‘+‘,CentOS 7以‘/‘替代之
    -MODE: 每一类对象都必须同时拥有指定权限,属于与关系 
    0:表示不关注 
    
示例:
    find -perm 644 表示要严格匹配644的文件
    find -perm +222 表示u,g,o任何一类用户有写权限即匹配
    find -perm -222 表示仅严格匹配写权限,即每个用户必须要有写权限
    find -perm -002 表示仅严格匹配other用户的写权限

使用示例

1.将配置文件备份到指定目录下并添加扩展名.org

[[email protected] ~#]find -name "*.conf" -exec cp -r {} /testdir/{}.org \;

2.提示删除存在时间超过3天以上的liansir的临时文件

[[email protected] ~#]find /tmp -ctime +3 -user liansir -ok rm {} \;

3.在主目录中查找可被其它用户写入的文件

[[email protected] ~#]find ~ -perm -002 -exec chmod o-w {} \;

4.查找/var目录下属主为root,且属组为mail的所有文件

[[email protected] ~#]find /var/ -user root -group mail -ls
402656342    4 drwxrwxr-x   2 root     mail         4096 Aug 15 22:56 /var/spool/mail
407540491    4 -rw-------   1 root     mail         2878 Aug 14 00:25 /var/spool/mail/root
[[email protected] ~#]

5.查找/var目录下不属于root、lp、gdm的所有文件

[[email protected] ~#]find /var/ ! -user root ! -user lp ! -user gdm

6.查找/var目录下最近一周内其内容修改过,同时属主不为root,也不是postfix的文件

[[email protected] ~#]find /var/ -ctime -7 ! -user root ! -user postfix

7.查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件

[[email protected] ~#]find / -nouser -nogroup -atime -7 | wc -l
find: ‘/proc/7562/task/7562/fd/6’: No such file or directory
find: ‘/proc/7562/task/7562/fdinfo/6’: No such file or directory
find: ‘/proc/7562/fd/6’: No such file or directory
find: ‘/proc/7562/fdinfo/6’: No such file or directory
15
[[email protected] ~#]

8.查找/etc目录下大于1M且类型为普通文件的所有文件

[[email protected] ~#]find /etc/ -type f -size +1M
/etc/udev/hwdb.bin
/etc/selinux/targeted/policy/policy.29
/etc/brltty/zh-tw.ctb
[[email protected] ~#]

9.查找/etc目录下所有用户都没有写权限的文件

[[email protected] ~#]find /etc/ ! -perm /222

10.查找/etc目录下至少有一类用户没有执行权限的文件

[[email protected] ~#]find /etc/ ! -perm -111  # 至少有一类用户没用就是所有用户都没有

11.查找/etc/init.d目录下,所有用户都有执行权限,且其它用户有写权限的文件

[[email protected] ~#]find /etc/init.d/ -perm -113
或
[[email protected] ~#]find /etc/init.d/ -perm -111 -perm -002

12.摩根定律

找出/tmp目录下,属主不是root,且文件名不以f开头的文件

[[email protected] ~]#find /tmp \( -not -user root -a -not -name ‘f*‘ \) -ls
即
[[email protected] ~]#find /tmp -not \( -user root -o -name ‘f*‘ \) -ls

13.排除目录

查找/etc/下,除/etc/sane.d目录的其它所有.conf后缀的文件

[[email protected] ~]#find /etc -path ‘/etc/sane.d‘ -prune -o -name ‘*.conf‘

14.匹配文件路径或文件

[[email protected] ~]#find /usr/ -path ‘*local‘

15.基于正则表达式匹配文件路径

[[email protected] ~]#find . -regex "\(.*\.txt | \.cfg\)$"

压缩与归档

数据压缩,就是在不丢失数据信息的前提下减少数据量的一种技术。

compress

compress是一个古老的压缩工具,其压缩文件后缀为.Z,zcat命令可查看.Z的文件,但并不解压。

-d: 解压缩-c: 结果输出至标准输出,不删除原文件-v: 显示详情

使用示例

[[email protected] /testdir]#compress passwd     # 压缩
[[email protected] /testdir]#ls
passwd.Z
[[email protected] /testdir]#compress -d passwd  # 解压
[[email protected] /testdir]#ls
passwd
[[email protected] /testdir]#
[[email protected] /testdir]#zcat passwd.Z > passwd
[[email protected] /testdir]#lspasswd  passwd.Z
[[email protected] /testdir]#

gzip

gzip压缩后的文件后缀为.gz,如果压缩的是tar备份文件,则扩展名为.tar.gz

gzip, gunzip, zcat - compress or expand files

-d: 解压缩,相当于unzip
-c: 将压缩或解压缩的结果输出至标准输出
-#:1-9,指定压缩比zcat: 不显示解压缩的前提下查看文本文件内容

使用示例

[[email protected] /testdir]#gzip passwd 
[[email protected] /testdir]#ls
passwd.gz  passwd.Z
[[email protected] /testdir]#
[[email protected] /testdir]#zcat passwd.gz > passwd
[[email protected] /testdir]#ls
passwd.gz  passwd  passwd.Z
[[email protected] /testdir]#

bzip2

bzipw2压缩的文件的扩展名为.bz2

-k: keep,保留原文件
-d: 解压缩
-#:1-9,压缩比,默认为6bzcat: 不显示解压缩的前提下查看文件文件内容

使用示例

[[email protected] /testdir]#bzip2 passwd
[[email protected] /testdir]#ls
passwd.gz  passwd.bz2  passwd.Z[
[email protected] /testdir]#bzcat passwd.bz2 > passwd
[[email protected] /testdir]#ls
passwd.gz  passwd  passwd.bz2  passwd.Z
[[email protected] /testdir]#

xz

xz压缩后的文件扩展名为.xz

-k: keep,保留原文件
-d: 解压缩
-#:1-9,压缩比,默认为6xzcat: 不显示解压缩的前提下查看文件文件内容
[[email protected] /testdir]#xz passwd
[[email protected] /testdir]#ls
passwd.bz2  passwd.gz  passwd.xz  passwd.Z
[[email protected] /testdir]#
[[email protected] /testdir]#xzcat passwd.xz > passwd
[[email protected] /testdir]#ls
passwd  passwd.bz2  passwd.gz  passwd.xz  passwd.Z
[[email protected] /testdir]#

zip: 打包压缩

文件经zip压缩后会另外生成.zip的文件而不删除原文件。

zip - package and compress (archive) files

-r: 递归处理,将指定目录下的所有文件与子目录一并处理
-q: 不显示执行过程

使用示例

[[email protected] /testdir]#zip -q passwd ./passwd
[[email protected] /testdir]#ls
passwd  passwd.bz2  passwd.gz  passwd.xz  passwd.Z  passwd.zip
[[email protected] /testdir]#

看看大概的压缩情况:

[[email protected] /testdir]#ll
total 192
-rw-r--r--. 1 root root 164065 Aug 19 09:06 message.zip
-rw-r--r--. 1 root root   4129 Aug 19 08:46 passwd
-rw-r--r--. 1 root root   1526 Aug 19 08:30 passwd.bz2
-rw-r--r--. 1 root root   1539 Aug 19 08:39 passwd.gz
-rw-r--r--. 1 root root   1540 Aug 19 08:45 passwd.xz
-rw-r--r--. 1 root root   2151 Aug 19 08:16 passwd.Z
-rw-r--r--. 1 root root   1676 Aug 19 09:02 passwd.zip
[[email protected] /testdir]#

tar

tar [OPTION...] [FILE]...

EXAMPLES
   tar -cf archive.tar foo bar
          # Create archive.tar from files foo and bar.

   tar -tvf archive.tar
          # List all files in archive.tar verbosely.

   tar -xf archive.tar
          # Extract all files from archive.tar.

tar命令可为文件或目录创建档案(备份文件),tar命令可将很多文件打包成一个文件,从而可结合压缩工具实现归档并压缩了。

常用参数

  1. -c: --creat, 创建新的备份文件
  2. -f: --file=ARCHIVE, 指定备份文件
  3. -x: --extract, --get, 从备份文件中还原文件
  4. -t: --list, 列出备份文件的内容
  5. -v: --verbose

tar用法小结:

(1) 创建归档
    tar -c -f /PATH/TO/SOMEFILE.tar FILE...
    tar cf/PATH/TO/SOMEFILE.tar FILE...
(2) 查看归档文件中的文件列表
    tar -t -f /PATH/TO/SOMEFILE.tar(3) 展开归档
    tar -x -f /PATH/TO/SOMEFILE.tar
    tar -x -f /PATH/TO/SOMEFILE.tar -C /PATH/
(4) 结合压缩工具实现:归档并压缩
    -j: bzip2, -z: gzip, -J: xz
    
打包成tar包:
    tar -cvf passwd.tar passwd   仅打包,不压缩
    tar -zcvf passwd.tar.gz passwd  打包并以gzip压缩
    tar -jcvf passwd.tar.bz2 passwd   打包并以bzip2压缩
    tar -Jcvf passwd.tar.xz passwd    打包并以xz压缩

使用示例

[[email protected] /testdir]#tar -cf passwd.tar passwd
[[email protected] /testdir]#ls
passwd  passwd.tar

[root @centos7 /testdir]#tar -zcf passwd.tar.gz passwd
[[email protected] /testdir]#ls
passwd  passwd.tar  passwd.tar.gz

[[email protected] /testdir]#tar -jcf passwd.tar.bz2 passwd
[[email protected] /testdir]#ls
passwd  passwd.tar  passwd.tar.bz2  passwd.tar.gz

[[email protected] /testdir]#tar -Jcf passwd.tar.xz passwd
[[email protected] /testdir]#ls
passwd  passwd.tar  passwd.tar.bz2  passwd.tar.gz  passwd.tar.xz
[[email protected] /testdir]#
[[email protected] /testdir]#tar -tvf passwd.tar   # 查询
-rw-r--r-- root/root     10240 2016-08-19 09:27 passwd
[[email protected] /testdir]#tar -tvf passwd.tar.gz
-rw-r--r-- root/root     10240 2016-08-19 09:27 passwd
[[email protected] /testdir]#
[[email protected] /testdir]#tar xf passwd.tar  # 解压
[[email protected] /testdir]#ls
passwd  passwd.tar  passwd.tar.bz2  passwd.tar.gz  passwd.tar.xz
[[email protected] /testdir]#tar xf passwd.tar.gz
[[email protected] /testdir]#ls
passwd  passwd.tar  passwd.tar.bz2  passwd.tar.gz  passwd.tar.xz
[[email protected] /testdir]#
[[email protected] /testdir]#ll
total 44
-rw-r--r--. 1 root root 10240 Aug 19 09:27 passwd
-rw-r--r--. 1 root root 20480 Aug 19 10:52 passwd.tar
-rw-r--r--. 1 root root   116 Aug 19 10:53 passwd.tar.bz2
-rw-r--r--. 1 root root   120 Aug 19 10:52 passwd.tar.gz
-rw-r--r--. 1 root root   180 Aug 19 10:53 passwd.tar.xz

cpio

cpio命令是通过重定向的方式将文件进行打包备份,还原恢复的工具,它可以解压以.cpio或者.tar结尾的文件;换言之,cpio可以复制文件到归档包中,或者从归档包中复制文件。

cpio - copy files to and from archives

cpio[选项] > 文件名或者设备名
cpio[选项] < 文件名或者设备名

EXAMPLES
% ls | cpio -ov > directory.cpio

% find . -print -depth | cpio -ov > tree.cpio

% cpio -iv < directory.cpio

% cpio -idv < tree.cpio

% find . -depth -print0 | cpio --null -pvd new-dir

常用参数

  1. -o: --create,Run in copy-out mode,将文件拷贝打包成文件或者将文件输出到设备上
  2. -i: --extract,Run in copy-in mode,解包,将打包文件解压或将设备上的备份还原到系统
  3. -t: 预览,查看文件内容或者输出到设备上的文件内容
  4. -v: 显示打包过程中的文件名称。
  5. -d: 解包生成目录,在cpio还原时,自动的建立目录
  6. -c: 一种较新的存储方式

使用示例

[[email protected] /]#find ./etc |cpio -o > etc.cpio  # 备份/etc目录

[[email protected] /testdir]#find /etc/issue |cpio -o >issue.cpio1 block
[[email protected] /testdir]#lsissue.cpio
[[email protected] /testdir]#cpio -tv <issue.cpio # 显示预览
-rw-r--r--   1 root     root           23 Dec  9  2015 /etc/issue1 block
[[email protected] /testdir]#

cpio在打包备份时用的是绝对路径,且cpio无法直接读取文件,它需要每个文件或目录的完整路径名才能读取识别,故cpio命令一般与find配合使用。



本文主要讲解了文件查找与压缩,文件查找命令主要有locate与find; 常见的压缩工具有gzip, bzip2, xz, zip还有tar这个打包压缩归档命令。

止战

2016.8.19

时间: 2024-10-09 12:13:28

文件的查找与压缩归档的相关文章

7-2 文件查找和压缩归档

文件查找和压缩归档 文件查找 locate命令 介绍 查询系统上预建的文件索引数据库 /var/lib/mlocate/mlocate.db 依赖于事先构建的索引 索引的构建是在系统较为空闲时自动进行(周期性任务),管理员手动更新数据库(updatedb) 索引构建过程需要遍历整个根文件系统,极消耗资源 工作特点: 查找速度快 模糊查找 非实时查找 搜索的是文件的全路径,不仅仅是文件名 可能只搜索用户具备读取和执行权限的目录 语法 locate KEYWORD 常用选项 -i 不区分大小写的搜索

linux下面文件的查找和压缩

   文件的查找     1.脚本文件名的查询--which     1.which这个命令是根据PATH这个环境变量所规范的路径去查询"执行文件"的文件名. 2.文件名的查询--whereis .locate.find     whereis 和locate都是利用数据库查询数据,所以速度相当快,而且并没有实际查询硬盘. whereis -b:只查找二进制文件 -m:只找在说明文件manual路径下的文件 -s:只查找source源文件 locate: -i忽略大小写   -r后面可

Linux下的文件压缩归档与系统进程管理

Linux下的文件压缩归档与系统进程管理   一:实验环境 1):在虚拟机下配置好linux系统 2):了解文件压缩归档的含义 二:实验目标 1):理解并会用文件的压缩归档 2):熟练掌握文件压缩归档的命令 3):理解各种压缩形式的使用环境 4):理解个文件的压缩区别 三:实验步骤 一:压缩的常用形式及命令 1):常用形式 grub.tar grub.tar.bz2 grub.tar.gz grub.tar.zip 2):压缩命令分析 [[email protected] test]#tar -

linux之文件查找find grep详解,以及压缩归档

.find linux里的实时查找工具,通过制定路径完成文件查找. find[options]...[查找路径] [查找条件] [处理动作] 查找路径:查找的位置,默认是当前文件夹. 查找条件:指定查找的标准,文件名,大小,类型,日期等. 处理动作:对符合条件的文件做什么类型操作,默认是输出. 查找条件 根据文件名查找 -name 指定名称,可以使用正则 find /etc -name *.conf -maxdepth 2 -iname 忽略大小写 -links n 引用磁盘次数为n的文件 fi

关于文件查找和解压缩

文件查找和解压缩在文件系统上查找符合条件的文件,文件查找的工具有两个,locate 和 find文件查找分为:            locate      非实时查找 (在数据库查找)             updatedb   更新数据库            经常用于搜索稳定的文件,比如配置文件            var/lib/mlocate/mlocate.db 数据库路径             find     实时查找 locate :       查询系统上预建的文件索引

Linux文件查找及压缩常用知识总结

一.文件查找 1.locate命令: locate KEYWORD 常用选项:     -i 执行区分大小写的搜索     -n  N只列举前N个匹配项目 查询系统上预建的文件索引数据库在:/var/lib/mlocate/mlocate.db上,由于事先建立索引,所以查找速度快. 2.find命令: 实时查找工具,通过遍历指定路径完成文件查找,查询的速度稍微慢点,精确查找,实时查找.可能只搜索用户具备读取和执行权限的目录. find - search for files in a direct

Linux 第十天: (08月15日) 文件查找和压缩

locate  非实时查找(数据库查找) /var/lib/mlocate/mlocate.dblocate -i 执行区分大小写的搜索locate -n N 只列举前N个匹配项目locate foo 搜索名称或路径中带有"foo"的文件locate -r '\.foo$'使用Regex来搜索以".foo"结尾的文件 find -name " 文件名称"支持使用glob *, ?, [], [^]find -iname" 文件名称&qu

Linux中的文件查找和解压缩

Linux的文件查找 概述: 本章将主要介绍在Linux中怎样查找文件和解压缩.需要我们掌握的知识有:locate和find 命令的使用,以及如何使用压缩和解压缩工具. 一.Linux文件查找 在文件系统上常常需要根据文件的各种属性去查找符合条件的文件,此前使用的grep,egrep,fgrep属于文本过滤.文本搜索工具:而文件查找工具有两个,locate和find 1.文件查找分为两类: □实时查找:偏历所有文件进行条件匹配       find □非实时查找(数据库查找):根据索引查找  l

文件查找和压缩

在linux系统上,有一个核心思想,那就是一切皆文件.那我们在和linux系统打交道的同时,不免要和文件打交道.既然如此,那掌握文件查找.压缩.解压缩和文件归档类工具是我们必不可少的一项技能. 文件查找工具:locate.find locate是一款非实时性查询工具,它是根据事先建立的索引数据库来查找文件,索引的构建是在系统不繁忙时自动创建,需要遍历整个根文件系统,极其消耗资源,管理员也可以手工创建.正因为如此,所以locate查询文件比较快,但不能够精确查找,都是模糊查询. locate -i