2-6. 文本处理工具

##文本处理工具##

学习目标

diff命令

patch命令

grep 命令

Cut 命令

sort 命令

uniq 命令

tr 命令

sed 命令

##diff命令

diff 命令用于比较两个文件的内容,以了解其区别。它还可用于创建补丁文件。补丁文件用于在企业环境的多台计算机之间对相似文件进行更改

##修补命令patch

patch 采用补丁文件 patchfile (包含由 diff 生成的差异列表 )并将这些差异应用于生成补丁版的一个或多个原始文件。通常,补丁版替换原始文件 ,但当指定 -b 选项时 ,可以制作备份。将用 .orig 文件名后缀重命名原始文件

patch 可用于将简单的补丁文件应用于使用以下语法的单个文件

– [[email protected] etc]# patch issue patchfile

Patching file issue

以下命令显示如何使用通过 diff -Naur 创建的补丁文件。用户更改为与从中创建补丁文件的原始目录相似的可比较目录后 ,将执行 patch

– [[email protected] orig-dir]$ patch -b < /tmp/patchfile

Patching file hosts

Patching file network

##grep 命令

grep 将显示文件中与模式匹配的行。其也可以处理标准输入

模式可以包含正则表达式元字符,因此始终为正则表达式加引号通常被视为一种好办法。在本单元后面的部分中将介

##Cut 命令

cut 用于“剪切”文件中的文本字段或列并将其显示到标准输出

##sort 命令

sort 用于排序文本数据。该数据可以位于文件中或其他命令输出中。 Sort 通常与管道一起使用

##uniq 命令

uniq“ 删除”文件中重复的相邻行。若要只打印文件中出现的唯一行(“删除”所有重复行 ),必须首先对 uniq 的输入进行排序。由于可以为uniq 指定其决策所基于的字段或列,因此这些字段或列是对其输入进行排序所必须的字段或列。如果未与选项一起使用, uniq 会使用整个记录作为决策键,删除其输入中的重复行

##tr 命令

tr 用于转字符:即,如果给定了两个字符范围,则只要发现某个字符位于第一个范围中,就会将其转换为第二个范围中对等的字符。该命令通常在 shell 脚本中使用 ,以按预期情况转换数据

tr ‘A-Z‘ ‘a-z‘ < file

##sed 命令

sed 命令是流编辑器,用于对文本数据流执行编辑。假定要处理一个文件名, sed 将对文件中的所有行执行搜索和替换 ,以将修改后的数据发送到标准输出 ; 即 ,其实际上并不修改现有文件。与 grep 一样 , sed通常在管道中使用

由于 sed 命令通常包含可以解释为 shell 元字符的字符 ,因此请按下面示例所示引用 sed 命令。默认情况下 , sed对文件中的所有行执行操作。在提供 sed 时 ,可带有地址

1.diff命令

##diff file file1   ##比较两个文件的内容

##diff -u file file1   ##比较两个文件的内容使用统一输出格式

##diff -u file file1 〉file.path  ##生成补丁文件

2.patch命令

##patch file file.path  ##补丁文件替换原始文件

##patch -b file file.path   ##可以制作备份,用 .orig 文件名后缀重命名原始文件

3.grep 命令

##grep test passwd   ##准确查找test

##grep -i test passwd   ##模糊查找,忽略大小写

##grep -i test passwd -v  ##反向查找

##grep  -i -E “root|test” passwd  ##查找两个字符root和test,忽略大小写

##grep "^test" passwd   ##查找在行首的字符

##grep "test$" passwd   ##查找在行尾的字符

##grep -n test passwd ##显示行号

##grep -c test passwd  ##显示行数

##grep -r test passwd  ##对文件进行递归式搜索

##grep westos /mnt -r  ##在目录中对文件进行递归式搜索

##grep westos /mnt -r -n ##在目录中对文件进行递归式搜索,显示行号

##grep westos /mnt -r -c ##在目录中对文件进行递归式搜索,显示行数

##ifconfig eth0 | grep netmask | cut -d " " -f 10 ##找出ip

4.Cut 命令

##cut -c 1-3 passwd    ##剪切passwd中1-3列

##cut -c 1,3  passwd    ##剪切passwd中1和3列

##cut -d  " " -f  2  file     ##剪切file中第2个字段

##cut -d  " " -f  2 -3  file     ##剪切file中第2到3个字段

##cut -d  " " -f  1-3  file     ##剪切file中第1-3个字段

5.sort 命令

##sort -n westos ##按升序排列

##sort  westos  ##按第一个数字升序排列

##sort -r westos  ##按第一个数字降序排列

##sort -rn westos  ##按降序排列

##sort -rnu westos  ##按降序排列仅显示唯一行

##sort -t : k 1 -n westos  ##-t指定分隔符 k指定字段1升序

6.uniq 命令

##sort -rn westos | uniq -u  ##显示唯一行

##sort -rn westos | uniq -n  ##显示重复行

##sort -rn westos | uniq -c  ##计行数

##sort westos   ##按第一个数字升序排序

##sort  -n  westos   ##按第一个数升序排序

##sort -t : k 3 -n westos  ##-t指定分隔符 k指定字段3升序

##sort -t : k 1 -n westos | uniq -c  ##-t指定分隔符 k指定字段1升序,计行数每行显示一次

7.tr 命令

##tr ‘a-z‘ ‘A-Z‘ < westos ##小写变大写

##tr ‘A-Z‘ ‘a-z‘ < westos   ##大写变小写

8.sed 命令

## sed ‘s/sbin/westos/g’ passwd   ##将文件内sbin换成westos,不同步

## sed ‘s/sbin/westos/g’ passwd -i  ##将文件内sbin换成westos,将结果输入到文件

##sed -e‘s/sbin/westos/g’ -e ‘s/nologin/redhat/g‘ passwd -i  ##同时转换两个字符

##cat  cui   ##写文件cui转换两个字符

##sed -f cui passwd  ##用文件cui同时转换两个字符

##sed -f cui passwd -i  ##用文件cui同时转换两个字符,将结果输入到文件

##cat passwd -b > redhat  ##将有行号的passwd文件输出到redhat

##sed ‘3,5s/sbin/westos/g’ passwd   ##把3-5行的sbin换为westos

##sed 5x redhat   ##剪贴第五行

##sed 5p redhat  ##重复第5行

##sed -n 5p westos  ##单独列出第五行

##sed 5d redhat  ##隐藏第5行

##sed -n  3,5p westos  ##单独列出3-5行

##sed  -ne 3p -ne 5p redhat  ##单独列出第3行和第5行

时间: 2024-10-08 18:33:22

2-6. 文本处理工具的相关文章

egrep及文本处理工具

egrep: 能够实现文本处理的三剑客: 文本过滤工具:grep (其实grep家族中有三个工具,也就是实现文本过滤的工具有三个,grep,                                       egrep,fgrep) 文本编辑工具:sed 文本报告生成器(格式化文本):awk 其实文本过滤工具除了grep之外还有egrep,fgrep grep:基本正则表达式: -E:选项表示支持扩展正则表达式: -F:选项表示支持fgrep正则表达式: egrep:扩展正则表达式:

文本处理工具与正则表达式、grep

一.文本处理工具 1.文本查看命令 cat [OPTION]- [FILE]- -n 显示行号 -b 空格行不加行号,有字符的行才加 -s  相邻的空行压缩为一行,长和-n联用 -v 处理windows中的^M -T 可以看到tab\space -A  显示所有控制符(包括windows文本中的^M,^T) -E  显示行结束符$ (回车) tac [OPTION]- [FILE]-  将每个指定文件按行倒置并写到标准输出. 效果与cat 相反 rev  将指定文件从最后一个字符开始显示到第一个

处理文本的工具sed,vim 编辑器的使用 &nbsp; Linux版

处理文本的工具sed Stream EDitor 行编辑器 sed一次处理一行的内容,处理时,将当前处理的行存储在临时缓冲区,称为"模式空间",接着用sed命令处理缓冲区中的内容,处理完成后,将缓冲区的内容送往屏幕,接着处理下一行不断重复,直到末尾. 一次处理一行 文件--->内存空间--->屏幕 模式空间 文件--->内存空间--->屏幕 | 保持空间 sed   -n:不输出模式空间内容的自动打印 -e:多点编辑 -f:/PATH/TO/SCRIPT_FIL

linux文本处理工具

linux文本处理工具 1.Linux 文件系统上的特殊权限: SUID     SGID   Sticky 进程的安全上下文:(1)任何一个可执行程序文件能不能启动为进程,取决发起者对程序文件是否拥有执行去权限 (2)启动为进程后,其属主为发起者,属组为发起者所属的组 (3)进程访文件的权限,取决于进程的发起者 (a)  进程的发起者,同文件的属主:则应用文件属主权限                                            (b)  进程的发起者,属于文件属组:则

Shell脚本学习指南 [ 第三、四章 ] 查找与替换、文本处理工具

摘要:第三章讨论的是编写Shell脚本时经常用到的两个基本操作.第四章总共介绍了约30种处理文本文件的好用工具. 第三章 查找与替换 概括:本章讨论的是编写Shell脚本时经常用到的两个基本操作:文本查找.文本替换. 3.1  查找文本 如需从输入的数据文件中取出特定的文本行,主要的工具为grep程序.POSIX采用三种不同grep变体:grep.egrep.fgrep整合为单个版本,通过不同的选项,分别提供这三种行为模式.who | grep -F root上面使用-F选项,以查找固定字符串r

10-IO重定向、管道及文本处理工具

bash的快捷键 Ctrl+l : 清屏 相当于clear命令: Ctrl+a:跳转至命令开始处: Ctrl+e:跳转至命令结尾处: ctrl+c :取消命令的执行 ctrl+u:删除命令行首至光标所在处的所有内容: Ctrl+k:删除光标所在处至命令行尾部的所有内容: 4 .bash的的I/O重定向及管道 程序: 指令+数据 读入数据:Input 输出数据:output 打开的文件都有一个fd: file descriptor (文件描述符) 标准输入:keyboard ,0 标准输出:mon

DAY8:文本处理工具sed和vim

8月8号,主要学习内容为: 一.文本处理工具sed 二.vim编辑器 一.文本处理工具sed 1)简介 sed是一种流编辑器,它一次处理一行内容.处理时,把 当前处理的行存储在临时缓冲区中,称为"模式空间"( pattern space),接着用sed命令处理缓冲区中的内容 ,处理完成后,把缓冲区的内容送往屏幕.接着处理下一 行,这样不断重复,直到文件末尾.文件内容并没有改变 ,除非你使用重定向存储输出.Sed主要用来自动编辑一 个或多个文件,简化对文件的反复操作,编写转换程序等. 用

Linux文本处理工具三剑客之grep

Linux家族关于文本处理的工具有三个,他们分别为grep.awk和sed,今天我就介绍一下grep文本处理工具. 首先,什么是grep呢? grep是一种文本搜索工具,基于"pattern"对给定文本进行搜索过滤,并对目标文本进行检查,并打印出符合条件的文本的一款文本处理工具.说到pattern,那么pattern又是什么呢?那就是大家所熟知的"正则表达式". grep家族又有三个成员:grep,egrep和fgrep. grep: 支持正则表达式. egrep:

文本处理工具grep和sed的用法

正则表达式:Regual Expression ReGEXP 基本正则表达式:BRE 扩展正则表达式:ERE 作用:文本搜索工具,根据用户指定的"模式(PATTERN)"对目标文本进行逐行匹配检查,并打印匹配到的行. 模式(PATTERN):由正则表达式的元自负及文本字符所编写出的过滤条件. grep[OPTIONS]PATERN[FILE] grep[OPTIONS][-e PATTERN][FILE] [OPTIONS]: --color=auto:对匹配到的文本着色高亮显示(Ce

好用的支持PDF转Word文本的工具

我们都知道,借助PDF转换成Word转换器的帮助,可以非常轻松地实现PDF转换成为Word的需求.但是网 上那么多的转换器,你知道哪个好用么?现在的时代讲得就是方便和快捷!快速易操作才是王道. 现在网上那么多的PDF转Word转换器,那么到底哪个PDF转换成Word转换器好呢?国内知名的迅捷PDF转换 成Word转换器近期给了答案:全面升级提升转换效率.支持高质量精准解析和转换.多功能PDF转换功能 涵括八大转换模式,目前迅捷PDF转换成Word转换器已经不再仅仅局限于普通的PDF转换Word的