sed的模式匹配用法探讨

[[email protected] Desktop]# cat sunsky
a
b
c
d
e
f
[[email protected] Desktop]# cat sunsky|sed ‘1,2d‘|sed ‘1,2d‘
e
f
[[email protected] Desktop]# cat sunsky|sed -e ‘1,2d‘ -e ‘1,2d‘
d
e
f

问题:

sed中-e的意思是直接在指令列模式上进行sed的动作编辑按照,那么按照-e的含义,上下两组命令的执行结果应该相同,但是为什么结果不一样呢?

解答:

下面先把两组命令的执行过程列出来给大家看!

第一组命令:

cat sunsky   # 输出了sunsky文本中a-f这6个字母

a

b

c

d

e

f

sed ‘1,2d‘

第一个命令的标准输出变成了第二条命令的标准输入,即cat sunsky输出的a,b,c,d,e,f.在第二条命令执行之后,第一条命令产生的数据流的1,2行删除掉,即删除了a和b,然后输出剩余的行,即c,d,e,f,结果如下:

c

d

e

f

sed ‘1,2d‘

第二个命令的标准输出变成了第三个命令的标准输入,即c,d,e,f,由于对于第三条命令来讲是新的数据流,因此该数据流有新的行号定义,即第一行是字母c,第二行是字母d,第三行是字母e,第四行是字母f.此时,最后一条命令即第三条命令sed ‘1,2d‘会把当前数据流的1,2行删掉,即删除了c和d这两个字母,然后输出剩余的行,即e,f,结果如下:

e

f

第二组命令:

cat sunsky   # 输出了sunsky文本中a-f这6个字母

a

b

c

d

e

f

sed -e ‘1,2d‘ -e ‘1,2d‘

该命令会对管道输入的数据流,即a,b,c,d,e,f进行行号定义,即第一行是字母a,第二行是字母b,第三行是字母c直到最后一行字母f。然后执行它的模式操作。在执行模式操作时,由于使用了两个-e,因此会拆分成2步执行,第一步先执行第一个-e ‘1,2d‘,第二步执行第二个-e ‘1,2d‘。那么具体执行过程如下:

第一个-e ‘1,2d‘  #它会将1,2行的数据删除,即删除了字母a和字母b

第二个-e ‘1,2d‘  #由于此时剩下的数据为第三行的字母c到最后一行的字母f,此时它去匹配第一行到第二行,显然是匹配不成功的,因为第一行和第二行已经在前一个模式操作时被删掉了。那么此时怎么办呢?

这个就要涉及到模式匹配操作了,由于sed的点到点匹配常用的有4种,详解如下:

一)line1,line2    纯行号匹配,第几行到第几行之间的内容,如果是前面行号匹配不到(过小则默认为当前最小的行号,过大则前后模式匹配操作都放弃),如果是后面行号匹配不到(过小则后面行号匹配操作放弃,仅前面行号匹配操作生效,过大则默认匹配到行尾)

二)/pattern/,/pattern/    纯模式匹配,第一个匹配到的模式到最后一个匹配到的模式之间的内容,如果是前面匹配模式匹配不到则前后模式匹配操作都放弃,如果是后面模式匹配匹配不到,就默认到匹配到行尾

三)/pattern/,line    第一个匹配到的模式到指定的行号之间的内容,如果是前面模式匹配匹配不到则前后模式匹配操作都放弃,如果是后面行号匹配不到(过小则后面行号匹配操作放弃,仅前面模式匹配操作生效,过大则默认匹配到行尾)

四)line,/pattern/    指定的行号到第一个匹配到的模式之间的内容,如果前面行号匹配不到(过小,就默认为当前最小的行号,过大则前后模式匹配操作都放弃),如果后面模式匹配匹配不到,就默认匹配到行尾

因此,按照上面的四种模式匹配的解释,我们这里进行分析

由于经历了第一个-e ‘1,2d‘的操作,第一行和第二行数据已经让删除了,此时仅剩下第三行到最后一行的数据,即c,d,e,f,此时最小行号是第三行。第二个-e ‘1,2d‘操作,该匹配操作很明显是属于纯行号匹配,由于第一行已经没有了,现在最小行是第三行,前面的行号1匹配过小,在纯行号匹配模式下,前面行号匹配过小,则默认为当前最小行号,即第三行。这样子,前面的行号匹配就成功了,接下来进行后面的行号匹配,由于行号2已经在第一个-e ‘1,2d‘的操作中被删除了,因此在纯行号匹配模式下,后面行号匹配过小,则仅前面行号匹配操作生效。因此第二个-e ‘1,2d‘操作的结果就是仅匹配到了第三行的字母c,然后根据操作指令d,将其删除,得到结果如下:

d

e

f

以上就是cat sunsky|sed ‘1,2d‘|sed ‘1,2d‘和cat sunsky|sed -e ‘1,2d‘ -e ‘1,2d‘这两组命令执行的不同之处,当然也是该问题的解答。

希望大家能明白,关于sed和awk的使用方法,欢迎大家和我一起交流探讨,共同进步。

sed的模式匹配用法探讨,布布扣,bubuko.com

时间: 2024-07-30 13:49:45

sed的模式匹配用法探讨的相关文章

sed命令基础用法

    sed(Stream EDitor)简介 sed是一个流编辑器编辑器,本身是一个管道命令,主要以行为单位处理文本文件,可以将数据进行替换.删除.新增.选取等特定工作:sed并不会处理文本文件本身,而是每当处理一个文件时,按顺序逐行读取到模式空间(内存)中,而后在模式空间中完成编辑,把编辑的结果输出到屏幕上,接着处理下一行,反复操作,直到文件结尾. 模式空间:将读取的内容放在内存中的一块区域编辑,这些内存空间就称为模式空间 格式: sed [options]    'Address Com

sed命令的用法

sed命令的用法 -n:选项不打印文件的所有行 [[email protected] ~]# sed '1'p 1                  //不带-n选项,sed会把所匹配的行打印出来,  root:x:0:0:root:/root:/bin/bash             //所要求的行  root:x:0:0:root:/root:/bin/bash              // 并且打印整个文本文件  bin:x:1:1:bin:/bin:/sbin/nologin syn

sed的基本用法

一.sed基本简介     sed是每次读取文件一行内容到一个缓冲区中(模式空间)进行处理,这个处理是指依次调用script中的命令对模式空间中的内容处理.注意是对模式空间的内容进行处理而非原文件,如需对原文件,则需使用选项. 二.用法 sed基本用法及选项: sed的基本用法:         sed- stream editor for filtering and transforming text         sed [OPTION]...{script-only-if-no-othe

sed的标签用法

今天更新区组列表文件,其中F=16的状态是隐藏的状态,玩家是看不到的,其他F=0,添加维护中是需要将S=0变为S=10,F=0,而同步后登录游戏发现区组列表中隐藏的测试区组也出现了并且是维护的状态! 查看脚本,发现用sed将所有的F全部=0了,没有考虑隐藏F=16的情况. <Server N="测试" A="xx.xx.xx.xx" P="12345" S="0" F="16" /> sed -

sed和awk用法

正则表达式的语法: .一点代表一个字符 . 代表任意的字符. 例1:样式 .T. ,代表3 个字符,中间是T,左右两边是任意的一个字符. 例2:... 代表字符长度是3 的字符串.若想比对 . 这个字符本身,需加上转义字符(\),写成\.. 例如:样式data\....代表data.后接3 个字符,如data.txt.data.cfg.data.123 等,都符合这个样 式,但data1234 就不符合了,因为4 个点最左边的那个点,已经用\转义其特殊意义,还原为. 这个字符本身,因此,\...

正则表达式和sed命令的用法

一.            正则表达式:   正则表达式(或称Regular Expression,简称RE)就是由普通字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式. 该模式描述在查找文字主体时待匹配的一个或多个字符串. 正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配.简单的说,正则表示式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表示式通过一些特殊符号的辅助,可以让使用者轻易的达到搜寻/删除/取代某特定字符串的处理程序.vim.gre

Linux三剑客之sed的基本用法介绍

[介绍] sed是一款强大的非交互式的文本编辑器,可以对文件文本进行增删改查的相关操作,本文主要是讲解以下sed的基本用法. [常用选项] -e 下一个参数为一个sed指令,一般只会用于同一行有多个sed的时候 -f 后面跟保存了sed指令的文件 -i 直接对内容进行修改,不加i时只是预览,并不做实际改动 -n 取消默认输出,只输出处理过的行. [编辑命令] a 追加·向匹配行后面插入内容 c 更改·更改匹配行的内容 i 插入·向匹配行前插入内容 d 删除·删除匹配的内容 s 替换·替换匹配到的

sed及grep用法详解

在linux系统有被称为文本处理三剑客grep,sed,awk. 今天与大家分享的就是gerp和sed处理工具,至于awk,我将会在晚些的时间与大家分享,在分享grep和sed之前我先要和大家说说正则表达,正则表达是什么呢,正则表达式就像是三剑客手里的剑,没有剑哪还能称的上什么剑客,所以我们要先了解以下正则表达式的简单用法. 什么是正则表达式: "正则表达式是描述一组字符窜特征的模式,用来匹配特定的字符串."--Ken Thompson 基本正则表达式的元字符有以下这些: . :匹配任

sed个人习惯用法总结

我这个是根据个人习惯做的笔记,一般常用的我就不记了,记一些爱忘记的!!! sed -[nerif] '行号,行号 action/str/str/action' file (/,@,#都是前面所说的地址定界符) sed '[email protected]@@' file sed 's///' file sed 's###' file 这三种方式都行 sed命令的语法格式: sed的命令格式: sed [option] 'sed command'filename sed的脚本格式:sed [opt