Linux命令学习计划【sed】

引言：

Sed命令是linux里用于文本行处理的命令。

为了便于说明，我在/usr/dict下创建了字典words并以此作为演示模板

先用nl 打印下words内容：

*打印篇：

Q1:如何打印某一行数据？

如果要打印第一行数据，则使用:

sed –n 1p words

如果要打印最后一行数据，则使用：

sed –n ‘$p’ words

注意的是：如果是某个具体的行号，并不需要加引号，如果含’$’等特殊字符或某些模式匹配的时候需要加引号。

你会想，仅仅是能看到头行和结尾行的数据，有什么稀奇的？试想如果一个文本，比如一个‘庞大’的log，仅仅是要看第10000行的数据，怎么去看?如果一页页去找会很麻烦，同时打开很大的文件去查找也是不现实的。这时用sed命令就非常方便。看！

sed -n 10000p words

Q2:打印连续的行？

打印连续行只要这么写：

sed –n 2,6p words

表示打印2-6行的数据

打印从第5行道结尾的数据，这么写：

sed –n ‘5,$p’ words

Q2:怎样打印不连续的行？

比如我想只打印第5、8、10数据：

这里用到了“-e”参数，每个-e 后面都可以表达式+执行动作，sed按顺序执行。

Q3:打印包含指定字符（模式匹配）的行？

当我们在一个庞大的文档中查找数据时，往往不知道要查找的东西在哪行，我们知道的可能是某行数据包含什么字符串或者符合什么样的规律，这时要用到模式匹配，把要匹配的格式放在两个’/’之间，如下：

/pattern-text/

。比如要查看含’abc’的行：

sed –n /abc/p words

要查看包含3个连续相同字符的行：

sed –n ‘/$\w$\1\1/p’ words

*新增篇

Q1:在某一行后添加新行要怎么做？

比如sedtest下有三个脚本:

写这些脚本的人都是一个作者，作者写完后发现有必要在源码中留下自己的大名。于是他这样做：

sed –in ‘1a #author is elvis’ sh01.sh sh02.sh sh03.sh

加上-i表示修改的内容直接‘写回’文档而不在屏幕输出

1a表示在第一行后插入新行，这是因为第一行往往是’#!’行。也可以把1a换为2i，表示在第二行前插入一行（当然默认了一个脚本文件至少有2行）

加上大名后作者还不满意，想一次性地把版本和日期信息加上并且加上一行注释‘This is for test’。sed也能一次性地添加多行，可以直接在后面添加换行符\n，也可以通过在shell中输入【\+回车】分开每行的输入:

除此之外，sed还可以读取一个文本文件的内容并追加到指定行的后面:

比如要在3个脚本文件末尾追加sh04.sh的内容:

sed –in ‘$r sh04.sh’ sh01.sh sh02.sh sh03.sh

sh04.sh中写了很多内容，包括定义了一些方法，比如sh04.sh中定义了bomb方法。通过上面的命令就可以把这个方法插入了3个脚本的末尾。

*删除篇

利用sed命令可以轻松删除文本文件中指定的行。

用法是：sed n1,n2d textfilepath;或sed ‘/pattern-text/d’ textfilepath

比如：我想查看一个shell脚本，但是不想看注释,同时不打印空行，可以这么做；

细心的你可能会发现我少加了”-n”参数，在打印和新增的时候通常要加上”-n”参数，因为”-n“表示是只输出匹配的行。

我们改写上面的案例，看下打印如果不加这项参数会怎样。

咦？怎么还是把所有的打印出来了？而且还重复打印了！

这是因为原始行在非安静模式下是会输出，显示不符合我们想要的结果。加上”-n”就”安静“多了!

由于删除的动作，是显示删除后原始行的数据，所以不需要加”-n“，如果加了将看不到任何效果。

*修改篇

sed命令可以修改一个文本文档的数据。

1、整行取代

sed n1,n2c textfilepath

比如我要把words中的空行用三个’#’代替，可以这么做：

2、局部修改

正则表达式是个利器，它成就了像sed，awk这样的强大的文本工具。sed可以通过匹配修改一个文本文档中任何你想修改的地方，比如：

words中每一行单词首字母都不是大写，通过sed命令就可以完善这一点，看！

比如，我想把words中每个全数字的单词都加上”0x“前缀:

*番外篇

1、小结：

通过上面的介绍，总结sed的用法规律，

sed [–nrfe] + 正则表达式或行号+执行动作 + 文件，执行动作用a,c,i这类的字符标识。

同时sed也是一个管道命令，所谓管道（pipe）命令，简单的理解是不仅可以产生数据，也可以接收和处理别的命令产生的数据。

比如一个文档中有很多重复行，用sed定位行时没必要把所有的重复行打印出来，这时可以先用uniq命令去除重复行，然后把去除重复后的数据交给sed处理：

2、扩展：

-e、-f、-r参数的含义和使用

有些人对sed中nrfe这4个参数不理解，其实理解它们不难，手册+实践就搞定。

-n上面已经说明了，这里略过。

先用man sed看下参数的说明：

可以看到-e和-f的作用都是一样，都是向命令行添加执行动作，只不过-e是直接在后面添加表达式，-f是指定一个脚本文件。

在打印篇已经看到了-e的用法，对!一条sed命令可以连续接好几个-e exp的，它告诉我们一条sed命令其实做很多事情。

比如修改篇中，我想同时实现转换大写字母和添加前缀的功能，就可以用-e参数实现：

-f的作用就是指定一个写满执行动作的文件：

比如我写了一个sed_print文件，里面写了我要打印某几行的命令：

我只要在sed命令后指定这个文档就可以打印第2行、第5行、第8行的数据，是不是很方便

-r的作用是应用扩展的正则表达式

如果不加这个参数默认使用的基本的正则表达式，这样有些语法是无法使用的，比如”+“和”?”。看看下面这个对比就知道了：

比如words不是按行分隔，而是按空格分隔，我想使其中的每个英文单词的首字母大写：

上面的正则表达式用到了“+“，所以必须加”-r“参数才可，否则就匹配不了，这也是我们在用sed命令时要十分小心的地方。

扩展的正则表达式到底扩展了哪些东西呢？

除了上面讲的+和?外还有：

1、{m,n}字符次数匹配

2、|，OR匹配

3、（），分组和反向引用

时间： 2024-09-28 05:33:26

Linux命令学习计划【sed】

Linux命令学习计划【sed】的相关文章

Linux命令学习－sed

每日linux命令学习-引用符号（反斜杠\，单引号''，双引号""）

Linux命令学习笔记目录

Linux命令学习之—每天发一个命令—mkdir

利用多核CPU来加速Linux命令 — awk、sed、bzip2、grep、wc

Linux命令学习Day1

linux命令学习-首篇

Linux命令学习总结: file命令

Linux命令学习总结：rm命令