Linux Shell学习-sed命令详解

(1)、sed介绍

Sed是流编辑器,stream editor,它是一个将一些列编辑命令作用于一批文本文件的理想工具。

(2)、sed工作原理

Sed是一个非交互式文本编辑器,它可以对文本文件和标准输入进行编辑,标准输入可以是来自键盘输入、文件重定向、字符串、变量,甚至来自管道的文本。

Sed从文本的一个文本行或标准输入中读取数据,将其复制到缓冲区,然后读取命令行或脚本的第一个命令,对此命令要求的行号进行编辑,重复此过程,直到命令行或脚本中的所有命令都执行完毕。

相对于诸如vi等其他文本编辑器,sed可以一次性处理所有的编辑任务,显得非常高效,为用户节省大量的时间。

(3)、Sed使用场景

  • 编辑相对交互式文本编辑器而言太大的文件
  • 编辑命令太复杂,在交互式文本编辑器中难以输入的情况
  • 对文件扫描一遍,但是需要执行多个编辑函数的情况。

(4)、sed执行三种方式

  • 在shell命令行输入命令调用sed

格式:sed [选项] ‘sed命令’ 输入文件

  • 将sed命令插入脚本文件后,然后通过sed命令调用

格式:sed [选项] -f sed脚本文件输入文件

  • 将sed命令插入脚本文件后,最常用的方法是设置该脚本文件为可执行,然后执行该脚本。

格式:shell>./sed脚本文件输入文件

不指定输入文件,sed将从标准输入中接收输入。

(5)、sed常用选项

  • -n 不打印所有行到标准输出
  • -e 表示将下一个字符串解析为sed编辑命令,如果只有一个编辑命令给sed,-e选项可以省略。
  • -f 表示正在调用sed脚本文件。

(6)、sed命令

Sed命令通常由定位文件行和sed编辑两部分组成。

Sed编辑命令对定位文本行进行各种处理。

Sed提供以下两种文本

  • 使用行号,指定一行,或指定行号范围
  • 使用正则表达式

Sed定位文本的方法如下:

  • x x为指定行号
  • x,y 指定从x到y的行号范围
  • /pattern/ 查询包含模式的行
  • /pattern/pattern/ 查询包含两个模式的行
  • /pattern/,x 从与pattern的匹配行到x号行之间的行
  • x,/pattern/ 从x号行到与pattern的匹配行之间的行
  • x,y! 查询不包含x到y行号的行

sed编辑命令

  • p 打印匹配行
  • = 打印文件行号
  • a\ 在定位行号之后追加文本信息
  • i\ 在定位行号之前追加文本信息
  • d 删除定位行
  • c\ 用新文本替换定位文本
  • s 是替换模式替换相应模式
  • r 从另一个文件中读文本
  • w 将文本写入到一个文件
  • y 变换字符
  • q 第一个模式匹配完成后退出
  • l 显示与八进制ASCII码等价的控制字符
  • {} 在定位行执行的命令组
  • n 读取下一个输入行,用下一个命令处理新的行
  • h 将模式缓冲区的文本复制到保持缓冲区
  • H 将模式缓冲区的文本追加到保持缓冲区
  • x 互换模式缓冲区和保持缓冲器的内容
  • g 将保持缓冲区的内容复制到模式缓冲区
  • G 将保持缓冲区的内容追加到模式缓冲区

(7)、sed示例

1)、-n选项

-n选项表示不打印文件的所有行。

Sed编辑命令p选项:实现打印匹配行。

-n结合p实现打印匹配到的行

[[email protected]_01 t]# cat a4.txt
66888777
877777
8877777
8887777
8888777
888 999
8888888
88877777
8abc7777
a87cccc
A87cccc
You have new mail in /var/spool/mail/root
[[email protected]_01 t]# cat a4.txt |sed  ‘1p‘
66888777
66888777
877777
8877777
8887777
8888777
888 999
8888888
88877777
8abc7777
a87cccc
A87cccc
[[email protected]_01 t]# cat a4.txt |sed -n ‘1p‘
66888777
[[email protected]_01 t]#
 
###/pattern/,x 从与pattern的匹配行到x号行之间的行#####
[[email protected]_01 t]# cat a4.txt -n
     1  66888777
     2  877777
     3  8877777
     4  8887777
     5  8888777
     6  888 999
     7  8888888
     8  88877777
     9  8abc7777
    10  a87cccc
    11  A87cccc
[[email protected]_01 t]#
[[email protected]_01 t]# cat a4.txt |sed -n ‘/^87.*/,8p‘
877777
8877777
8887777
8888777
888 999
8888888
88877777
[[email protected]_01 t]#

2)、-e选项

-e带多个编辑命令

格式:sed [选项] –e 编辑命令1  -e 编辑命令2 ….. 输入文件

[[email protected]_01 t]# cat a4.txt -n|sed -n  -e ‘1,3=‘ -e ‘1,3p‘
1
     1  66888777
2
     2  877777
3
     3  8877777

3)、-f参数

Shell>cat a4.txt
66888777
877777
8877777
8887777
8888777
888 999
8888888
88877777
8abc7777
a87cccc
A87cccc
 
Shell>touch s1.sed
Shell>cat s1.sed
#!/bin/sed -f
 
/A87cccc/a\
hello world \
what\
who
 
shell>chmod a+x s1.sed
shell>./s1.sed a4.txt
66888777
877777
8877777
8887777
8888777
888 999
8888888
88877777
8abc7777
a87cccc
A87cccc
hello world
what
who
 
 

4)、匹配最后一行

Sed结合$符号匹配最后一行。p参数可以在引号内也可以在引号外。

[[email protected]_01 t]# cat a4.txt -n
     1  66888777
     2  877777
     3  8877777
     4  8887777
     5  8888777
     6  888 999
     7  8888888
     8  88877777
     9  8abc7777
    10  a87cccc
    11  A87cccc
[[email protected]_01 t]# cat a4.txt -n|sed -n ‘$p‘
    11  A87cccc
[[email protected]_01 t]# cat a4.txt -n|sed -n ‘$‘p
    11  A87cccc
[[email protected]_01 t]#

5)、打印不在1-3之间的行

[[email protected]_01 t]# cat a4.txt -n
     1  66888777
     2  877777
     3  8877777
     4  8887777
     5  8888777
     6  888 999
     7  8888888
     8  88877777
     9  8abc7777
    10  a87cccc
    11  A87cccc
[[email protected]_01 t]# cat a4.txt -n|sed  -n   ‘1,3!p‘
     4  8887777
     5  8888777
     6  888 999
     7  8888888
     8  88877777
     9  8abc7777
    10  a87cccc
    11  A87cccc
[[email protected]_01 t]#
 
 

6)、追加文本

Sed编辑命令a\符号用户追加文本,它可以将制定文本的一行或多行追加到指定行后面。如果不指定文本追加位置,sed默认放置到每一行的后面。

追加文本的格式为:

Sed ‘指定地址a\text’ 输入文件
[[email protected] t1]# cat a1.txt
123
456
789
333
[[email protected] t1]# cat a1.txt |sed ‘/456/a\hello‘
123
456
hello
789
333
[[email protected] t1]# cat a1.txt |sed ‘a\hello‘
123
hello
456
hello
789
hello
333
hello
[[email protected] t1]#

7)、插入文本

插入文本和追加文本类似,区别仅在于追加文本是在匹配行的后面插入,而插入文本是在匹配行的前面插入,sed编辑命令的插入文本符号是i\,插入文本的格式为:

Sed ‘指定地址i\text’ 输入文件

 

[[email protected] t1]# cat a1.txt
123
456
789
333
[[email protected] t1]# cat a1.txt |sed ‘/456/i\hello‘
123
hello
456
789
333
[[email protected] t1]#

8)、修改文本

将匹配到的行利用新文本替代。

Sed编辑命令的修改文本符号为c\。

修改文本的格式为:

Sed ‘指定地址c\text’  输入文件
[[email protected] t1]# cat a1.txt
123
456
789
333
[[email protected] t1]# cat a1.txt |sed ‘/456/c\hello‘
123
hello
789
333
[[email protected] t1]#

9)、删除文本

Sed删除命令可以将指定行或指定行范围进行删除

Sed编辑命令的删除文本符号为d,删除文本格式为:

Sed ‘指定地址d’  输入文件

删除空行

[[email protected] t1]# cat a2.txt
123
 
456
789
333
[[email protected] t1]# cat a2.txt |sed ‘/^$/d‘
123
456
789
333
[[email protected] t1]#

10)、替换文本

Sed替换文本操作将匹配的文本行利用新文本替换,替换文本与修改文本功能有相似之处,它们之前的区别在于:替换文本可以替换一个字符串,而修改文本是对整行进行修改。

另外,替换文本通过替换选项使得文本替换更为灵活,功能更为强大,sed编辑命令的替换文本符号为s。

替换文本的格式为

Sed ‘s/被替换的字符串/新字符串/[替换选项]’ 输入文件

S表示sed指定替换文本操作,sed命令首先匹配被替换的字符串,匹配成功后用新字符串替换它。

Sed替换选项

  • g 表示替换文本中所有出现被替换字符串之处
  • p 与-n选项结合,只打印替换行
  • w文件名表示将输出定向到一个文件

替换选项为空

如果替换选项为空,则打印出替换后的全部文本。并且替换只替换本行第一次匹配到的字符就停止,然后继续下一行。

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  ‘s/123/aaa/‘
aaa a123
456
789
333
aaa
[[email protected] t1]#

替换选项p

-n –p结合使用:只打印替换行

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  -n ‘s/123/aaa/p‘
aaa a123
aaa
[[email protected] t1]#

缺少p命令,将不打印任何命令

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  -n ‘s/123/aaa/‘
[[email protected] t1]#

替换选项g

g选项,替换本行所有匹配的字符串

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed   ‘s/123/aaa/g‘
aaa aaaa
456
789
333
aaa
[[email protected] t1]#

-n –p –g一起使用:打印匹配到的行,并且是替换匹配到的所有字符串

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  -n  ‘s/123/aaa/pg‘
aaa aaaa
aaa
[[email protected] t1]#

替换第几次匹配的字符串

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed ‘s/123/aaa/2g‘
123 aaaa
456
789
333
123
[[email protected] t1]#

替换选项w

[[email protected] t1]# cat a1.txt |sed    ‘s/123/aaa/g w a11.txt‘
aaa aaaa
456
789
333
aaa
[[email protected] t1]# cat a11.txt
aaa aaaa
aaa
[[email protected] t1]#

已匹配字符串标记(&

在sed中,我们可以用 &标记匹配样式的字符串,这样就能够在替换字符串时使用已匹配的内容

例如:

$ echo this is an example | sed ‘s/\w\+/[&]/g‘
[this] [is] [an] [example]

正则表达式 \w\+ 匹配每一个单词,然后我们用[&]替换它。& 对应于之前所匹配到的单词。

子串匹配标记(\1

& 代表匹配给定样式的字符串。但我们也可以匹配给定样式的其中一部分。来看看具体的做法。

$ echo this is digit 7 in a number | sed ‘s/digit \([0-9]\)/\1/‘
this is 7 in a number

这条命令将digit 7替换为7。样式中匹配到的子串是7。\(pattern\)用于匹配子串。模式被包括在使用斜线转义过的()中。对于匹配到的第一个子串,其对应的标记是 \1,匹配到的第二个子串是 \2,往后依次类推。下面的示例中包含了多个匹配:

$ echo seven EIGHT | sed ‘s/\([a-z]\+\) \([A-Z]\+\)/\2 \1/‘
EIGHT seven

([a-z]\+\)匹配第一个单词,([A-Z]\+\)匹配第二个单词。\1和\2用来引用它们。这种引用被称为向后引用(back reference)。在替换部分,它们的次序被更改为\2 \1,因此结果就呈现出逆序的形式。

11)、写入一个新文件

Sed命令只是对缓冲区中输入文件的复制内容进行编辑,如果要保存编辑结果,需要将年纪后的文本重定向到另一个文件,sed写入文件的符号为w

基本格式为:

Sed ‘指定地址 w 文件名’ 输入文件
[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed -n  ‘/12/p‘
123 a123
123
[[email protected] t1]# cat a1.txt |sed -n  ‘/12/ w a2.txt‘
[[email protected] t1]# ll
总用量 8
-rw-r--r-- 1 root root 25 9月   6 20:52 a1.txt
-rw-r--r-- 1 root root 13 9月   6 21:53 a2.txt
[[email protected] t1]# cat a2.txt
123 a123
123
[[email protected] t1]#

12)、从文件中读入文本

Sed命令可以将其他文件中的文本读入,并附加在指定地址之后,sed读入文件的符号为r

基本格式为

Sed ‘指定地址 r 文件名’ 输入文件
[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a3.txt
who are you
how to learn
[[email protected] t1]# cat a1.txt |sed  ‘4 r a3.txt‘
123 a123
456
789
333
who are you
how to learn
123
[[email protected] t1]# cat a1.txt |sed  ‘/333/r a3.txt‘
123 a123
456
789
333
who are you
how to learn
123
[[email protected] t1]#

13)、退出命令

Sed命令的q选项表示完成指定地址的匹配后立即退出

基本格式为

Sed ‘指定地址 q’

打印前三行

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  ‘3 q‘
123 a123
456
789
[[email protected] t1]#

匹配到123马上退出

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed  ‘/123/ q‘
123 a123
[[email protected] t1]#

14)、变换命令

Sed命令的y选项表示字符变换,它将一些列的字符变换为响应的字符

Sed y命令是对字符的逐个处理

基本格式为

Sed ‘y/被变换的字符序列/变换的字符序列/’ 输入文件

Sed y命令将被变换字符序列中的字符逐个用变换字符序列中的字符替代,要求被变换的字符序列和变换的字符序列等长,否则sed y命令将报错。

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed ‘y/a/A/‘
123 A123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed ‘y/a2/AT/‘
1T3 A1T3
456
789
333
1T3
[[email protected] t1]#

15)、显示控制字符

控制字符就是非打印字符,如退格键,F1键、shift键等,有些文件中会包含这些字符,l命令可以显示文件中的控制字符,方便用户对控制字符进行处理。

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed -n  ‘3,$l‘
789$
333$
123$
[[email protected] t1]#

16)、在定位行执行命令组

Sed编辑命令中的{}符号可以指定在定位行上所执行的命令组,它的作用于sed的-e选项类似,都是为了在定位行执行多个编辑命令。

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# cat a1.txt |sed -n  ‘3,$ {p;=}‘
789
3
333
4
123
5
[[email protected] t1]# cat a1.txt |sed -n  -e ‘3,$p‘ -e ‘3,$=‘
789
3
333
4
123
5
[[email protected] t1]#

17)、-i选项

-i选项直接修改文件中文本内容。

[[email protected] t1]# cat a1.txt
123 a123
456
789
333
123
[[email protected] t1]# sed -i ‘s/123/BBB/g‘ a1.txt
[[email protected] t1]# cat a1.txt
BBB aBBB
456
789
333
BBB
[[email protected] t1]#

18)、编辑命令n-处理匹配行的下一行

Sed编辑命令n的意义是读取下一个输入行,用n后面的一个命令处理该行,由于此时通常有多个编辑命令,所以编辑命令n需要与{}符号结合使用。

[[email protected] t1]# cat a1.txt
456
BBB aBBB
456
789
333
BBB
456
[[email protected] t1]# cat a1.txt |sed ‘/BBB/{n;s/456/AAA/;}‘
456
BBB aBBB
AAA
789
333
BBB
AAA
[[email protected] t1]#

19)、组合多个表达式

[[email protected] t1]# cat a1.txt
456
BBB aBBB
456
789
333
BBB
456
[[email protected] t1]# cat a1.txt |sed -n ‘/BBB/p;/456/p‘
456
BBB aBBB
456
BBB
456
[[email protected] t1]#

可以利用管道组合多个sed命令:

sed ‘expression‘ | sed ‘expression‘

它等价于

$ sed ‘expression; expression‘

或者

$ sed -e ‘expression‘ -e expression‘

20)、sed中的引用

sed表达式通常用单引号来引用。不过也可以使用双引号。双引号会通过对表达式求值来对其进行扩展。当我们想在sed表达式中使用一些变量时,双引号就能派上用场了。

例如:

$ text=hello
$ echo hello world | sed "s/$text/HELLO/"
HELLO world

$text的求值结果是hello。

时间: 2024-08-05 06:52:39

Linux Shell学习-sed命令详解的相关文章

Linux Shell学习--curl命令详解

curl命令详解 (1).curl介绍 作为一款强力工具,curl支持包括HTTP.HTTPS.FTP在内的众多协议.它还支持POST.cookie.认证.从指定偏移处下载部分文件.参照页(referer).用户代理字符串.扩展头部.限速.文件大小限制.进度条等特性.如果要和网页访问序列(web page usagesequence)以及数据检索自动化打交道,那么curl定能助你一臂之力. (2).curl的help curl --help Usage: curl [options...] <u

Linux Shell学习--awk命令详解

(1).awk介绍 awk是由Alfred Aho .Peter Weinberger 和 Brian Kernighan于1977年开发的变成语言,awk是上述三位创建者姓的首字母. Awk的基本语法与c语言类似,如果对c语言很熟悉,那么学习awk编程也将事半功倍. Awk功能与sed相似,都是用来进行文本处理的,awk语言可以从文件或字符串中基于指定规则浏览和抽取信息,在抽取信息的基础上,才能进行其他文本操作.   awk是一款设计用于数据流的工具.它颇有玩头的原因就在于可以对列和行进行操作

Linux Shell学习--wget命令详解

(1).wget介绍 wget是一个用于文件下载的命令行工具,选项繁多且用法灵活. (2).wget的help [[email protected]_01 ~]# wget --help GNU Wget 1.12,非交互式的网络文件下载工具. 用法: wget [选项]... [URL]...   长选项所必须的参数在使用短选项时也是必须的.   开始:   -V,  --version           显示 Wget 的版本信息并退出.   -h,  --help            

2.2 linux sed命令详解

简介 sed 是一种在线编辑器,它一次处理一行内容.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕.接着处理下一行,这样不断重复,直到文件末尾.文件内容并没有 改变,除非你使用重定向存储输出.Sed主要用来自动编辑一个或多个文件:简化对文件的反复操作:编写转换程序等. sed使用参数 [[email protected] ~]# sed [-nefr] [动作] 选项与参数

linux 之sed命令详解

sed命令详解 sed是什么 sed是linux文本处理三剑客之一,全称 StreamEDitor,非常著名的行编辑器,功能十分强大. sed的工作过程 sed处理文本时每次从文件复制出来一行,放在工作车间,又叫做模式空间,即pattern space,然后与模式进行匹配.如果复制出来的这一行不能被模式匹配到,就默认把这一行输出至标准输出(如果用户明确指定不输出也可以). 如果能被模式匹配到,就对这行数据进行用户指定的编辑操作,编辑完成后可能输出至标准输出,也可能是用户指定的其他操作.这样第一行

文本处理工具之二 sed命令详解

======博主所学知识来着于恩师马哥的亲授====== 马哥教育"2014夏令营"开始啦!!!马哥教育是目前性价比最高的Linux培训,国内好评度排名第一,并被网友称为Linux界的"黄埔军校",全部课程采用Centos6.5x86_64讲解,经过几期网络班的总结和锤炼,逐渐完善的课程体系,学员学习进度监督和优质的考试系统检验学员掌握程度,活跃的在线答疑环节,名师陪伴,牛人指点,精彩不容错过. 详情猛戳:http://www.magedu.com/ 课程内容:ht

Linux CAT与ECHO命令详解 &lt;&lt;EOF EOF

Linux CAT与ECHO命令详解 cat命令是Linux下的一个文本输出命令,通常是用于观看某个文件的内容的: cat主要有三大功能: 1.一次显示整个文件. $ cat filename 2.从键盘创建一个文件. $ cat > filename 只能创建新文件,不能编辑已有文件. 3.将几个文件合并为一个文件. $cat file1 file2 > file cat具体命令格式为 : cat [-AbeEnstTuv] [--help] [--version] fileName 说明:

Linux Shell数组常用操作详解

Linux Shell数组常用操作详解 1数组定义: declare -a 数组名 数组名=(元素1 元素2 元素3 ) 1 declare -a array 2 array=(1 2 3 4 5) 数组用小括号括起,数组元素之间用空格分开 2显示数组长度: [@tc_132_227 dm_pid_day]$ echo ${#array[@]} 5 [@tc_132_227 dm_pid_day]$ echo ${#array[*]} 5 命令: ${#数组名[@或*]} 获取数组长度,若数组无

Linux上的free命令详解

Linux上的free命令详解 转自: http://www.cnblogs.com/coldplayerest/archive/2010/02/20/1669949.html 解释一下Linux上free命令的输出. 下面是free的运行结果,一共有4行.为了方便说明,我加上了列号.这样可以把free的输出看成一个二维数组FO(Free Output).例如: FO[2][1] = 24677460 FO[3][2] = 10321516 1          2          3