sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换、删除、新增、选取等特定工作,下面先了解一下sed的用法
sed命令行格式为:
sed [-nefri] ‘command’ 输入文本
常用选项:
-n∶使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN的资料一般都会被列出到萤幕上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e∶直接在指令列模式上进行 sed 的动作编辑;
-f∶直接将 sed 的动作写在一个档案内, -f filename 则可以执行 filename 内的sed 动作;
-r∶sed 的动作支援的是延伸型正规表示法的语法。(预设是基础正规表示法语法)
-i∶直接修改读取的档案内容,而不是由萤幕输出。
常用命令:
a ∶新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c ∶取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d ∶删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i ∶插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p ∶列印,亦即将某个选择的资料印出。通常 p 会与参数 sed -n 一起运作~
s ∶取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!
举例:(假设我们有一文件名为ab)
删除某行
[[email protected] ruby] # sed ‘1d‘ ab #删除第一行
[[email protected] ruby] # sed ‘$d‘ ab #删除最后一行
[[email protected] ruby] # sed ‘1,2d‘ ab #删除第一行到第二行
[[email protected] ruby] # sed ‘2,$d‘ ab #删除第二行到最后一行
显示某行
. [[email protected] ruby] # sed -n ‘1p‘ ab #显示第一行
[[email protected] ruby] # sed -n ‘$p‘ ab #显示最后一行
[[email protected] ruby] # sed -n ‘1,2p‘ ab #显示第一行到第二行
[[email protected] ruby] # sed -n ‘2,$p‘ ab #显示第二行到最后一行
使用模式进行查询
[[email protected] ruby] # sed -n ‘/ruby/p‘ ab #查询包括关键字ruby所在所有行
[[email protected] ruby] # sed -n ‘/\$/p‘ ab #查询包括关键字$所在所有行,使用反斜线\屏蔽特殊含义
增加一行或多行字符串
[[email protected] ruby]# cat ab
Hello!
ruby is me,welcome to my blog.
end
[[email protected] ruby] # sed ‘1a drink tea‘ ab #第一行后增加字符串"drink tea"
Hello!
drink tea
ruby is me,welcome to my blog.
end
[[email protected] ruby] # sed ‘1,3a drink tea‘ ab #第一行到第三行后增加字符串"drink tea"
Hello!
drink tea
ruby is me,welcome to my blog.
drink tea
end
drink tea
[[email protected] ruby] # sed ‘1a drink tea\nor coffee‘ ab #第一行后增加多行,使用换行符\n
Hello!
drink tea
or coffee
ruby is me,welcome to my blog.
end
代替一行或多行
[[email protected] ruby] # sed ‘1c Hi‘ ab #第一行代替为Hi
Hi
ruby is me,welcome to my blog.
end
[[email protected] ruby] # sed ‘1,2c Hi‘ ab #第一行到第二行代替为Hi
Hi
end
替换一行中的某部分
格式:sed ‘s/要替换的字符串/新的字符串/g‘ (要替换的字符串可以用正则表达式)
[[email protected] ruby] # sed -n ‘/ruby/p‘ ab | sed ‘s/ruby/bird/g‘ #替换ruby为bird
[[email protected] ruby] # sed -n ‘/ruby/p‘ ab | sed ‘s/ruby//g‘ #删除ruby
插入
[[email protected] ruby] # sed -i ‘$a bye‘ ab #在文件ab中最后一行直接输入"bye"
[[email protected] ruby]# cat ab
Hello!
ruby is me,welcome to my blog.
end
bye
例如:
[[email protected] result]$ cat 11371_mobile_20110425.csv
20110425,北京,北京,13661189983
20110425,北京,北京,15810705979
WAPSJBBI_101>
WAPSJBBI_101>spooloff;
[[email protected] result]$ sed -i ‘/WAPSJBBI_101>/d‘11371_mobile_20110425.csv
[[email protected] result]$ cat 11371_mobile_20110425.csv
20110425,北京,北京,13661189983
20110425,北京,北京,15810705979
从结果上看怎么就2行都删了呢?
答案是这样的:
sed 后面那个/d是删除的作用,写成sed ‘/WAPSJBBI_101>/d‘ 11371_mobile_20110425.csv其实就是在文件11371_mobile_20110425.csv里找到跟 “WAPSJBBI_101>”匹配的行,然后删掉。因为原文中含有“WAPSJBBI_101>”的行是2个,因此就2个一口气都删除了。
删除:d命令
$ sed ‘2d‘ example-----删除example文件的第二行。
$ sed ‘2,$d‘ example-----删除example文件的第二行到末尾所有行。
$ sed ‘$d‘ example-----删除example文件的最后一行。
$ sed ‘/test/‘d example-----删除example文件所有包含test的行。
在看看以前我常写的sed ‘s/|/,/g‘ aaa.txt>bbb.txt 这个的意思就是把aaa.txt文件中所有字符串|都换成,这是怎么表示的呢?S代表字符串,g表示行内全面替换。
替换:s命令
$ sed ‘s/test/mytest/g‘ example
-----在整行范围内把test替换为mytest。如果没有g标记,则只有每行第一个匹配的test被替换成mytest。
$ sed -n ‘s/^test/mytest/p‘ example
-----(-n)选项和p标志一起使用表示只打印那些发生替换的行。也就是说,如果某一行开头的test被替换成mytest,就打印它。
$ sed ‘s/^192.168.0.1/&localhost/‘ example
-----&符号表示替换换字符串中被找到的部份。所有以192.168.0.1开头的行都会被替换成它自已加 localhost,变成192.168.0.1localhost。
$ sed -n ‘s/loveable/\1rs/p‘ example
-----love被标记为1,所有loveable会被替换成lovers,而且替换的行会被打印出来。
$ sed ‘s#10#100#g‘ example
-----不论什么字符,紧跟着s命令的都被认为是新的分隔符,所以,“#”在这里是分隔符,代替了默认的“/”分隔符。表示把所有10替换成100。