文本处理工具之二 sed命令详解

======博主所学知识来着于恩师马哥的亲授======

马哥教育“2014夏令营”开始啦!!!马哥教育是目前性价比最高的Linux培训,国内好评度排名第一,并被网友称为Linux界的"黄埔军校",全部课程采用Centos6.5x86_64讲解,经过几期网络班的总结和锤炼,逐渐完善的课程体系,学员学习进度监督和优质的考试系统检验学员掌握程度,活跃的在线答疑环节,名师陪伴,牛人指点,精彩不容错过。

详情猛戳:http://www.magedu.com/

课程内容:http://www.magedu.com/mentuqc

网络班一体化服务:http://mageedu.blog.51cto.com/4265610/1379598

联系方式:客服QQ
2813150558  客服QQ  1661815153

============================================

sed:Stream Editor文本流编辑,sed是一个“非交互式的”面向字符流的编辑器。能同时处理多个文件多行的内容,可以不对原文件改动,把整个文件输入到屏幕,可以把只匹配到模式的内容输入到屏幕上。还可以对原文件改动,但是不会再屏幕上返回结果。

sed命令的语法格式:

sed的命令格式: sed [option]  ‘sed command‘filename

sed的脚本格式:sed [option]
-f  ‘sed  script‘filename

sed命令的选项(option):

-n :只打印模式匹配的行

-e :直接在命令行模式上进行sed动作编辑,此为默认选项

-f :将sed的动作写在一个文件内,用–f
 filename 执行filename内的sed动作

-r :支持扩展表达式

-i :直接修改文件内容

sed在文件中查询文本的方式:

1)使用行号,可以是一个简单数字,或是一个行号范围


x


x为行号


x,y


表示行号从x到y


/pattern


查询包含模式的行


/pattern   /pattern


查询包含两个模式的行


pattern/,x


在给定行号上查询包含模式的行


x,/pattern/


通过行号和模式查询匹配的行


x,y!


查询不包含指定行号x和y的行

2)使用正则表达式、扩展正则表达式(必须结合-r选项)
 


^


锚点行首的符合条件的内容,用法格式"^pattern"


$


锚点行首的符合条件的内容,用法格式"pattern$"


^$


空白行


.


匹配任意单个字符


*


匹配紧挨在前面的字符任意次(0,1,多次)


.*


匹配任意长度的任意字符


\?


匹配紧挨在前面的字符0次或1次


\{m,n\}


匹配其前面的字符至少m次,至多n次


\{m,\}


匹配其前面的字符至少m次


\{m\}


精确匹配前面的m次\{0,n\}:0到n次


\<


锚点词首----相当于  \b,用法格式:\<pattern


\>


锚点词尾,用法格式:\>pattern


\<pattern\>


单词锚点


\(\)


分组,用法格式:\(pattern\),引用\1,\2


[]


匹配指定范围内的任意单个字符


[^]


匹配指定范围外的任意单个字符


[:digit:]


所有数字,  相当于0-9, [0-9]--->  [[:digit:]]


[:lower:]


所有的小写字母


[:upper:]


所有的大写字母


[:alpha:]


所有的字母


[:alnum:]


相当于0-9a-zA-Z


[:space:]


空白字符


[:punct:]


所有标点符号

#######sed的匹配模式支持正则表达式#####################
sed‘5 q‘/etc/passwd#打印前5行
sed-n ‘/r*t/p‘/etc/passwd#打印匹配r有0个或者多个,后接一个t字符的行
sed-n ‘/.r.*/p‘/etc/passwd#打印匹配有r的行并且r后面跟任意字符
sed-n ‘/o*/p‘/etc/passwd#打印o字符重复任意次
sed-n ‘/o\{1,\}/p‘/etc/passwd#打印o字重复出现一次以上
sed-n ‘/o\{1,3\}/p‘/etc/passwd#打印o字重复出现一次到三次之间以上

   sed的编辑命令(sed
 command):


p


打印匹配行(和-n选项一起合用)


=


显示文件行号


a\


在定位行号后附加新文本信息


i\


在定位行号后插入新文本信息


d


删除定位行


c\


用新文本替换定位文本


w filename


写文本到一个文件,类似输出重定向 >


r    filename


从另一个文件中读文本,类似输入重定向  <


s


使用替换模式替换相应模式


q


第一个模式匹配完成后退出或立即退出


l


显示与八进制ACSII代码等价的控制符


{}


在定位行执行的命令组,用分号隔开


n


从另一个文件中读文本下一行,并从下一条命令而不是第一条命令开始对其的处理


N


在数据流中添加下一行以创建用于处理的多行组


g


将模式2粘贴到/pattern n/


y


传送字符,替换单个字符

对文件的操作无非就是”增删改查“,怎样用sed命令实现对文件的”增删改查“,玩转sed是写自动化脚本必须的基础之一。

sed命令打印文件信息(查询):

####用sed打印文件的信息的例子的命令######
sed -n ‘/^#/!p‘  /etc/vsftpd/vsftpd.conf
sed -n ‘/^#/!{/^$/!p}‘  /etc/vsftpd/vsftpd.conf
sed -e ‘/^#/d‘ -e ‘/^$/d‘  /etc/vsftpd/vsftpd.conf
sed -n ‘1,/adm/p‘ /etc/passwd
sed -n ‘/adm/,6p‘ /etc/passwd
sed -n ‘/adm/,4p‘ /etc/passwd
sed -n ‘/adm/,2p‘ /etc/passwd
###以下图片是对这些sed命令例子的解释和显示结果

sed命令实现对文件内容的添加:(对源文件添加的话就用-i参数):

####sed命令可以实现的添加######
#1)匹配行的行首添加,添加在同行
#2)匹配行的行中的某个字符后添加
#3)匹配行的行尾添加字符
#4)匹配行的行前面行添加
#5)匹配行的行后面行添加
#6)文件的行首添加一行
  [[email protected] ~]# sed -i ‘1 i\sed command start‘ myfile
#7)文件的行尾追加一行
  [[email protected] ~]# sed -i ‘$a \sed command end‘ myfile

sed命令实现对文件内容的删除:(对源文件直接删除用-i参数):

sed的删除操作是针对文件的行,如果想删除行中的某个字符,那就用替换(别急,替换稍后就讲,而且替换是sed最常用的)

重点:sed命令实现对文件内容的替换(替换是在shell自动化脚本中用到最多的操作)

#================源文件里面的内容===============================
[[email protected] ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=YES
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
DEVICE="eth0"
BOOTPROTO="static"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.22.1
NETMASK=255.255.0.0
#======================================================================
[[email protected] ~]# sed -i ‘/DEVICE/c\Ethernet‘ test
        #匹配DEVICE的行,替换成Ethernet这行
[[email protected] ~]# sed -i ‘s/static/dhcp/‘ test
        #把static替换成dhcp(/,@,#都是前面所说的地址定界符)
[[email protected] ~]# sed -i ‘/IPADDR/[email protected]\[email protected]@‘ test
        #匹配IPADDR的行,把22.1替换成10.12由于.号有特殊意义所有需要转义
[[email protected] ~]# sed -i ‘/connect/s#YES#NO#‘ test
        #匹配connect的行,把YES替换成NO
[[email protected] ~]# sed -i ‘s/bin/tom/2g‘ test
        #把所有匹配到bin的行中第二次及第二次之后出现bin替换成tom
[[email protected] ~]# sed -i ‘s/daemon/jerry/2p‘ test
        #把所有匹配到bin的行中第二次出现的daemon替换成jerry,并在生产与匹配行同样的行
[[email protected] ~]# sed -i ‘s/adm/boss/2‘ test
        #把所有匹配到adm的行中仅仅只是第二次出现的adm替换成boss
[[email protected] ~]# sed -i ‘/root/{s/bash/nologin/;s/0/1/g}‘ test
        #匹配root的行,把bash替换成nologin,且把0替换成1
[[email protected] ~]# sed -i ‘s/root/(&)/g‘ test
        #把root用括号括起来,&表示引用前面匹配的字符
[[email protected] ~]# sed -i ‘s/BOOTPROTO/#BOOTPROTO/‘ test
        #匹配BOOTPROTO替换成#BOOTPROTO,在配置文件中一般用于注释某行
[[email protected] ~]# sed -i ‘s/ONBOOT/#&/‘ test
        #匹配ONBOOT的行的前面添加#号,在配置文件中也表示注释某行
[[email protected] ~]# sed -i ‘/ONBOOT/s/#//‘ test
        #匹配ONBOOT的行,把#替换成空,即去掉#号,也一般用作去掉#注释
#================执行以上sed命令之后文件显示的内容====================
[[email protected] ~]# cat test
anonymous_enable=YES
write_enable=YES
local_umask=022
xferlog_enable=YES
connect_from_port_20=NO
(root):x:1:1:(root):/(root):/bin/nologin
bin:x:1:1:tom:/tom:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
daemon:x:2:2:jerry:/sbin:/stom/nologin
adm:x:3:4:boss:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0

sed引用变量:(在自动化shell脚本
中也经常会使用到变量)

     第一种当sed命令里面没有默认的变量时可以把单引号改成双引号;  

     第二种当sed命令里面有默认的变量时,那自己定义的变量需要加单引号,且sed里面的语句必须用单引

[[email protected] ~]# cat >> myfile << EOF
> hello world
> i am jie
> how are you
> EOF   #先生成一个文件
[[email protected] ~]# cat myfile
hello world
i am jie
how are you
[[email protected] ~]# name=li
         #定义一个变量,且给变量赋值
[[email protected] ~]# sed -i "s/jie/$name/" myfile
         #把匹配jie的字符替换成变量的值
[[email protected] ~]# cat myfile
hello world
i am li
how are you
[[email protected] ~]# sed -i "$a $name" myfile
          #当sed命令也有默认变量时,在去引用自己定义的变量会出现语法错误
sed: -e expression #1, char 3: extra characters after command
[[email protected] ~]# sed -i ‘$a ‘$name‘‘ myfile
          #在引用自定义的变量时,sed语句必须用单引引住,然后把自定义的变量也用单引号引住
[[email protected] ~]# cat myfile
hello world
i am li
how are you
li
[[email protected] ~]#

sed的其它高级使用:

1)把正在用sed操作的文件的内容写到例外一个文件中

[[email protected] ~]# cat test   #sed操作的文件中的内容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[[email protected] ~]# sed -i ‘s/IPADDR/ip/w ip.txt‘ test
       #把sed操作的文件内容保存到另外一个文件中,w表示保存,ip.txt文件名
[[email protected] ~]# cat ip.txt  #查看新文件的内容
ip=172.16.10.12
[[email protected] ~]#

2)读取一个文件到正在用sed操作的文件中

[[email protected] ~]# cat myfile   #文件内容
hello world
i am li
how are you
li
[[email protected] ~]# cat test  #将用sed操作的文件的内容
Ethernet
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[[email protected] ~]# sed  -i ‘/Ethernet/r myfile‘ test
      #在匹配Ethernet的行,读进来另一个文件的内容,读进来的文件的内容会插入到匹配Ethernet的行后
[[email protected] ~]# cat test  #再次查看用sed命令操作的行
Ethernet
hello world
i am li
how are you
li
#BOOTPROTO="dhcp"
HWADDR="00:0C:29:90:79:78"
ONBOOT="yes"
IPADDR=172.16.10.12
NETMASK=255.255.0.0
[[email protected] ~]#

sed的经典例子:

##1)、处理以下文件内容,将域名取出并进行计数排序,如处理:
http://www.baidu.com/index.html
http://www.baidu.com/1.html
http://post.baidu.com/index.html
http://mp3.baidu.com/index.html
http://www.baidu.com/3.html
http://post.baidu.com/2.html
得到如下结果:
域名的出现的次数 域名
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[[email protected] shell]# cat file | sed -e ‘ s/http:\/\///‘ -e ‘ s/\/.*//‘ | sort | uniq -c | sort -rn
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
[[email protected] shell]# awk -F/ ‘{print $3}‘ file |sort -r|uniq -c|awk ‘{print $1"\t",$2}‘
3 www.baidu.com
2 post.baidu.com
1 mp3.baidu.com
##2)、用grep结合sed取出网卡的ip地址
[[email protected] ~]# ifconfig | grep -B1 "inet addr" |grep -v "\-\-" |sed -n -e ‘N;s/\(eth[0-9]\).*\n.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\).*/\1 \2/p‘

 学会sed的使用是写自动化shell脚本的基础,sed也是一个非常有用且重要的命令,是文本处理工具之一,以上是我自己学习总结的sed命令简单的用法,sed还有更高级的用法,也还在学习中。

文本处理工具之二 sed命令详解

时间: 2024-10-13 22:49:53

文本处理工具之二 sed命令详解的相关文章

cut\grep\awk\sed命令详解

cut\grep\awk\sed命令详解 1.cut命令详解及实例 (1)作用:提取文件中指定的列 语法格式:cut  选项  文件名   (2)选项作用:      -d 分隔符     按照指定的分割符进行分割      -f 列号       指定提取第几列      -c 字符范围  不依赖分割符来分割,而是通过字符范围进行字段提取      -b 字节数     以字节为单位进行分割.    (3)cut实际应用案例. 例1:cut的-d和-f选项的使用,列出/etc/passwd里面

linux 之sed命令详解

sed命令详解 sed是什么 sed是linux文本处理三剑客之一,全称 StreamEDitor,非常著名的行编辑器,功能十分强大. sed的工作过程 sed处理文本时每次从文件复制出来一行,放在工作车间,又叫做模式空间,即pattern space,然后与模式进行匹配.如果复制出来的这一行不能被模式匹配到,就默认把这一行输出至标准输出(如果用户明确指定不输出也可以). 如果能被模式匹配到,就对这行数据进行用户指定的编辑操作,编辑完成后可能输出至标准输出,也可能是用户指定的其他操作.这样第一行

2.2 linux sed命令详解

简介 sed 是一种在线编辑器,它一次处理一行内容.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕.接着处理下一行,这样不断重复,直到文件末尾.文件内容并没有 改变,除非你使用重定向存储输出.Sed主要用来自动编辑一个或多个文件:简化对文件的反复操作:编写转换程序等. sed使用参数 [[email protected] ~]# sed [-nefr] [动作] 选项与参数

grep、awk、sed命令详解2

grep.awk.sed命令详解 上一篇对grep.awk.sed命令的基本参数做了介绍,这一篇写一些例子. 1.分析access.log日志内,当天访问次数最多的10个页面,并且按降序排列. # cat access.log|awk -F ' ' '{print $7}'|sort|uniq -c|sort -nr|head -10 2.获取访问最高的10个IP地址. # cat access.log|awk -F ' ' '{print $1}'|sort|uniq -c|sort -nr|

Linux Sed命令详解+如何替换换行符&quot;\n&quot;(很多面试问道)

Sed Sed是一个强大的文本处理工具 可以采用正则匹配,对文本进行插入删除修改等操作 Sed处理的时候,一次处理一行,每一次把当前处理的存放在临时缓冲区,处理完后输出缓冲区内容到屏幕,然后把下一行读入缓冲区,如此重复,直到结尾. 1.命令格式和参数 sed [-nefr] [动作] 文件 参数: -n 安静模式,在sed处理的时候,所有来自STDIN的数据都会被输出到终端,加上-n会只输出处理的哪行 -e 直接在命令列上进行sed动作编辑 -f 直接将sed的动作写在文件内 -r sed动作支

sed命令详解及实例

要想灵活的并按照需要处理文本,我们需要充分的学会并掌握三大文本处理工具,grep.sed(数据流编辑器).awk(报告文本的生成器) 下面介绍并学习sed命令的基本用法 sed又名stream editer,是行编辑器(编辑器包括字处理器和文本编辑器),是文本编辑器,是操作纯Ascii码文本的,操作文本是按行进行操作的,逐行处理文本,默认并不直接处理文本本身,操作时是将文本逐行读取到内存中,在内存中处理后并将符合模式匹配到的行显示到屏幕上,内存空间称为sed模式空间. 默认是打印模式空间. SY

【Linux学习011】sed命令详解

一.简介 sed(Stream EDitor)是一种行编辑器,Linux中有三种常见的行编辑器:gred,sed,awk,其中awk命令最复杂,grep命令最简单,sed命令难度适中. sed命令能够接收一个文件或者管道输入流,以一次处理一行的方式处理完成整个文档,能够接收管道输入流是sed命令的一个特色功能. sed命令的详细使用方法在线手册:http://www.gnu.org/software/sed/manual/sed.html sed最全命令格式展开 sed OPTIONS... [

sed命令详解和实例

sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用,功能不同凡响.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕.接着处理下一行,这样不断重复,直到文件末尾.文件内容并没有 改变,除非你使用重定向存储输出.Sed主要用来自动编辑一个或多个文件:简化对文件的反复操作:编写转换程序等. sed的选项.命令.替换标记 命令格式 sed [options

Linux Shell学习-sed命令详解

(1).sed介绍 Sed是流编辑器,stream editor,它是一个将一些列编辑命令作用于一批文本文件的理想工具. (2).sed工作原理 Sed是一个非交互式文本编辑器,它可以对文本文件和标准输入进行编辑,标准输入可以是来自键盘输入.文件重定向.字符串.变量,甚至来自管道的文本. Sed从文本的一个文本行或标准输入中读取数据,将其复制到缓冲区,然后读取命令行或脚本的第一个命令,对此命令要求的行号进行编辑,重复此过程,直到命令行或脚本中的所有命令都执行完毕. 相对于诸如vi等其他文本编辑器