正则表达式、sed、awk相关资料笔记资料整合

正则表达式元字符:

^
  #锚定行的开始。如:/^sed/ 匹配所有以sed开头的行。

$
  #锚定行的结束。如:/sed$/ 匹配所有以sed结尾的行。

.
  #匹配一个非换行字符。 如:/s..d/ 匹配s后接任意两个个字符,最后是d。

*
  #匹配零个或多个字符。 如:/*sed/ 匹配所有模板是一个或多个空格后紧跟sed的行。

[]
  #匹配一个指定范围内的字符。 如/[Ss]ed/ 匹配Sed和sed。

[x-y]
  #匹配指定范围内的一个字符。 如 /[a-z]ed/ 匹配一个a-z之间任意字符后跟ed的行。

[^]
  #匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的行。

  #用来转义字符。 如: /sed\./匹配包含sed后面跟一个句点. (未经转义的句点通常匹配单个字符)

\<
  #词首定位符。 如:/\<love/匹配包含以love开头的单词的行。

\>
  #词尾定位符。 如/love\>/匹配包含以love结尾的单词的行。

\(..\)
  #匹配稍后将要使用的字符的标签。 如s/\(love\)able/\1rs,loveable被替换成lovers。
  #最多可以使用9个标签,模式中最左边的标签是第1个。用\1表示。

x\{m\}
  #重复字符x,m次,如:/0\{5\}/匹配包含5个o的行。

x\{m,\}
  #重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的行。

x\{m,n\}
  #重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的行。

&
  #保存搜索字符用来替换其他字符,如s/love/**&**/,love这成**love**。


Postfix方括号字符集:

[:alnum:]  #数字字符	

[:lower:]  #小写字母字符

[:alpha:]  #字母字符	

[:print:]  #可显示的字符

[:blank:]  #空格(space)与定位符(tab)字符	

[:punct:]  #标点符号字符

[:cntrl:]  #控制字符		

[:space:]  #空白(whitespace)字符

[:digit:]  #数字字符		

[:upper:]  #大写字母字符

[:graph:]  #非空格字符		

[:xdigit]  #十六进制数字

Sed学习:

1.sed选项:

-e command, --expression=command  #允许多项编辑。

-f, --filer=script-file  #指定sed脚本文件名。

-n, --quiet, --silent  #取消默认的输出。

-V, --version #打印版本和版权信息。

-h --help	 #打印帮助。

2.sed命令:

a\	#在当前行后添加一行或多行

c\	#用新文本修改(替换)当前行中的文本

d	#删除行

i\	#在当前行之前插入文本

h	#把模式空间里面的内容复制到暂缓冲区

H	#把模式空间里面的内容追加到暂缓冲区

g	#取出暂存缓冲区的内容,将其复制到模式空间,覆盖该处原有内容。

G	#取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面。

l	#列出非打印字符。

p	#打印行。

n	#读入下一输入行,并从下一条命令而不是第一条命令开始对其的处理。

q	#结束或退出sed。

r	#从文件中读取输入行。

!	#对所选行以外的所有行应用命令。

s	#用一个字符串替换另一个。

3.sed替换标志:

g	#在行内进行全局替换。

p	#打印行。

w	#将行写入文件。

x	#交换暂存缓冲区与模式空间的内容。

y	#将字符转换为另一字符(不能对正则表达式使用y命令)


sed示例:

[[email protected] mnt]# cat example.txt 
one line text
two line text
three line text
four line text
five line text
end line !!!

删除:d命令:

1.#删除文件中的第二行

[[email protected] mnt]# sed ‘2d‘ example.txt 
one line text
three line text
four line text
five line text
end line !!!

2.#删除文件中的最后一行

[[email protected] mnt]# sed ‘$d‘ example.txt 
one line text
two line text
three line text
four line text
five line text

3.#删除第三行到末尾所有行

[[email protected] mnt]# sed ‘3,$d‘ example.txt 
one line text
two line text

4.#删除文件中包含text的行

[[email protected] mnt]# sed ‘/text/‘d example.txt 
end line !!!

替换:s命令:

1.#在整行范围内把e替换为E。如果没有g标记,则每行只匹配第一个e。

[[email protected] mnt]# sed ‘s/e/E/g‘ example.txt 
onE linE tExt
two linE tExt
thrEE linE tExt
four linE tExt
fivE linE tExt
End linE !!!

2.#(-n)选项和p标志一起使用表示只打印那些发生替换的行。

[[email protected] mnt]# sed -n ‘s/d/D/p‘ example.txt 
enD line !!!

3.#&符号表示替换换字符串中被找到的部份。

[[email protected] mnt]# sed -n ‘s/^end/&for/p‘ example.txt
endfor line !!!   #这里&替换成为end

4.#on标记为1,所有的one都会被替换为oncoming!

[[email protected] mnt]# sed -n ‘s/\(on\)e/\1coming/p‘ example.txt 
oncoming line text

5.#不论什么字符,紧跟着s命令的都被认为是新的分隔符,所以这里的#是分隔符;

[[email protected] mnt]# sed -n ‘s#one#Haha#p‘ example.txt 
Haha line text

选定行的范围:逗号

1.#所有在模板th和f所确定的范围内的行都被打印。

[[email protected] mnt]# sed -n ‘/th/,/f/p‘ example.txt 
three line text
four line text

2.#打印从第二行到第一个包含以four开始的行之间的所有行。

[[email protected] mnt]# sed -n ‘2,/^four/p‘ example.txt 
two line text
three line text
four line text

3.#对于模板one和three之间的行,每行的行首添加字符串Ceshi。

[[email protected] mnt]# sed ‘/one/,/three/s/^/Ceshi/‘ example.txt 
Ceshione line text
Ceshitwo line text
Ceshithree line text
four line text
five line text
end line !!!

多点编辑:e命令

1.#(e)选项允许在同一行里执行多条命令。

[[email protected] mnt]# sed -e ‘1,3d‘ -e ‘s/five/FFFF/‘ example.txt 
four line text
FFFF line text
end line !!!

2.#一个比-e更好的命令是--expression。它能给sed表达式赋值。

[[email protected] mnt]# sed --expression=‘s/one/ONE/‘ --expression=‘/h/d‘ example.txt 
ONE line text
two line text
four line text
five line text
end line !!!

从文件读入:r命令

1.#hosts文件内容被读进来,显示在与one匹配的行后面。
#如果匹配了多行,那么hosts内容将显示在所有的匹配行下面。

[[email protected] mnt]# sed ‘/one/r /etc/hosts‘ example.txt 
one line text
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
two line text
three line text
four line text
five line text
end line !!!

写入文件:w命令

1.#example中所有包含f的行都被写入到write.txt中。

[[email protected] mnt]# sed -n ‘/f/w write.txt‘ example.txt 
[[email protected] mnt]# cat write.txt 
four line text
five line text

追加命令:a命令

1.#“----->this is a test”被追加到匹配three的行后面,sed要求命令a后面有一个反斜杠。

[[email protected] mnt]# sed ‘/three/a\----->this is a test‘ example.txt
one line text
two line text
three line text
----->this is a test
four line text
five line text
end line !!!

插入:i命令

1.#“----->this is a new line”被插入到匹配three的行前面,sed要求命令i后面有一个反斜杠。

[[email protected] mnt]# sed ‘/three/i\----->this is a new line‘ example.txt 
one line text
two line text
----->this is a new line
three line text
four line text
five line text
end line !!!

下一个:n命令

1.#如果three被匹配,则移动到匹配行的下一行,替换这一行的line为LINE,并打印且继续。

[[email protected] mnt]# sed ‘/three/{n; s/line/LINE/; }‘ example.txt 
one line text
two line text
three line text
four LINE text
five line text
end line !!!

变形:y命令

1.#把1-3行内所有匹配line任意字母的字符转变为大写。注意:正则表达式元字符不能使用这个命令。

[[email protected] mnt]# sed ‘1,3y/line/LINE/‘ example.txt 
oNE LINE tExt
two LINE tExt
thrEE LINE tExt
four line text
five line text
end line !!!

退出:q命令

1.#打印第三行后退出sed。

[[email protected] mnt]# sed ‘3q‘ example.txt 
one line text
two line text
three line text

保持和获取:h命令和G命令

1.#在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,
#除非行被删除或者输出被取消,否则所有被处理的行都将打印在屏幕上。
#接着模式空间被清空,并存入新的一行等待处理。
#这里,匹配two的行存入模式空间,h命令将其复制并存入一个称为保持缓存区的特殊缓冲区内。
#第二条语句是当达到最后一行后,G命令取出保持缓冲区的行。

[[email protected] mnt]# sed -e ‘/two/h‘ -e ‘$G‘ example.txt 
one line text
two line text
three line text
four line text
five line text
end line !!!
two line text

保持和互换:h命令和x命令

1.#互换模式空间和保持缓冲区的内容。由结果可以得出匹配three的行将被two替换。

[[email protected] mnt]# sed -e ‘/two/h‘ -e ‘/three/x‘ example.txt 
one line text
two line text
two line text
four line text
five line text
end line !!!

AWK学习:

使用方法:

awk ‘{pattern + action}‘ {filenames}


AWK内置变量:

ARGC       #命令行参数个数

ARGV       #命令行参数排列

ENVIRON    #支持队列中系统环境变量的使用

FILENAME   #awk浏览的文件名

FNR        #浏览文件的记录数

FS         #设置输入域分隔符,等价于命令行 -F选项

NF         #浏览记录的域的个数

NR         #已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。

OFS        #输出字段分隔符, 默认也是空格

ORS        #输出的记录分隔符,默认为换行符

RS         #输入的记录分隔符, 默认为换行符

此外,$0变量是指整条记录。$1表示当前行的第一个域,$2表示当前行的第二个域,......以此类推


AWK入门指南http://awk.readthedocs.org/en/latest/chapter-one.html

时间: 2024-10-29 03:07:07

正则表达式、sed、awk相关资料笔记资料整合的相关文章

sed awk 笔记(二)

都说sed awk 运维人员的必备工具.今天起开始整理相关笔记.首先认识一下这两个东西. 共性:使用相同的语法 [address]/pattern/action/flag 都是面向字符流的.从一个文件一次银行的读取输入.并输出到标准输出.即输入驱动的 都是使用正则表达式进行模式匹配的 都允许用户在脚本中指定指令 所以个人认为有几个方面需要突破:语法.正则.编写脚本的思路 [[email protected] test]#今天写的脚本显示洲及所在州的人名 #! /bin/sh awk -F ",&

Sed&amp;awk笔记之sed篇(转)

Sed是什么 <sed and awk>一书中(1.2 A Stream Editor)是这样解释的: Sed is a "non-interactive" stream-oriented editor. It is stream-oriented because, like many UNIXprograms, input flows through the program and is directed to standard output. Sed本质上是一个编辑器,

LVS的持久连接和awk/sed/grep的学习笔记

一.LVS持久连接的模式 1.PPC(persistent port connection) ipvsadm -A|E 192.168.10.1:80 -p 600 定义VIP为192.168.10.1director的80端口为持久连接,也就是只把web服务加入集群服务,可以通过改变端口实现不同服务的持久连接且把不同服务加入集群服务 2.PCC(persistent client connection) ipvsadm -A|E 192.168.10.1:0 -p 600 定义VIP为192.

sed&&awk学习笔记(1)

sed和awk的基本使用 在sed和awk中,每个指令都包括两个部分:模式和过程.模式是由斜杠(/)分割的正则表达式.过程制定一个或多个将被执行的动作. 执行过程中,读取脚本中的第一个指令并检测当前行的模式,如果没有匹配,这个过程被忽略并读取下一个指令.读取所有的指令,而不是读取与输入行匹配的第一条指令. 所有指令被解释并应用于单个行后,sed输出该行并循环处理每个输入行.awk不自动输出行,脚本中的指令控制awk最终所做的事情. 使用sed 调用sed有两种方法:在命令行上指定编辑指令,或者将

Sed&amp;awk笔记之awk篇

http://blog.csdn.net/a81895898/article/details/8482333 Awk是什么 Awk.sed与grep,俗称Linux下的三剑客,它们之间有很多相似点,但是同样也各有各的特色,相似的地方是它们都可以匹配文本,其中sed和awk还可以用于文本编辑,而grep则不具备这个功用.sed是一种非交互式且面向字符流的编辑器(a "non-interactive" stream-oriented editor),而awk则是一门模式匹配的编程语言,因为

Sed&amp;awk笔记之sed篇

http://blog.csdn.net/a81895898/article/details/8482387 Sed是什么 <sed and awk>一书中(1.2 A Stream Editor)是这样解释的: Sed is a "non-interactive" stream-oriented editor. It is stream-oriented because, like many UNIXprograms, input flows through the pr

对于Linux正则表达式在sed awk 过滤中的深入浅出

作为初学者,刚刚接触正则表达式,一定是一头雾水,不过没关系,用例子来说明. ==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==*==* 一.先来看看正则表达式是什么: 正则表达式定义: 简单的说,正则表达式就是一套处理字符串的规则和方法,以行为单位对字符串进行处理.通过特殊的符号的辅助,我们可以快速的过滤,替换某些特定的字符串.运维工作中,会有大量访问日志,错误日志,大数据,如何能够快速的过滤出我们需要的内容,

正则表达式解析 & awk/sed/grep实用实例总结文档

##正则表达式特殊字符解析 "^" 匹配行首 "$" 匹配行尾 "^$" 匹配整行为空,空行 grep -v "^$"    打印非空的行 "."  代表且只能代表任意一个字符 "*" 重复0个或多个前面一个的字符.例如"o*",重复一个或多个o ".*"  匹配所有字符.延伸: "^.*" -->以任意多个字符开头.&q

grep,sed,awk与简单正则表达式应用

grep,sed,awk与简单正则表达式应用 这里使用的测试文件是linux /etc/passwd文件,最好是复制一份进行练习,方式对文件内容造成损坏.感觉还是要多练习才能很好的使用,习题这里就不贴了,网上一找一大把. grep:   -o 用作计算出现多少次字段  -c 打印符合要求的行数  -n 在输出符合要求的行的同时也打印行号  -v 打印不符合要求的行  -A 后跟一个数字 ps -A2表示打印符合要求的行及下面两行  -B 后跟一个数字 ps -B2表示打印符合要求的行及上面两行