sed和awk用法

正则表达式的语法:

.一点代表一个字符
. 代表任意的字符。
例1:样式 .T. ,代表3 个字符,中间是T,左右两边是任意的一个字符。
例2:...
代表字符长度是3 的字符串。若想比对 . 这个字符本身,需加上转义字符(\),写成\.。
例如:样式data\....代表data.后接3 个字符,如data.txt、data.cfg、data.123 等,都符合这个样
式,但data1234 就不符合了,因为4 个点最左边的那个点,已经用\转义其特殊意义,还原为.
这个字符本身,因此,\....和1234 比对不符。
^ 在行首
^ 代表位置在行的开头。
例如:样式 ^Jack,代表Jack 应出现在行首,才算符合样式。像Jack and Marry 123 就
符合此样式,但Hi Jack 就不符合,因为Jack 没有出现在该行的最前面。
$在尾部
13 $代表位置在行的最后面。
例如:样式123$,代表在行的最后面是123。像Jack and Marry 123 即符合此样式。
[...] 字符集合
[...] 代表字符串行中的一个字符(长度为1 个字符)。
例1:样式 [ABc],代表A 或B 或c 这3 个字符中的一个。
例2:[Ss]ame 代表Same 或same。
以下是常见的用法:
[A-Z] 一个大写字母
[a-z] 一个小写字母
[0-9] 一个数字
[^A-Z] 除了大写字母之外的一个字符
[^a-zA-Z] 一个非英文字母的字符
[^a-zA-Z0-9] 一个非英文字母、且非数字的字符^ 出现在括号里的第一个位置,代表“非/不是”之意。
* 出现0 个以上
* 代表前面的(左邻)字符有0 个或0 个以上。
例如:样式aA*c,代表A 这个字符可能出现0 个或0 个以上。例如:ac、aAc、aAAc、
aAAAc 都符合此样式。
\{...\} 指定符合的个数
指定前面的(左邻)字符的个数。
例如:\{3,5\} 表示前面的字符有3~5 个。[a-z]\{3,5\}代表以小写字母组成的字符串,长
度是3~5。
\(...\) 把比对符合的字符串暂时保存起来
例如:H\(...\)y 表示要保存H 和y 之间的3 个字符。
若要提取保存的字符串,可用位置参数,\1 代表第一个保存的字符串,\2 代表第二个,
其他类推。

sed 的用法

sed 的语法如下:

sed ‘样式命令‘ 文件

它的意思是说:如果文件中某一行符合“样式”,就执行指定的sed 命令,如删除(d)或取代(s)。这里的“样式”使用一对//含括,表示寻找之意;也可以指定数据行的范围,例如:1,6表示作用范围是由第1 行到第6 行;/AAA/,/DDD/表示作用范围是从含有 AAA 的数据行,到含有DDD 的数据行。

请特别注意:sed 并不会更改文件内容。sed 的工作方式是读取文件内容,经流编辑之后,把结果显示到标准输出。因此,如果想要存储sed 的处理结果,得自行运用转向输出将结果存成其他文件。

sed 的各种用法:

?? sed 的用法1:删除某一段范围的数据行。
sed ‘1,4d‘ dataf1
把第1 到第4 行数据删除,剩下的显示出来。d 是sed 的删除命令。
?? sed 的用法2:把含有“样式”的数据行删除。
sed ‘/La/d‘ dataf3
把含有La 的行删除,剩下的显示出来。其中,/ / 代表搜索之意。
sed ‘/[0-9]\{3\}/d‘ dataf3
把含有“3 位数”的行删除,剩下的显示出来。
在样式[0-9]\{3\}中,\{3\} 表/ /要寻找的是3 个数字组成的字符串。
sed ‘/^$/d‘ dataf5
删除dataf5 的空白行。^ 表开头,$ 表尾部,这两者之间没有任何字符,代表该行是一
空白行。
?? sed 的用法3:把不含有“样式”的数据行删除。
sed ‘/La/!d‘ dataf3
把不含有La 的行删除,剩下的显示出来。
这里的!是否定的意思,表示不符合样式者。
?? sed 的用法4:把含有“样式”的数据行显示出来。
sed ‘/La/p‘ dataf3
把含有La 的行显示出来。其中,p 是sed 的命令,它会把目前的数据显示出来,
但因为sed 默认也会显示不符合的数据行,所以,应改用以下指令:
sed -n ‘/La/p‘ dataf3
选项-n 会抑制sed 显示出其他资料行的默认操作,只显示符合样式的数据行。
?? sed 的用法5:取代。
sed -n ‘s/La/Oo/p‘ dataf3
这里的s 是取代的意思,第一对//中含括的字符串(La)是搜索的目标,第二对//含
括的是置换的字符串(Oo)。它会把数据行中的字符串La 换成Oo。
请注意:上面这个指令,只会更换第一个出现的La 而已,如要全部置换,应再加上全
局的命令g,如下所示:
sed -n ‘s/La/Oo/gp‘ dataf3
这样就会把所有找到的La 全换成Oo 了。
取代的用法,还有以下几个:
sed -n ‘s/La//p‘ dataf3
把每一行第一个出现的La 删除(把La 置换成空字符串,就是删除)。
sed ‘s/^...//‘ dataf3
把每一行开头的3 个字符删除。
sed ‘s/...$//‘ dataf3
把每一行末尾3 个字符删除。
?? sed 的用法6:取用符合样式的字符串。
sed -n ‘s/\(La\)/\1Oo/p‘ dataf3
把找到的La 存起来,用\1 取回来再使用。
这个指令作用的结果:若数据行含有La 字符串,则第一个出现的La 会置换成LaOo,
然后再显示这些含有La 的数据行。
?? sed 的用法7:找到符合样式的数据行后,再进行取代的操作。
sed -n ‘/AAA/s/234/567/p‘ dataf3
找到含有AAA 的那一行之后,将234 换成567。
sed -n ‘/AAA/,/DDD/s/B/567/p‘ dataf3
将含有AAA 到含有DDD 的那几行,皆将其中的B 换成567。
sed -n ‘2,4s/B/567/p‘ dataf3
由第2 行到第4 行,皆将其中的B 换成567。
由以上的说明可知:sed 动态编辑的威力是相当强大的,它补足了Bash 在修改文件方面
能力的不足。
时间: 2024-08-27 21:01:39

sed和awk用法的相关文章

grep,sed,awk用法整理

grep -c 打印出符合要求的行数 -i 忽略大小写              ignore -n 连同符号一起输出          num -v 打印出不符合要求的行 -A2 本行及下面两行 -B2 本行及上面两行 -C2 本行及上下两行 grep ^root passwd    #过滤以root开头的行 grep root$ passwd    #过滤以root结尾的行 grep -i ^root passwd    #不区分大小写,过滤以root结尾的行 grep -E "^root|

sed与awk用法

sed语法: sed -e    执行多个sed指令 -f    运行脚本 -i    编辑文件内容 sed -n '3p' /etc/passwd ##显示第三行  sed -n '1,3p' 显示前三行. sed -n '1,3!p' ##查看除前三行以外 sed -n '3,+3p' passwd  ##加起来一共显示6行. sed '$a###' passwd >> a.txt ##追加   sed '$c###' passwd ###替换 awk: awk '{print $0}'

sed 以及 awk用法

sed 格式 sed[options] "script" FILE.... 选项: -n:静默模式,不输出模式空间内的内容:默认打印空间模式的内容 -r:扩展的正则表达式 -f 文件:指定sed脚本文件 -e 'script' -e 'script' :指定多个编辑指令 -i : 直接编辑原文件 编辑命令: d:删除 p: 打印 i \text:在被指定到的行前面插入文本 a \text:在被指定的行的下面插入文本 \n:换行 r /path/file.txt:在指定位置把另外一个文件

sed和awk之sed篇(含sed高级用法)

(原创文章,谢绝转载~) sed(stream editor)和 awk 是linux环境下处理文本.数据的强大"利器",sed对数据列的处理稍逊,awk则更似一门语言,control flow的语法基本和c语言一样,能够处理复杂的逻辑,二者经常配合正则表达式使用.本文简述sed用法. sed对输入流(文本数据)逐行处理,其基本格式为: sed (OPTIONS...) [SCRIPT] [INPUTFILE...]#examplessed '10d' test.txtsed -i '

9-13 文本处理工具sed及awk的用法

文本编辑三剑客:grep, sed, awk    grep: 文本搜索工具:egrep, fgrep    sed: stream editor, 流编辑器:    awk(gawk):文本格式化工具,报告生成器 sed命令: 基本正则表达式的元字符:     字符匹配:            .: 匹配任意单个字符:            []:匹配指定范围内的任意单个字符:            [^]:匹配指定范围内的任意单个字符: [:lower:]:所有小写字母 [:upper:]:

sed及grep用法详解

在linux系统有被称为文本处理三剑客grep,sed,awk. 今天与大家分享的就是gerp和sed处理工具,至于awk,我将会在晚些的时间与大家分享,在分享grep和sed之前我先要和大家说说正则表达,正则表达是什么呢,正则表达式就像是三剑客手里的剑,没有剑哪还能称的上什么剑客,所以我们要先了解以下正则表达式的简单用法. 什么是正则表达式: "正则表达式是描述一组字符窜特征的模式,用来匹配特定的字符串."--Ken Thompson 基本正则表达式的元字符有以下这些: . :匹配任

awk用法(一)

awk用法(一) awk跟以前的sed命令,grep命令比较,它的优势在于它能够实现更多的功能. 比如awk可以实现分段,sed,grep是没法实现的 可以根据一个分隔符,将其分为一小段一小段,通过段来匹配. 知识点一: awk -F ':' '{print $3,$4}' 1.txt 显示指定段的匹配== awk -F: '{print $3,$4}' 1.txt -F ':'指定冒号分隔符,$3指定第三段 $3,$4中间的逗号,实际显示的是空格分割.[比较下面截图可看出] 知识点二: awk

Shell脚本编程与sed,awk工具的使用--9月15日课程作业

一.shell程序的运行原理 1.脚本 脚本或程序源文件是一种文本文件,将文本文件转换成机器指令有两种转换方式: 编译执行:预处理-->编译-->汇编-->链接:事先完成,结果:二进制程序文件 例如:C, C++ 解释执行:由解释器全程参与运行过程,每次读取一行,运行一行: 例如:  Python:程序控制结构,调用编程库完成程序编写: 库文件:功能模块,在编程中可调用: Bash:调用机器上命令程序文件进行程序编写: 外部命令:各应用程序提供: 2.原理 当shell运行一个程序时,会

日志分析查看——grep,sed,sort,awk运用

概述 我们日常应用中都离不开日志.可以说日志是我们在排查问题的一个重要依据.但是日志并不是写了就好了,当你想查看日志的时候,你会发现线上日志堆积的长度已经超越了你一行行浏览的耐性的极限了.于是,很有必要通过一些手段来高效地辅助你来快速的从日志中找到你要找的问题.本文通过一个从项目中衍生出来的例子从查找日志,筛选日志和统计日志3个方面层层递进来简述日志文件查看中一些有用的手段.(注:在linux环境下) 目录 0.查找关键日志grep 1.查找关键日志grep 2.精简日志内容 sed 3.对记录