awk之RS、ORS、FS、OFS基础及举例

RS:Record Separator,记录分隔符

ORS:Output Record Separate,输出当前记录分隔符

FS:Field Separator,字段分隔符

OFS:Out of Field Separator,输出字段分隔符

PS:RS、ORS、FS、OFS的英文解释绝不是这样的,这里只是解释清楚。建议去阅读awk的英文读物,其中解释了缩写的含义。

什么是field(字段),什么是record(记录行)?

示例:

1.txt内容如下:

  1. i am a student.
  2. i like to swim
  3. hello moto

行号1代表第一个记录行,2代表第二个记录行,3代表第三个记录行。通过观察我们可以知道总共有3个记录行(record)。

看看第一行:“i am a student”,这一行的每个单词都是一个字段(field)。“i”是一个字段,“am”是一个字段,“a”是一个字段,“student”是一个字段,该行总共有4个字段。

RS与ORS

RS:记录行分隔符

示例:

1.txt

  1. a\n
  2. b\n
  3. c\n
  4. d\n
  5. e\n

该文本总共有5行,每一行都有一个换行符“\n”。所以每行记录都是以“\n”为一个(换行的)标志。

可以用一下方法来理解:

找到某某标志,让每个某某后的内容重新变成一行

示例

1.txt内容如下:

a|b|c

代码:awk ‘BEGIN{ RS="|"; } { print $0 }‘

a

b

b

ORS:可以看成RS的逆向过程

示例

1.txt内容如下:

a

b

c

可以这样理解:

观察每一行的“换行符号”,然后将“换行符号”替换成你想要的符号。

awk ‘BEGIN{ ORS="----" }{ print $0 }‘ 1.txt

a----b----c----

FS:字段分隔符

FS默认值为“ (空格)”,如“hello moto”.

在“hello moto”中有一个空格,空格就是hello与moto的分隔符(separator),而hello与moto就为字段(files)。awk以空格来区分。

在看看“i----love----you”,如果我们用命令“awk “{ print $1 }””会看到结果为:

i----love----you

如果想打印出三个字母,通过观察可发现“----”为分隔符。

awk ‘BEGIN{ FS="----";}{ print $1,$2,$3 }‘ filename

i love you

OFS:输出的字段分隔符

这么解释吧,如上例中“i----love----you”,“----”为分隔符(FS),如果我们想改为用其他符号显示可以这样:

awk ‘BEGIN{ FS="----";OFS="*****" }{ print $1,$2,$3 }‘ filename

i*****love*****you

PS:RS与ORS可以说成是一个互逆的过程()也可以看成一个替换的过程,但是看成互逆的过程比较好理解;FS与OFS就是一个替换的过程。

其实OFS还有一个例子
echo "abc" | awk ‘{ OFS="." } { NF=NF; print NF,$0}‘
结果
1.abc

时间: 2024-10-16 11:00:23

awk之RS、ORS、FS、OFS基础及举例的相关文章

linux awk 中 RS,ORS,FS,OFS 区别与联系【转】

linux awk 中 RS,ORS,FS,OFS 区别与联系 http://blog.csdn.net/jesseen/article/details/7992929

Linux中awk后面的RS, ORS, FS, OFS 用法

Linux中awk后面的RS, ORS, FS, OFS 含义 一.RS 与 ORS 差在哪 我们经常会说,awk是基于行列操作文本的,但如何定义"行"呢?这就是RS的作用.  默认情况下,RS的值是\n.下面通过实例来理解下RS. echo '1a2a3a4a5' | awk '{print $1}' 1a2a3a4a5 echo '1a2a3a4a5' | awk 'BEGIN{RS="a"}{print $1}' 1 2 3 4 5我们可以看到,在更改了RS的

linux:awk之RS、ORS与FS、OFS

awk之RS.ORS与FS.OFS RS:Record Separator,记录分隔符 ORS:Output Record Separate,输出当前记录分隔符 FS:Field Separator,字段分隔符 OFS:Out of Field Separator,输出字段分隔符 PS:RS.ORS.FS.OFS的英文解释绝不是这样的,这里只是解释清楚.建议去阅读awk的英文读物,其中解释了缩写的含义. 什么是field(字段),什么是record(记录行)? 示例: 1.txt i am a

awk之RS、ORS与FS、OFS

RS:Record Separator,记录分隔符 ORS:Output Record Separate,输出当前记录分隔符 FS:Field Separator,字段分隔符 OFS:Out of Field Separator,输出字段分隔符 PS:RS.ORS.FS.OFS的英文解释绝不是这样的,这里只是解释清楚.建议去阅读awk的英文读物,其中解释了缩写的含义. 什么是field(字段),什么是record(记录行)? 示例: 1.txt i am a student. i like to

Linux:批量修改分隔符(awk、BEGIN、FS、OFS、print命令)

批量修改文件的分隔符,可以用FS和OFS命令 FS:Field Separator,字段分隔符 OFS:Out of Field Separator,输出字段分隔符 假设有这么一个文件file1.txt,其内容如下: 可以看出,file1的分隔符很长,不止一个空格符组成,因此我们需要先将分隔符统一一下,输入一下命令: awk -F " " '{if($1~/^16/) print $1,$2,$3,$4}' file1.txt > file2.txt 生成file2.txt,如下

linux awk命令使用的一些心得-基础命令

该工具的作用是将文本文件逐行读入,然后对读入文本进行切片(默认用空格分隔),然后再读入下一行,已提供使用.是一个格式化报告生成工具,然后用来处理文本. 当前,linux上使用的awk,是gawk(开源awk),简写为awk. 用法: #awk [options] 'script' file,file2,- #awk [options] 'PATTERN {action }' filelist 引用的话,每一行从$1开始,$0为当前行,以换行符作为行结束 常用为:awk '{print $1}'

awk知识点

awk中删除重复行(转) 1.去除部分字段重复的行 sort+uniq也可以完成,但是awk真的很强大.两者的差异还在于,awk保持了文件中原本的每行的顺序,而sort必须排序,这样就变成按字母或某种其他规则的排序了. less num.list |awk '$1~/84[0-9]/'|awk '!a[$1]++' 2.去除记录重复的行 awk去除重复行,思路是以每一行的$0为key,创建一个hash数组,后续碰到的行,如果数组里已经有了,就不再print了,否则将其print 在awk中,可以

shell中的特殊变量IFS

当我越来越习惯python的编写风格时,我经常会想用bash去遍历一个文件的行,并将读取的行进行处理. 但一个诡异的情况,如果我的文本类似于这样 the first line. the second line. the third line. for line in `cat filename` do echo $line done 当我通过上面的方式遍历文件的每一行,我发现读出来的数据是这样的: the first line. the second line. the third line.

awk基本用法

RS,ORS,FS,OFS,NR,NF,$0,$n RS 输入的行分隔号 ORS 输出的行分隔号 FS 输入的列分隔号 OFS 输出的列分隔号 NR 行号 NF 尾列号 $0 表示所有列(整行) $n 表示第n列 例如: shell> cat aa 1 2 3 4 5 6 shell> awk 'BEGIN{ORS=",\n"}{print}' aa 1 2, 3 4, 5 6, RS反之 shell> awk 'BEGIN{ORS=",\n"}{