awk详解及举例

AWK语言

v 选项：

-F ：指明输入时用到的字段分隔符

-v var=value: 定义变量

v 分割符、域和记录

awk 执行时，由分隔符分隔的字段（域）标记$1,$2..$n称称

为域标识。$0 为所有域，注意：和shell 中变量$ 符含义不同

文件的每一行称为记录

省略action行，则默认执行 print $0 的的

$0：打印所有

v 示例：

awk ‘{print "hello,awk"}‘

awk –F: ‘{print}‘ /etc/passwd

awk –F: ‘{print “wang”}’ /etc/passwd

awk –F: ‘{print $1}’ /etc/passwd

awk –F: ‘{print $0}’ /etc/passwd

awk –F: ‘{print $1”\t”$3}’ /etc/passwd

tail –3 /etc/fstab |awk ‘{print $2,$4}’

awk 变量

v 变量：内置和自定义变量

v FS ：输入字段分隔符，默认为空白字符

awk -v FS=‘:‘ ‘{print $1,FS,$3}’ /etc/passwd

awk –F: ‘{print $1,$3,$7}’ /etc/passwd

v OFS ：输出字段分隔符，默认为空白字符

awk -v FS=‘:’ -v OFS=‘:’ ‘{print $1,$3,$7}’ /etc/passwd

vRS：输入记录分隔符，指定输入时的换行符，原换行符仍有效

awk -v RS=‘ ‘ ‘{print }’ /etc/passwd

v ORS ：输出记录分隔符，输出时用指定符号代替换行符

awk -v RS=‘ ‘ -v ORS=‘###‘‘{print }’ /etc/passwd

打印奇数行或者偶数行：

计算的一些简单方法

统计一文件里单词出现的次数：

NF ：字段数量

awk -F：： ‘{print NF}’ /etc/fstab, 引用内置变量不用$

awk -F: ‘{print $(NF-1)}‘ /etc/passwd

v NR ：行号

FNR ：各文件分别计数, 行号

awk ‘{print FNR}‘ /etc/fstab /etc/inittab

FILENAME ：当前文件名

awk ‘{print FILENAME}’ /etc/fstab

打印出来时将所属文件名也打印出来

ARGC ：命令行参数的个数

awk ‘{print ARGC}’ /etc/fstab /etc/inittab

awk ‘BEGIN {print ARGC}’ /etc/fstab /etc/inittab

v ARGV：数组，保存的是命令行所给定的各参数

自定义变量( 区分字符大小写)

(1) -v var=value

(2) 在program

变量放在{}里和外边的区别：

{}内：每次执行时都要赋值一次

{}外：执行之前先赋值，以后循环使用

-f ：调用脚本

printf命令

后边有几个变量，前边就应该有几个格式的定义，即几个%定义，百分号定义和变量要一一对应

v 格式化输出：printf “FORMAT ” , item1, item2, ...

(1) 必须指定FORMAT

(2) 不会自动换行，需要显式给出换行控制符，\n

(3) FORMAT 中需要分别为后面每个item 指定格式符

v 格式符：与item 一一对应

%c: 显示字符的ASCII码码

%d, %i: 显示十进制整数

%e, %E: 显示科学计数法数值

%f ：显示为浮点数

10.3：总共10位，包括3个0，一个小数点

%g, %G ：以科学计数法或浮点形式显示数值

%s ：显示字符串

%u ：无符号整数

下图为10个字符：

%%: 显示% 自身

v 修饰符：

#[.#] ：第一个数字控制显示的宽度；第二个# 表示小数点后精度，%3.1f

-: 左对齐（默认右对齐） %-15s

+号：显示数值的正负符号 %+d

BEGIN:在前面加一个表头

操作符

v 算术操作符：

x+y, x-y, x*y, x/y, x^y, x%y

-x: 转换为负数

+x: 转换为数值

v 字符串操作符：没有符号的操作符，字符串连接

v 赋值操作符：

=, +=, -=, *=, /=, %=, ^=

++, --

v 比较操作符：

==, !=, >, >=, <, <=

v 模式匹配符：~

将/etc/passwd中匹配的是root的打印出来：

将df里以/dev/sd开头的打印出来

左边不和右边匹配包含 !~：不包含bash的行

++在前：先加再打印

++在后：先打印再加：（--同理）

逻辑操作符：与与&& ，或||，非!

cmd1 与cmd2：两个命令都要执行，都执行完再决定最终的结果为真还是假

cmd1 && cmd2：先看第一个为真，假；如果第一个为假，那么后边的不管真假与第一个都是假，所以有可能后续的不执行

在awk里的&&的意思与cmd1 与cmd2的含义一样：

条件表达式（三目表达式）：

selector?if-true-expression:if-false-expression

如果selector?成立，则执行if-true-expression

如果selector?不成立，则执行if-false-expression

因为？和：将条件表达式分成了三段，所以称为三目表达式

relational expression: 关系表达式，结果为“真”才会被处理

真：结果为非0 值，非空字符串

假：结果为空字符串或0值

数字里：0为假，非0为真

字符串：只要不为空都为真

line ranges：：行范围

startline,endline ：/pat1/,/pat2/ 不支持直接给出数字

格式

awk -F: ‘/^root\>/,/^nobody\>/{print $1}‘

/etc/passwd

awk -F: ‘(NR>=10&&NR<=20){print NR,$1}‘

/etc/passwd

NR：文件的行号

NF：文件每行的以符号分割的列数

v (5) BEGIN/END 模式

BEGIN{}: 仅在开始处理文件中的文本之前执行一次

END{} ：仅在文本处理完成之后执行

awk 控制语句if-else

v 语法：if(condition){statement;…}[else statement]

if(condition1){statement1}else if(condition2){statement2}

else{statement3}

v 使用场景：对awk 取得的整行或某个字段做条件判

查看是否有防火墙以及查看端口号

将9000端口改为默认80

awk 控制语句

v while 循环

v 语法：while(condition){statement;…}

v 条件“真”，进入循环；条件“假”，退出循环

v 使用场景：

对一行内的多个字段逐一类似处理时使用

对数组中的各元素逐一处理时使用

打印以root开头的，从第一列开始一直循环到最后一列，当小于最后一列时，将该字符长度和名字打印出来，然后i++，一直循环到最后一列

do-while 循环

v 语法：do {statement;…}while(condition)

v无论真假，至少执行一次循环体

-s后可以指定分隔符

for 循环

v 语法：for(expr1;expr2;expr3) {statement;…}

v 常见用法：

for(variable assignment;condition;iteration process)

{for-body}

v 特殊用法：能够遍历数组中的元素

语法：for(var in array) {for-body}

提前结束对本行处理而直接进入下一行处理（awk 自身循环）

awk 数组

v 关联数组：array[index-expression]

v index-expression:

(1) 可使用任意字符串；字符串要使用双引号括起来

(2) 如果某数组元素事先不存在，在引用时，awk 会自动创建

此元素，并将其值初始化为“空串”

若要判断数组中是否存在某元素，要使用“index in array”格格

式进行遍历

第一步：第一行1进来，$0为1，abc[1]没有赋值为空，为0；！Abc[1]为1 ，abc[1]++为1；（1,1）

第二步：第二行进来，$0为2，abc[2]没有赋值为空，为0；！Abc[2]为1，abc[2]++为1；（2,1）

第三步：第三行进来，$0为1，abc[1]为1，因为第一步已经对abc[1]赋值！Abc[1]为0，abc[1]++为2 ；所以（1,2）

第四步：第四行2进来，$0为2，abc[2]为1，因为第二步已经对abc[2]赋值，

！Abc[2]为0，abc[2]++为2 ；所以（2,2）

第五步：第五行3进来，$0为3，abc[3]没有赋值为空，等于0；！Abc[3]为1，abc[3]++为1；所以（3,1）

以下的同上

awk 数组

v 若要遍历数组中的每个元素，要使用for 循环

v for(var in array) {for-body}

v 注意：var 会遍历array

统计单词出现的次数：（通用代码，统计别的文件也通用）

统计男生和女生平均成绩多少？

awk 函数

v 数值处理：

rand() ：返回0 和1 之间一个随机数

v 字符串处理：

length([s]) ：返回指定字符串的长度

sub(r,s,[t]) ：对t 字符串进行搜索r 表示的模式匹配的内容，并将第一个匹

配的内容替换为s

echo "2008:08:08 08:08:08" | awk ‘sub(/:/,“-",$1)‘

gsub(r,s,[t]) ：对t 字符串进行搜索r 表示的模式匹配的内容，并全部替换

为为s 所表示的内容

echo "2008:08:08 08:08:08" | awk ‘gsub(/:/,“-",$0)‘

split(s,array,[r]) ：以r 为分隔符，切割字符串s ，并将切割后的结果保存

至至array 所表示的数组中，第一个索引值为1, 第二个索引值为2,…

netstat -tan | awk ‘/^tcp\>/{split($5,ip,":");count[ip[1]]++}

END{for (i in count) {print i,count[i]}}‘

awk 函数

v 自定义函数

v 格式：

function name ( parameter, parameter, ... ) {

statements

return expression

}

v 示例：

#cat fun.awk

function max(v1,v2) {

v1>v2?var=v1:var=v2

return var

}

BEGIN{a=3;b=2;print max(a,b)}

awk 脚本

v将将awk 程序写成脚本，直接调用或执行

v 示例：

#cat f1.awk

{if($3>=1000)print $1,$3}

#awk -F: -f f1.awk /etc/passwd

#cat f2.awk

#!/bin/awk –f

#this is a awk script

{if($3>=1000)print $1,$3}

#chmod +x f2.awk

#f2.awk –F: /etc/passwd

向awk 脚本传递参数

v 格式：

awkfile var=value var2=value2... Inputfile

v 注意：在BEGIN 过程中不可用。直到首行输入完成以后，变

量才可用。可以通过-v 参数，让awk 在执行BEGIN 之前得到

变量的值。命令行中每一个指定的变量都需要一个-v 参数

v 示例：

#cat test.awk

#!/bin/awk –f

{if($3 >=min && $3<=max)print $1,$3}

#chmod +x test.awk

#test.awk -F: min=100 max=200 /etc/passwd

时间： 2024-11-13 04:30:34

awk详解及举例的相关文章

linux awk详解与应用

文章来自于本人个人博客: linux awk详解与应用 1.awk awk是一个强大的文本分析工具,它可以通过分析文本来生成一个数据报告.它的原理就是读取每行的输入,然后按照分隔符切分(默认是空格),再进行定制计算. awk '{print $1}' /etc/passwd #打印出passwd文件的所有行的第一列这是awk的基础语法,在awk中$n代表列数,即$1--第一列,$2---第二列....,但是$0代表整行接下来我们按照指定的分隔符打印数据: awk -F ':' '{pri

linux sed&awk详解

sed sed为文本处理三剑客之一.本身就是一个管道命令,可以将文件进行增加,修改,删除,选取等操作. 格式:sed [-nrefi] [command] "文本字符串" 选项: -r: 支持扩展正则表达式: -n: 静默模式:(sed有个模式空间和保持空间,默认sed会将执行的结果保存到模式空间里面,而模式空间默认情况是输出在屏幕上,加了-n,则阻止将模式空间的内容输出到屏幕上) -f:/path/to/script_file:从指定的文件中读取脚本并运行 -e script1 -e

linux sed，awk详解

sed命令:sed 是一种在线编辑器,它一次处理一行内容.处理时,把当前处理的行存储在临时缓冲区中,称为"模式空间"(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕.接着处理下一行,这样不断重复,直到文件末尾.文件内容并没有改变,除非你使用重定向存储输出.Sed主要用来自动编辑一个或多个文件:简化对文件的反复操作:编写转换程序等.sed使用参数[[email protected] ~]# sed [-nefr] [动作]-n :使

Linux文本处理三剑客之awk详解

前言 awk是一款强大的报告生成器,不同于sed和grep,它的侧重点是如何把文本信息更好的展示出来,常用与统计和格式化输出.awk相当于微型的shell,有着自己一套语法结构,例如:循环结构,数组,条件判断,函数,内置变量等功能.处理对象一般纯文本文件或纯文本信息. 用法详解基本语法 awk [options] 'program' file file ... awk [options] 'PATTERN{action}' file file ... -F CHAR:输入分隔符 awk的输出

grep, sed 与 awk 详解

grep, sed 与 awk 相当有用 ! gerp 查找, sed 编辑, awk 根据内容分析并处理. awk(关键字:分析&处理) 一行一行的分析处理 awk '条件类型1{动作1}条件类型2{动作2}' filename, awk 也可以读取来自前一个指令的 standard input相对于sed常常用于一整行处理, awk则比较倾向于一行当中分成数个"字段"(区域)来处理, 默认的分隔符是空格键或tab键例如:last -n 5 | awk '{print $1

awk详解使用用法

awk 流编辑器适合处理有行有列比较规则的文本 awk 读入一行,执行一次主输入循环#awk 'BEGIN{} {}END{}' 文件名称BEGIN{}处理所有文本之前执行不想执行可以不加BEGIN{} 主输入循环END{} 处理所有文本之后的执行可选 {}中字符串必须加"" 如果一个字符串不不加引号,会被当作一个变量来处理 Awk读入一行,执行一次括号里面的动作读入一行,执行一次后面的主输入循环 #awk '{}' /etc/passwd#awk 选项 'BEGIN{} {}

Linux下Awk详解(转载)

什么是Awk Awk是一种小巧的编程语言及命令行工具.(其名称得自于它的创始人Alfred Aho.Peter Weinberger 和 Brian Kernighan姓氏的首个字母).它非常适合服务器上的日志处理,主要是因为Awk可以对文件进行操作,通常以可读文本构建行. 我说它适用于服务器是因为日志文件,转储文件(dump files),或者任意文本格式的服务器终止转储到磁盘都会变得很大,并且在每个服务器你都会拥有大量的这类文件.如果你经历过这样的情境--在没有像Splunk或者其他等价的工

linux基础学习第二十二天之AWK详解

内容: 1.awk输出(print.printf) 2.awk变量(内建变量和定义变量) 3.awk数组 4.awk重定向输出 5.awk操作符 6.awk常见模式类型 7.awk控制及循环语句 8.awk内置函数 awk:(其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母) awk是一款强大的报告生成器,不同于sed和grep,它的侧重点是如何把文本信息更好的展示出来,常用与统计和格式化输出. awk相当于微型

Shell脚本之awk详解

一．基本介绍 1.awk: awk是一个强大的文本分析工具,在对文本文件的处理以及生成报表,awk是无可替代的.awk认为文本文件都是结构化的,它将每一个输入行定义为一个记录,行中的每个字符串定义为一个域(段),域和域之间使用分割符分割. 2.功能:流控制.数学运算.进程控制.内置的变量和函数.循环和判断 3.工作原理: awk 会把每行进行一个拆分,用相应的命令对拆分出来的“段”进行处理. (1)行工作模式,读入文件的每一行,会把一行的内容,存到$0里 (2)使用内置的变量FS(段的分隔符,默