awk使用方法与案例介绍

一、awk简介

  awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

  awk有3个不同版本:awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。

  awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。实际上 AWK 的确拥有自己的语言: AWK 程序设计语言 , 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。

二、awk语法及调用方式

1. awk的使用语法

  awk的语法结构是:awk ‘{pattern + action}‘ {filenames}

  尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 awk在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。pattern就是要表示的正则表达式,用斜杠括起来。

  awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。通常,awk是以文件的一行为处理单位的。awk每接收文件的一行,然后执行相应的命令,来处理文本。

2. awk的调用方式

  • 命令行方式

  awk [-F field-separator] ‘commands‘ input-file(s)

  其中,commands 是真正awk命令,[-F域分隔符]是可选的(例如可以指定以冒号,逗号等作为分隔符)。input-file(s) 是待处理的文件。

  在awk中,文件的每一行中,由域分隔符分开的每一项称为一个域。通常,在不指名-F域分隔符的情况下,默认的域分隔符是空格。

  在commands中经常会有’{print $1}’等情况,这里的1是指第一个分隔域,数值可以根据数据情况,改为2,…,n。

  • shell脚本方式

  将所有的awk命令插入一个文件,并使awk程序可执行,然后awk命令解释器作为脚本的首行,一遍通过键入脚本名称来调用。

  相当于shell脚本首行的:#!/bin/sh,可以换成:#!/bin/awk

  • 将所有的awk命令插入一个单独文件,然后调用

  awk -f awk-script-file input-file(s)

  其中,-f选项加载awk-script-file中的awk脚本,input-file(s)跟上面的是一样的。

三、awk案例

1. 案例一

  业务:如何只显示最近登录的5个帐号。

$last -n 5 | awk ‘{print $1}‘

  该awk工作流程为:读入有‘\n‘换行符分割的一条记录,然后将记录按指定的域分隔符划分域,填充域,$0则表示所有域,$1表示第一个域,$n表示第n个域。默认域分隔符是"空白键" 或 "[tab]键",所以$1表示登录用户,$3表示登录用户ip,以此类推。

2. 案例二

  业务:如果只是显示/etc/passwd的账户

$cat /etc/passwd |awk -F ‘:‘ ‘{print $1}‘

  这种是awk+action的示例,每行都会执行action{print $1}。其中,-F指定域分隔符为‘:‘。

3. 案例三

  业务:如果只是显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以tab键分割。

$cat /etc/passwd | awk -F ‘:‘ ‘{print $1"\t"$7}‘

  这里和上一个案例类似,只是在action中使用了两个域,并且需要提前知道需要的额数据分别在哪些域中。而且print输出时可以按需求添加”\t”等特殊符号隔开。

4. 案例四

  业务:如果只是显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以逗号分割,而且在所有行添加列名name,shell,在最后一行添加blue,/bin/nosh。

$cat /etc/passwd | awk -F ‘:‘ ‘BEGIN {print "name,shell"} {print $1","$7} END {print "blue,/bin/nosh"}‘

  该awk工作流程为:先执行BEGING,然后读取文件,读入有/n换行符分割的一条记录,然后将记录按指定的域分隔符划分域,填充域,$0则表示所有域,$1表示第一个域,$n表示第n个域,随后开始执行模式所对应的动作action。接着开始读入第二条记录……,直到所有的记录都读完,最后执行END操作。

5. 案例五

  业务:搜索/etc/passwd有root关键字的所有行。

$awk -F: ‘/root/‘ /etc/passwd

  这种是pattern的使用示例,匹配了pattern(这里是root)的行才会执行action(没有指定action,默认输出每行的内容)。

  搜索支持正则表达式,例如找root开头的:$awk -F: ‘/^root/‘ /etc/passwd

6. 案例六

  业务:搜索/etc/passwd有root关键字的所有行,并显示对应的shell。

$awk -F: ‘/root/{print $7}‘ /etc/passwd

  这里指定了action{print $7}。

原文地址:https://www.cnblogs.com/yangp/p/8524651.html

时间: 2024-10-29 14:51:51

awk使用方法与案例介绍的相关文章

华为数据挖掘方法论及案例介绍

数据挖掘是BI领域的一个重要应用方向,BI指通过对行业的讣知.经验,结合数学理论.管理理论.市场营销理论,利用工具软件.数学.算法(如:神经网络.遗传算法.聚类.客户绅分等)对企业的数据.业务.市场迚行分析及预测,以图表.数据分析报告的形式支撑企业决策.市场营销.业务拓展.信息运营等工作. 如果你想了解大数据的学习路线,想学习大数据知识以及需要免费的学习资料可以加群:784789432.欢迎你的加入.每天下午三点开直播分享基础知识,晚上20:00都会开直播给大家分享大数据项目实战. 原文地址:h

转 PHP的CURL方法curl_setopt()函数案例介绍(抓取网页,POST数据)

PHP的CURL方法curl_setopt()函数案例介绍(抓取网页,POST数据) 通过curl_setopt()函数可以方便快捷的抓取网页(采集很方便),curl_setopt 是php的一个扩展库 使用条件:需要在php.ini 中配置开启.(PHP 4 >= 4.0.2)       //取消下面的注释 extension=php_curl.dll 在Linux下面,需要重新编译PHP了,编译时,你需要打开编译参数——在configure命令上加上“–with-curl” 参数. 1.

SQL Delta实用案例介绍,很好的东西,帮了我不少忙

SQL Delta实用案例介绍 概述 本篇文章主要介绍SQL DELTA的简单使用.为了能够更加明了的说明其功能,本文将通过实际项目中的案例加以介绍. 主要容 ?   SQL DELTA 简介 ?   创建SQL DELTA项目 ?   使用SQLDELTA 进行数据库结构同步 ?   使用SQLDELTA进行数据库数据同步 ?   生成数据报表 ?   待续 SQLDELTA简介 SQLDELTA是一款便捷实用的数据库管理工具.使用它可以找到现在数据库项目与过去数据库的异同点.并可以使你的产品

【转】CSS Sprites教程大全(使用方法、工具介绍)

什么是CSS Sprite CSS Sprite 又叫CSS精灵,是目前大型网站中经常运用的图片处理方式.它的原理很简单,将网站上零散的小图片(或图标)整合在一张大图上,再用CSS中“background-image”属性来定位图片的X/Y轴位置,从而减轻服务器对图片的请求数量,提高网页加载速度.因为对于当前大多数网速而言,不高于200KB的单张图片所需载入时间基本是差不多的,如果页面上有20张小图片或图标,那么服务器会载入20次.但使用CSS Sprite将图片整合成一张大图后,服务器只需要载

asp.net core系列 65 正反案例介绍SOLID原则

原文:asp.net core系列 65 正反案例介绍SOLID原则 一.概述 SOLID五大原则使我们能够管理解决大多数软件设计问题.由Robert C. Martin在20世纪90年代编写了这些原则.这些原则为我们提供了从紧耦合的代码和少量封装转变为适当松耦合和封装业务实际需求的结果方法.使用这些原则,我们可以构建一个具有整洁,可读且易于维护的代码应用程序. SOLID缩写如下: SRP  单一责任原则 OCP 开放/封闭原则 LSP  里氏替换原则 ISP   接口分离原则 DIP   依

第16本:《视觉繁美:信息可视化方法与案例解析》

第16本:<视觉繁美:信息可视化方法与案例解析> 阅读加写笔记大概用了6个小时.<视觉繁美>是从权哥的QQ上发现的,看到一堆超炫超 复杂的图形,就马上动手从amazon上买了下来.第一天粗翻一遍,确实是非常多.非常复杂的网络图,如果不是搞艺术设计的,真不知道这本书有什么用,但 第二天开始仔细阅读,发现前三章还是相当有料,从树状模型开始,过渡到网络模型,然后仔细剖析了网络模型,第四.五.六章可以说是网络图欣赏,第七章是4 篇论文. 第一章 生命之树 树状模型是当代网络图的源头.古代把

Axure手机应用原型课程案例介绍

Axure手机应用原型课程案例介绍 [作者:程矢]本站原创的Axure视频教程 Axure手机应用原型课程 课程内容案例介绍: 微信公众平台高速ETC项目案例 高速通项目案例 肝病之家项目案例 web

C++ 标准模板库STL 队列 queue 使用方法与应用介绍

C++ 标准模板库STL 队列 queue 使用方法与应用介绍 queue queue模板类的定义在<queue>头文件中. 与stack模板类很相似,queue模板类也需要两个模板参数,一个是元素类型,一个容器类型,元素类型是必要的,容器类型是可选的,默认为deque类型. 定义queue对象的示例代码如下: queue<int> q1; queue<double> q2; queue的基本操作有: 入队,如例:q.push(x); 将x接到队列的末端. 出队,如例:

【学习笔记】HTML5视频的属性、方法、事件介绍 详解

规划了一下学习路线 HTML5 -> CSS3  -> JS ->综合 7.31日开始,做好笔记做好记录 认真学习. HTMLVideoElement和HTMLAudioElement 均继承自HTMLMediaElement)所以音频文件和视频文件大多数都是一样的,除了标签名称 <video> <audio> HTML视频 大多数视频是通过插件(比如 Flash)来显示的.然而,并非所有浏览器都拥有同样的插件. HTML5 规定了一种通过 video 元素来包含