awk数组用法

两个文件，从文件b首列查找出等于文件a的行并输出
[[email protected] ~]# cat a
1
3
6
7
[[email protected] ~]# cat b
1 2 3
2 3 4
3 4 5
4 5 6
5 6 7
6 7 8
7 8 9

shell脚本
[[email protected] ~]# cat jieguo
#!/bin/bash
y=`sed -n ‘p‘ a |wc -l` #a 行数
x=`sed -n ‘p‘ b |wc -l` #b行数
for((i=1;i<=$y;i++))
do
   value_a=`sed -n ${i}p a`   #按行输出,赋值给a
for((j=1;j<=$x;j++))
do
    value_b=`awk ‘{print $1}‘ b|sed -n "/$j/p"` #输出首列，赋值给b
if [ "$value_a" = "$value_b" ]        #判断value_a，value_b是否相等
        then
          value_c=`sed -n ${j}p b`
          echo $value_c >> /root/value_c   #相等输出b中的行到value_c
      fi
done
done

awk命令行
awk ‘NR==FNR{k[$1]=$1} NR>FNR{ if(k[$1]==$1) {print $1,$2,$3}}‘ a b 或
awk ‘NR==FNR{k[$1]=$1} NR>FNR{ if(k[$1]==$1) {print $0}}‘ a b
NR：awk处理文件的总行数
FNR：awk处理当前文件的行数
数组k[$1]：将文件a的值付给数组k。

条件语句：NR==FNR 对文件a执行{}中的操作
                    NR>FNR 对文件b执行{}中的操作
                   k[$1]=$1中的$1是文件a中的第一个域
                    if(k[$1]==$1) {print $1,$2,$3}是文件b中的1,2,3个域
                   $0是当前的一条完整的记录

区别：

脚本：需要嵌套for来遍历整个文件，就是说我要比较a与b的首行是否相同的，需要a中每个数字循环遍历b中首行的数据。需要x*y次比较。

awk：数组k[$1]可以理解成将文件a的值由列变换成行，这样在awk做if判断时，是在一行数据中查找目标，而不需要像列一样需要for循环语句来遍历整个文件。就是从b的首行拿出数据与k数组作比较，数据相同，就输出。只需要比较x次。

运行结果：
[[email protected] ~]# ./jieguo
1 2 3
3 4 5
6 7 8
7 8 9
[[email protected] ~]# awk ‘NR==FNR{k[$1]=$1} NR>FNR{ if(k[$1]==$1) {print $0}}‘ a b
1 2 3
3 4 5
6 7 8
7 8 9

如果文件的行数有几万，几十万行，脚本是很费时的。awk秒出结果。。。

awk数组用法

时间： 2024-10-25 02:18:39

awk数组用法的相关文章

awk基本用法

RS,ORS,FS,OFS,NR,NF,$0,$n RS 输入的行分隔号 ORS 输出的行分隔号 FS 输入的列分隔号 OFS 输出的列分隔号 NR 行号 NF 尾列号 $0 表示所有列(整行) $n 表示第n列例如: shell> cat aa 1 2 3 4 5 6 shell> awk 'BEGIN{ORS=",\n"}{print}' aa 1 2, 3 4, 5 6, RS反之 shell> awk 'BEGIN{ORS=",\n"}{

Linux sed 和 awk的用法

sed用法: 原文链接:http://www.cnblogs.com/dong008259/archive/2011/12/07/2279897.html sed是一个很好的文件处理工具,本身是一个管道命令,主要是以行为单位进行处理,可以将数据行进行替换.删除.新增.选取等特定工作,下面先了解一下sed的用法sed命令行格式为: sed [-nefri] 'command' 输入文本常用选项: -n∶使用安静(silent)模式.在一般 sed 的用法中,所有来自

AWK详细用法

awk非常的优秀,运行效率高,而且代码简单,对格式化的文本处理能力超强.基本上grep和sed能干的活awk全部都能干,而且干得更好. 先来一个很爽的例子:文件a,统计文件a的第一列中是浮点数的行的浮点数的平均值.用awk来实现只需要一句话就可以搞定(当然,这个东东用python也可以很轻松的实现,只是无论如何都得新建一个文件:别妄想用bash shell来做,那可是浮点数!!!)$cat a1.021 331#.ll 442.53 6ss 7awk 'BEGIN{total = 0;

初学awk数组会遇到的几个常见问题

原题目: 处理以下文件内容,将域名取出并根据域名进行计数排序处理:(百度和sohu面试题) 答案的详细讲解请参考: http://lidao.blog.51cto.com/3388056/1912219 文件内容: http://www.etiantian.org/index.html http://www.etiantian.org/1.html http://post.etiantian.org/index.html http://mp3.etiantian.org/index.html h

awk入门及awk数组相关实战

知识点: l 记录与字段 l 模式匹配:模式与动作 l 基本的awk执行过程 l awk常用内置变量(预定义变量) l awk数组(工作常用) l awk语法:循环.条件 l awk常用函数 l 向awk传递参数 l awk引用shell变量 l awk小程序及调试思路 [[email protected] ~]# awk --version|head -1 GNU Awk 3.1.7 第1章记录和字段 record记录==行, field字段相当于列,字段==列. awk对每个要处理的输入数

awk,sed用法

1.分组求和,第一列相同,第二列数值加和采用awk数组处理,其中,$1为数组下标,a[$1]为对应数组名,即当行中$1相同时,为同一数组,则对应的列值加和 awk '{a[$1]+=$2}END{for(i in a){print i","a[i]}}' fileName

shell数组和awk数组

awk终于能入门了,所以整理了该文章,内容大多来自网上. 一.bash支持一维数组(不支持多维数组),没有限定数组的大小.在shell中,用括号来表示数组,数组元素用空格符号分割开.类似于C语言,数组元素的下标由0开始编号.获取数组中的元素要利用下标,下标可以是整数或算术表达式,其值应大于或等于0 1. 定义数组数组名array,元素a b c [[email protected]~]# array=(a b c) 2.获取所有元素 [[email protected]~]# echo ${a

awk基本用法（一）

awk从FILE中读取文件,并采用指定的分隔符(默认为空格),将其分为多个段,每一个段的内容都放在$n(n为数字)中.$0表示一整行的内容. awk的用法: awk 'PATTERN{ACTION}' FILE 说明: PATTERN:为匹配模式.如果没有PATTERN,则表示匹配所有. ACTION:对匹配的内容所执行的操作.最简单的ACTION为print 内置变量: NF:表示的是Number of Field,即字段个数.如果是$NF,则表示的是最后一个字段. 示例1: [[email

awk 数组理解与应用

awk 数组无须实现定义 ckl[abc]=6 ckl[xyz]=9 abc 为下标名称 9 则为下标对应的值 BEGIN 为模式前匹配,即为匹配之前操作 END 为模式匹配后,即为匹配后操作如常用的统计TCP状态的awk命令 # netstat -ant | awk '/^tcp/{STA[$NF]++}END{for ( k in STA) {print k,STA[k]}}' TIME_WAIT 4 CLOSE_WAIT 19 FIN_WAIT2 1 ESTABLISHED 135 LA

猜你喜欢

jekyll bootstrap更改主题theme

使用主题介绍: 由于JB版本0.2.X的主题,现在完全是模块化的.他们跟踪和单独版本的主题包.这让每个人都可以自由发布和共享主题. Jekyll-Bootstrap v 0.2.x只附带twitte ...

图像处理之图像切割---提取信封上的邮编

1.题目: 分割图像,提取信封上的邮编. 2.算法原理: 原创:梁毅军(西安交大图像所,[email protected]) (1) 线框提取: 输入f(x,y)为彩色图像,输出g(x,y)为灰色图像 ...

loadrunner11的移动端性能测试之场景设计

测试步骤之场景设计(Controller) 进入手工场景准备好脚本后就可以进行场景设计和执行场景了,从VuGen中进入,见下图: 进入后第一个为目标场景,选择第二个更灵活的手工场景,我的目标人数20 ...

JAVA的数据类型

JAVA的数据类型:基本类型: 四类:整型:byte(1字节) ,short(2字节), int(4字节), long(8字节) (整数类型) 浮点型: float(4字节) ,double(8字节 ...

菜鸟程序员怎么才能提高自己的技术--(献给自己共勉)

菜鸟程序员,这里很明确,主体是两种人,一是初学者,二是刚刚走上工作岗位的程序员.那我就来讲讲吧,不一定适合所有人,也就是我的隔热经验罢了. 夯实基础首先,就我个人经历而言,我认为初学者应该特别注意这 ...

Acdream 1738 世风日下的哗啦啦族I 树套树

世风日下的哗啦啦族I Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://acdream.info/problem?pid=1738 Descri ...

JS 对象之继承

//父类 function Sup(name){ this.name=name; } //父类的原型 Sup.proto ...

android-async-http框架

android-async-http 简单介绍:An asynchronous, callback-based Http client for Android built on top of Apac ...

shell脚本8--录制终端会话

准备: script -t 2> timing.log -a output.session type commands; ... . .. exit 回放: scriptreplay timin ...

【HDOJ】2492 Ping pong

线段树+离散化. 1 #include <cstdio> 2 #include <cstring> 3 #include <cstdlib> 4 5 #define ...

HibernateDaoSupport中的操作数据的方法

1.建立一个类 2.继承HibernateDaoSupport public class bookDAO extends HibernateDaoSupport{ /* 插入操作 */ public ...

ZH奶酪：在Virtualbox中的Ubuntu虚拟机中，安装Guest Additions客户端增强包时出错：分配介质虚拟光盘 xxx\VBoxsGuestAdditions.iso 到虚拟电脑 xxx 失败。您是否要强制卸载分配该介质？

在Virtualbox中的Ubuntu虚拟机中, 安装Guest Additions,出错: 分配介质虚拟光盘 xxx\VBoxsGuestAdditions.iso 到虚拟电脑 xxx 失败.您是 ...

如何管理我的开发团队

相信做软件开发的童鞋对软件项目周期都很熟悉,需求->设计->编码->测试,这是一个最简单.最普通的规范.但是实际项目开发中,我们又如何做到.做到多少呢? 先说个例子:我当前的开发团队 ...

webqq的注册和登记页面--运用jsonp跨域

简介: 我们知道,ajax用于数据交互,但它不能跨域,跨域是指从一个域名的网页去请求另一个域名的资源.比如从http://www.baidu.com/ 页面去请求 http://www.google. ...

天下武功尽出LAMP之http篇（3）

有了前两篇的介绍我相信大家对http已经有了基本的认识,今天我们来说一下httpd-2.4,这是Apache对于httpd-2.2的比较大的改进,增加许多实用性的新功能,我们来大致看一下. httpd ...

分组根据某一列进行排序，根据shopid分组，用createTime排序，返回row_number()序号 select no =row_number() over (partition by shopId order by createTime desc), * from Goods_info

over不能单独使用,要和分析函数:rank(),dense_rank(),row_number()等一起使用.其参数:over(partition by columnname1 order by c ...

C#学习笔记（二）

第四十一篇、Masonry利用Block实现链式编程

一直都觉得使用Masonry的时候语法特别优雅,很早的时候就想尝试下怎么实现, 一直都没弄明白,直到最近看见一篇叫block实现链式编程的使用实例: UIButton * btn = [UIButt ...

C++教程第二章-变量基础

转载请注明出处:http://blog.csdn.net/miaoyunzexiaobao 1.基本内置类型 C++包含算数类型和空类型.其中算数类型包含字符,整型数,布尔值及浮点数.即char,in ...

QR码简介

QR码(Quick Response Code, 快速响应码)属于矩阵式二维码中的一种,由DENSO(日本电装)公司开发,由JIS和ISO将其标准化. QR码分为两种模式:模式1.模式2:其中,模式1 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.