awk实际应用：文本合并

请使用awk命令将如下两份文件中名字相同的两行合并起来

[[email protected] ~]# cat 1.txt
韩海林 21岁
海林韩 23岁
韩林海 22岁
林海韩 24岁
[[email protected] ~]# cat 2.txt
韩林海 男
海林韩 男
韩海林 男
林海韩 男

输出效果：

韩海林 21岁男

[[email protected] ~]# awk ‘NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}‘ 2.txt  1.txt
韩海林 21岁 男
海林韩 23岁 男
韩林海 22岁 男
林海韩 24岁 男

[[email protected]~]# awk ‘NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}‘ 2.txt  1.txt > 3.txt
[[email protected] ~]# cat 3.txt 
韩海林 21岁 男
海林韩 23岁 男
韩林海 22岁 男
林海韩 24岁 男

解释：

在awk里，NR和FNR的含义相近，唯一的区别就是作用范围，NR是所有读取的行信息计数，而FNR是正在读取文件的行信息计数，FNR在文件切换时会从0重新开始计数，所以上述语句的意思是：

NR==FNR NR最大值为4，FNR值为1-4，以2.txt的第一个数据项为key，$2即第2列为数据组成数组；

NR>FNR 此时NR=（2.txt的总行数+FNR），NR最大值为8，FNR则重新从1-4计数，判断第一个数据项在不在2.txt数据组成的数组里，如果在，则打印本行加数组项。

NR是英文number of record的简写，就是awk每从文件或输入流中读入一行数据，就把这个变量加一。这个是awk自带的变量。

其他的解释：

NR==FNR{a[$1]=$2}

打开第一个文件2.txt，把文件里面的$2列的内容存入到a[$1]这个数组。

NR>FNR{print $0,a[$1]}

然后打开第二个文件，打印1.txt一行内容，然后打印第一个文件a[$1]数组的内容。

加入if判断，更容易理解，上面的命令省略了；判断1.txt的第一列内容在a数组里面，打印整行内容和a[$1]数组内容；

[[email protected] ~]# awk ‘NR==FNR{a[$1]=$2;next}NR>FNR{if($1 in a)print $0,a[$1]}‘ 2.txt 1.txt 
韩海林 21岁 男
海林韩 23岁 男
韩林海 22岁 男
林海韩 24岁 男

文件顺序不同，结果也不同；

[[email protected] ~]# awk ‘NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}‘ 1.txt 2.txt 
韩林海 男 22岁
海林韩 男 23岁
韩海林 男 21岁
林海韩 男 24岁

时间： 2024-10-10 18:31:00

awk实际应用：文本合并的相关文章

将两个或更多个单元格的文本合并到一个单元格

将两个或更多个单元格的文本合并到一个单元格选择要放置合并后数据的单元格. 键入“=”,然后选择要合并的第一个单元格. 键入“&”,然后使用引号(中间有一个空格). 选择要合并的下一个单元格,然后按Enter. 示例公式可能是“=A2&" "&B2” 原文地址:https://www.cnblogs.com/lbsjs/p/11526309.html

AWK这是一个很好的文字处理工具. 它不仅 Linux 中也是不论什么环境中现有的功能最强大的数据处理引擎之中的一个. 本文主要摘录池中龙写的Unixawk使用手冊(第二版),对当中内容略微修改.感谢作者的分享. 目录 1 0作者的话 2 1awk的调用方式 3 2awk的语法 4 3awk的记录.字段与内置变量 5 4awk的内置函数 5 5在命令行使用awk 6 6awk的变量 7 7运算与推断 7 8awk的流程控制 8 8.1BEGIN和END: 8 8.2流程控制语句 9 8.2.1

使用awk格式化输出文本

注意:本文并不是一篇awk入门文章,而是偏重实例讲解,由于awk是借鉴了c语法,因此awk的许多地方还保留有c语言的痕迹,比如printf语句:for,if的语法结构等介绍最简单地说,AWK 是一种用于处理文本的编程语言工具,处理模式是只要在输入数据中有模式匹配,就执行一系列指令.awk命令格式为: awk {pattern + action} {filenames} awk可以读取后接的文件,也可以读取来自前一命令的标准输入,它分别扫描输入数据的每一行,查找命令行中pattern是否匹配.

Linux：使用awk命令获取文本的某一行，某一列

1.打印文件的第一列(域) : awk '{print $1}' filename2.打印文件的前两列(域) : awk '{print $1,$2}' filename3.打印完第一列,然后打印第二列 : awk '{print $1 $2}' filename4.打印文本文件的总行数 : awk 'END{print NR}' filename5.打印文本第一行

随性练习：python字典实现文本合并

主要用到,字典.字符串分割和连接.文件等操作例如:有以下两个txt文本,要合并成一个代码: address_book1 = {} address_book2 = {} def read_address(): ''' read content from txt :return ''' with open("address1.txt","r") as f1: lines1 = f1.readlines() #

Ogre 渲染目标解析与多文本合并渲染

实现目标因为需求,想找一个在Ogre中好用的文本显示,经过查找和一些比对.有三种方案一利用Overlay的2D显示来达到效果. http://www.ogre3d.org/tikiwiki/tiki-index.php?page=MovableTextOverlay 二重写Renderable与MovableObject,利用对应字体查找到每个字符元素纹理坐标. http://www.ogre3d.org/tikiwiki/tiki-index.php?page=MovableText 三利

bat 文本合并

小工具—把多个TXT文件合成一个 - TTXS_RS的博客 - CSDN博客https://blog.csdn.net/TTXS_RS/article/details/79743384 把所有文本文件合成一个文件 - weixin_41412410的博客 - CSDN博客https://blog.csdn.net/weixin_41412410/article/details/78847211 原文地址:https://www.cnblogs.com/rgqancy/p/10348523.htm

9-13 文本处理工具sed及awk的用法

文本编辑三剑客:grep, sed, awk grep: 文本搜索工具:egrep, fgrep sed: stream editor, 流编辑器: awk(gawk):文本格式化工具,报告生成器 sed命令: 基本正则表达式的元字符: 字符匹配: .: 匹配任意单个字符: []:匹配指定范围内的任意单个字符: [^]:匹配指定范围内的任意单个字符: [:lower:]:所有小写字母 [:upper:]:

文本处理工具sed及awk的用法

sed: stream editor, 流编辑器: sed对文本的处理很强大,并且sed非常小,参数少,容易掌握,他的操作方式根awk有点像.sed按顺序逐行读取文件.然后,它执行为该行指定的所有操作,并在完成请求的修改之后的内容显示出来,也可以存放到文件中.完成了一行上的所有操作之后,它读取文件的下一行,然后重复该过程直到它完成该文件.在这里要注意一点,源文件(默认地)保持不被修改.sed默认读取整个文件并对其中的每一行进行修改.说白了就是一行一行的操作.我用sed主要就是用里面的替换功能,真