awk与sed：关于多行的样本

几天前CSDN看到一个帖子http://bbs.csdn.net/topics/390848841，楼主贴了以下的问题：


例：
12345
67890
1234567890
123
4567890
怎样能把上面数据转换成
1234567890
1234567890
1234567890

看了几位网友的回复。认为还是挺有意思，也收获了一些知识，由于部分网友仅仅给出了解决方法，没有解释下。我依据自己的理解，对几个答案解释下（不一定准确，错误之处请指正）

我觉得错的答案

1 首先楼主给出了一个他说调试不出来的答案：


sed ‘s/(?!90)\n//g‘

？！

应该是非pattern结尾的意思，这个答案应该是说把非90结尾的行的换行符换位空。

这个答案应该是不可行的。sed默认单行模式。一次处理一行，执行时发现，就算我们把换行符去掉了。sed命令结束后。还是将它当成完整的一行输出（也就是说，应该是自己主动又加上换行符了）

2. 有一位网友。认为其它答案太复杂，给出了以下的方法

sed ‘N;s/\n//g’

这个答案使用了sed的多行模式，但应该是无法实现楼主的目的的。我们看执行结果“

[email protected]:~/Windeal/shell$ sed 'N;s/\n//g' a.txt
1234567890
1234567890123
4567890

能够看出，sed 的N命令把第二行接到第一行后面，把第四行接到第三行后面，没有考虑到我们目标中：仅仅有非90结尾的才把下一行附加上来。所以第四行的123被附加到第三行1234567890而出现了错误的结果。

我觉得对的答案

再来看两个我觉得对的答案：

sed -e '/^/{:loop /90$/!{N;b loop};s/\n//g}' test.txt > t2.txt
改一下好理解一点就是
sed '{:myloop /90$/!{N;b myloop};s/\n//g}' a.txt

/^/的意思我没弄明确。应该是匹配每一行吧

在该命令中。myloop是一个自己定义的标签。

类似程序语言中goto用的标签。 N表示多行模式，b表示分支（相当于goto）

这样就好理解了。sed会读取一行内容，假设这一行不是以90结尾。/90$/! 就为真，进入{N;b myloop}。

N就进入了多行模式。把下一行附加上来，然后进入分支b
myloop，在推断是不是以90结尾，这样重复读取，直到读到以90结尾的行。

接下来模式空间的读取工作已经完毕。进入下一个命令。替换。s/\n//g?这个命令把当前模式空间的换行符都转换为空，也就是拼接成一行。

如此，我们就完毕了我们要的目的。

awk '{if($0~/90$/){print}else{printf("%s",$0)}}' a.txt

这个答案读取了一行的所以字段（实际上就1个字段，）用$0表示，然后if($0~/90$/)推断是不是以90结尾。

假设以90结尾，就输出当前行数据。

假设不是，就格式化输入当前航的字符串

注意print和printf的差别

时间： 2024-10-11 21:47:07

awk与sed：关于多行的样本的相关文章

用awk、sed打印奇数行或偶数行

这里只介绍最简单的方法 sed实现一:奇数行 sed -n 'p;n' file偶数行 sed -n 'n;p' file 这个可能比较难理解,举个网上的例子: 例,从aaa文件中取出偶数行cat aaa This is 1 This is 2 This is 3 This is 4 This is 5 sed -n 'n;p' aaa //-n表示取消默认输出 This is 2 This is 4 注释:sed读取This is 1,执行n命令

awk与sed：一个关于多行处理的例子

前几天在CSDN上看到一个帖子http://bbs.csdn.net/topics/390848841,楼主贴了下面的问题: 例: 12345 67890 1234567890 123 4567890 如何能把上面数据转换成 1234567890 1234567890 1234567890 看了几位网友的回复,觉得还是挺有意思,也收获了一些知识,因为部分网友只给出了解决方法,没有解释下,我根据自己的理解,对几个答案解释下(不一定准确,错误之处请指正) 我认为错的答案 1 首先楼主给出了一个

利用多核CPU来加速Linux命令 — awk、sed、bzip2、grep、wc

你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作--一些无法并行的操作.数据专家们,我是在对你们说.你可能有一个4核或更多核的CPU,但我们合适的工具,例如 grep, bzip2, wc, awk, sed等等,都是单线程的,只能使用一个CPU内核.借用卡通人物Cartman的话,"如何我能使用这些内核"?要想让Linux命令使用所有的CPU内核,我们需要用到GNU Parallel命令,它让我们所有的CPU内核在单机内做神奇的map-reduce操作

awk和sed （十二）

[教程主题]:4.awk和sed [主要内容] [1]awk AWK是贝尔实验室1977年搞出来的文本出现神器.之所以叫AWK是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的Family Name的首字符.要学AWK,就得提一提AWK的一本相当经典的书<The AWK Programming Language>,它在豆瓣上的评分是9.4分!在亚马逊上居然卖1022.30元. Awk和sed 第二版我从netstat命令中

【文本处理】awk、sed使用 - 更新中

一.正则介绍基本元字符(基本正则表达式): 字符匹配: . 匹配换行符之外的任意一个字符 [] 字符组元字符,元字符在[]内,会失去特殊意义不用转义 [^] 除开字符组中的字符次数匹配: * 匹配前面字符零次或多次 \? 零次或一次 \{m,n\} 至少m次,至多n次 \{m,\} m次锚定符: \<,\b 词首锚定 \>,\b 词尾锚定 ^ 行的开头 $ 行的结尾 ^$ 空行 .* 任意字符串分组:  \1,\2 前向引用,\1

shell脚本---grep、awk、sed工具

grep:Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来.grep是一种查找过滤工具,正则表达式在grep中用来查找符合模式的字符串. grep有三种变形: 1.grep:标准grep命令主要讨论此格式. 2.egrep:扩展grep,支持基本及扩展的正则表达式 3.fgrep:快速grep,允许查找字符串而不是一个模式.这里的快速并不是值速度快格式 grep [options] 主要参数 [options]主要参数: -c:只输出匹配行

awk、sed、grep更适合的方向

awk.sed.grep更适合的方向: grep 更适合单纯的查找或匹配文本 sed 更适合编辑匹配到的文本 awk 更适合格式化文本,对文本进行较复杂格式处理关于awk内建变量个人见解,简单易懂解释一下变量: 变量:分为内置变量和自定义变量;输入分隔符FS和输出分隔符OFS都属于内置变量. 内置变量就是awk预定义好的.内置在awk内部的变量,而自定义变量就是用户定义的变量. FS(Field Separator):输入字段分隔符, 默认为空白字符 OFS(Out of Field Sep

awk grep sed

awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. last -n5|awk '{print $1}' #last -4 也行 cat /etc/passwd |awk -F ':' '{print $1}' #等于 cat /etc/passwd |cut -d':' -f1 显示/etc/passwd的账户 awk -F: '{print $1}' 也行 cat /etc/pass

awk按照奇数行和偶数行进行处理

取奇数行 awk 'NR%2' file MR是行号,行号对2取模,奇数的结果为1,所以打印如果还不懂看这个你就懂了 awk '{if (NR%2==1) print $0}' file 原文:http://blog.csdn.net/hongchangfirst/article/details/25110611 作者:hongchangfirst hongchangfirst的主页:http://blog.csdn.net/hongchangfirst awk按照奇数行和偶数行进行处理