Linux基础:awk & sed & uniq & split 解析文本

 grep -Eni ‘(.+center.+){6}‘ TestSummaryReport.html|awk -F‘<td align="center">‘ ‘{print $4}‘ test.html

grep 查询对应行

grep -Eni ‘(.+center.+){6}‘ test.html --正解

grep -Eni ‘(center){6}‘ test.html 查询为空因为用center进行精确匹配,空格做分隔符找不到相应内容,必须在center前后加上.+ 表示包含center的字符串。

awk 横向分割

按分隔符取出第四列数据,-F后面加上‘‘表示分隔符

awk -F‘<td align="center">‘ ‘{print $4}‘ test.html

answer: 55.56%</td>

Sed横向分割字符串

split

时间: 2024-10-12 13:18:57

Linux基础:awk & sed & uniq & split 解析文本的相关文章

linux基础--awk文本分析工具详解

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理. awk有3个不同版本: awk.nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本. awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK

linux基础命令 sed

sed     (stream editor)     linux三剑客老二,流编辑器,实现对文件的增删改替换查 参数      -n 取消默认输出      -i  修改内容     -e允许多项编辑,p打印 sed   -n  '$' p  ett,txt    $是行尾的意思,表示打印出最后一行 g与s联合使用时,表示对当前全局匹配替换 s常说的查找并替换,用一个字符串替换成另一个 sed   -i  s#oldboy#oldgirl#g   a.txt       # 是分隔符 sed是

转摘--如何利用多核CPU来加速你的Linux命令 — awk, sed, bzip2, grep, wc等

http://www.vaikan.com/use-multiple-cpu-cores-with-your-linux-commands/ 你是否曾经有过要计算一个非常大的数据(几百GB)的需求?或在里面搜索,或其它操作——一些无法并行的操作.数据专家们,我是在对你们说.你可能有一个4核或更多核的CPU,但我们合适的工具,例如 grep, bzip2, wc, awk, sed等等,都是单线程的,只能使用一个CPU内核. 借用卡通人物Cartman的话,“如何我能使用这些内核”? 要想让Lin

linux基础之sed命令

Sed 流 编 辑 器 1.sed的基本用法: sed  [OPTION]...  'script' input-file... 2.sed:Stream   Editor  文本编辑器 行编辑器(全屏编辑器:vi) 3.sed:模式空间 默认不编辑源文件,仅对模式空间中的数据做处理,而后,处理结束后,讲模式空间打印至屏幕 1>.常用选项: -n  : 静默模式,不再默认显示模式空间的内容: -i   : 直接修改源文件: -e  : script   -escript    可以同时执行多个脚

[linux] grep awk sort uniq学习

grep的-A-B-选项详解grep能找出带有关键字的行,但是工作中有时需要找出该行前后的行,下面是解释1. grep -A1 keyword filename找出filename中带有keyword的行,输出中除显示该行外,还显示之后的一行(After 1)2. grep -B1 keyword filename找出filename中带有keyword的行,输出中除显示该行外,还显示之前的一行(Before 1)3. grep -1 keyword filename找出filename中带有k

Linux 三剑客 -- awk sed grep

顶配awk,中配sed,标配grep 我们都知道,在Linux中一切皆文件,比如配置文件,日志文件,启动文件等等.如果我们相对这些文件进行一些编辑查询等操作时,我们可能会想到一些vi,vim,cat,more等命令.但是这些命令效率不高,这就好比一块空地准备搭建房子,请了10个师傅拿着铁锹挖地基,花了一个月的时间才挖完,而另外一块空地则请了个挖土机,三下五除二就搞定了,这就是效率.而在linux中的"挖土机"有三种型号:顶配awk,中配sed,标配grep.使用这些工具,我们能够在达到

Linux基础之sed流编辑器详解

之前介绍了三大文本编辑器的grep,这里介绍比grep功能更强的sed流编辑器 sed是什么? sed是Stream EDitor的缩写,man中对sed的简洁为 sed - stream editor for filtering and transforming text 它的主要功能是对文本的过滤与替换. sed的工作原理 sed的工作过程:sed是一个流编辑器,所谓流编辑器是指sed每次只从文件或stdin中读入一行,将读入的行保存至模式空间然后根据指定的要求对其进行处理,并将处理后的结果

2016-3-8 linux基础学习——sed命令

sed(Stream EDitor)行编辑器(全屏编辑器:vi)        sed:显示模式空间    默认不编辑文件,仅对模式空间中的数据做处理    而后,处理结束后,将模式显示在屏幕上        sed -n 'AddressCommand' file ...        单/双引号都可以,双引号可实现变量替换        -n:静默模式 不再默认显示模式空间中的内容        -i:直接修改源文件        -e SCRIPT -e SCRIPT:可以同时执行多个脚本

Linux基础-awk、变量、运算符、if

awk 程序的运行就是一些列状态的变量->用变量值的变化去表示 以字母或下划线开头,剩下的部分可以是:字母.数字.下划线. 最好遵循下述规范: 1.以字母开头2.使用中划线或者下划线做单词的连接3.同类型的用数字区分4.对于文件最好加上拓展名 set 和 env区别set:显示所有变量env:环境变量 变量赋值 VARNAME=VALUEecho $VARNAME删除变量 unset VARNAME 常用系统变量  PATHPWDLANGHOMEHISTSIZEPS1IFS域分隔符 是空格,换行