使用 powershell 的 grep 过滤文本

有个log文件，大小在4M左右，要求找出里面耗时超过100s 的记录。首先想到了强大的 grep ，那么就搞起。
先在网上找一下资料，这篇文章，有几种方式：

第一种：
Get-content somefile.txt|findstr "someregexp"
Get-content可以换成cat，Powershell已经给他们做了个别名，可真是体谅sheller。
这种方法算是commandline和Powershell混合，因为findstr是命令行工具，并不是Powershell的cmdlet。
第二种：
cat somefile.txt | where { $ -match "some_regexp"}
纯种Powershell实现了，利用了where过滤
第三种：
Select-String "some_regexp" somefile.txt
直接用Select-string的实现。

经过测试，最后写出的 powershell 命令如下:

cat .\log.log|where {$_ -match "\d{3,}\.\d{2,}s"} >>result.log

用了 where 这个，这个能使用正则， findstr 命令不行。里面的正则匹配字符串 "\d{3,}.\d{2,}s" 也很简单了，"3个数字.2个数字以上s "的意思。

最后：过滤出来的结果放入 result.log

17:05:14,884 [email protected] http-0.0.0.0-8888-Processor7 DEBUG StrategyActionHelper: - getStrategyInvoiceMap finished ... Consumed time:191.028s
17:05:14,889 [email protected] http-0.0.0.0-8888-Processor4 DEBUG StrategyActionHelper: - getStrategyInvoiceMap finished ... Consumed time:191.04s
17:07:19,112 [email protected] http-0.0.0.0-8888-Processor7 DEBUG StrategyActionHelper: - setListStrategyAttributes finished ... Consumed time:379.082s
17:07:20,106 [email protected] http-0.0.0.0-8888-Processor4 DEBUG StrategyActionHelper: - setListStrategyAttributes finished ... Consumed time:381.021s
17:07:37,449 [email protected] http-0.0.0.0-8888-Processor4 DEBUG StrategySearchAction: - setListStrategyAttributes finished ... Consumed time:398.364s
17:25:26,773 [email protected] http-0.0.0.0-8888-Processor4 DEBUG cl: - build table data in getClientContractElement finished ... Consumed time:1064.296s
17:25:27,328 [email protected] http-0.0.0.0-8888-Processor4 DEBUG cl: - getClientContractElement finished ... Consumed time:1064.858s
17:25:27,328 [email protected] http-0.0.0.0-8888-Processor4 DEBUG cl: - buildGTReport finished ... Consumed time:1064.87s Free memory: 176198

注意：

powershell里的编码是 GB K的，不是 UTF8，如果要过滤中文字符，简单的方法是先将 UTF8 编码的文件转换为 ANSI 编码。

时间： 2024-10-07 13:57:43

使用 powershell 的 grep 过滤文本的相关文章

[Linux] day07——查看及过滤文本

查看及过滤文本 =====================================cat concatenate -n 添加行号--------------------------------------tac 倒序显示文件内容--------------------------------------more 翻页阅读 enter下一页空格翻屏 q退出 [选项] 文件名配合管道符 | 输出文本做分页------

grep 过滤

在前面的内容中多次提到并用到grep命令,可见它的重要性. 要知道的是grep连同下面讲的sed, awk都是针对文本的行才操作的. 语法: grep [-cinvABC] 'word' filename -c :打印符合要求的行数 -i :忽略大小写 -n :在输出符合要求的行的同时连同行号一起输出 -v :打印不符合要求的行 -A :后跟一个数字(有无空格都可以),例如 –A2则表示打印符合要求的行以及下面两行 -B :后跟一个数字,例如 –B2 则表示打印符合要求的行以及上面两行 -

如何使用 awk 和正则表达式过滤文本或文件中的字符串

当我们在 Unix/Linux 下使用特定的命令从字符串或文件中读取或编辑文本时,我们经常需要过滤输出以得到感兴趣的部分.这时正则表达式就派上用场了. 什么是正则表达式? 正则表达式可以定义为代表若干个字符序列的字符串.它最重要的功能之一就是它允许你过滤一条命令或一个文件的输出.编辑文本或配置文件的一部分等等. 正则表达式的特点正则表达式由以下内容组合而成: 普通字符,例如空格.下划线.A-Z.a-z.0-9. 可以扩展为普通字符的元字符,它们包括: (.) 它匹配除了换行符外的任何单个字符.

grep过滤用法介绍（一）

grep过滤用法介绍(一) grep主要作用是过滤出指定的行,指定的行满足什么条件,满足的条件我们就可以用一个正则表达式来表示.为了方便下面的实验进行,我们先进行cp /etc/passwd 1.txt 例如:#grep 'root'1.txt,截图如下: 匹配过滤出,有root的行! grep有一个选项很好用: 1.grep --color 'root' 1.txt 标注红色.为了方便使用,我们做一个别名操作,alias cgrep='grep --color'[删除用unalias+别名]

grep过滤用法介绍（二）

grep过滤用法介绍(二) 背景:(1)alias cgrep='grep --color' (2)cp /etc/passwd 1.txt 1. cgrep -n 'root' 1.txt 包含root所在,行数. 2. cgrep -v 'nologin' 1.txt 不包含nologin. 3. cgrep '[0-9]' 1.txt 包含所有0-9中间数字包含任意一个的行. 4. cgrep '[a-zA-Z]' 1.txt 过滤所有字母. 5.cgrep '^[a-z]' 1.txt

使用 awk 过滤文本或文件中的字符串

shell入门-grep过滤-1

正则表达式,就是一个字符串.有一定的规律.我们用指定的字符串匹配一个指定的行.指定的字符串就是正则表达式. 正则表达式有这几个工具:grep egrep sed awk 命令:gerep 说明:过滤出指定的行选项:--color 关键字有颜色 -n 显示行号 -c 显示一共出现了多少行 -v 取反不包含指定字符的行 -A n n指数字例如A2在有指定字符的行下面再显示两行 -B n n指数字例如B2 在有指定字符的行上面再显示两行 -C n n指数字例如C2 在有指定

grep过滤用法介绍（三）

grep过滤用法介绍(三) egrep是grep的扩展形式,grep能用的,egrep都能用 grep --color 'r\?o' 1.txt egrep --color 'r?o' 1.txt 这两式子相等,也就是说?或者+这样的特殊符号在egrep这里不需要脱义!,截图如下: grep -E==egrep egrep用法小结: 1. egrep --color 'root|nologin' 1.txt #head -n3 1.txt |egrep --color -n 'root|nolo

shell按照行号过滤文本，添加授权语句

按照行号过滤文本,添加授权语句 cat -n tables.txt |awk '{if(NR>=4 && NR<=66)print "GRANT ALL ON TABLE "$4" TO testuser;"}' 过滤授权表,执行授权