使用方便 正则表达式grep,sed,awk(一)

一些无稽之谈:

对于正则表达式,永远似了解不明白,看到一些代码,脚本定期,awk,sed。心里总有点虚。主要是记不住。平时又没怎么用,也就没总结了。

如今有空,决定总结一下,顺便克服一下看到shell,js这些带有正则就心虚的弱点。

打算分三篇文章来写

正文:

一般来说,正则分好几种。但基本都差点儿相同,我所了解的有 “基本正则”,“扩展正则“及”perl正则”,本文更偏向说记录“基本正则”和“扩展正则”,它们在grep,egrep,sed,awk中发挥着重要发作用。

開始正则前,先复习一下grep的一些经常使用參数:

-n ,显示行号。
-v, 反向选择
-i,忽略大写和小写

以下来始抄书了,參考《鸟哥的Linux私房菜.基础学习篇 》。先下载我们要用的文本:

http://linux.vbird.org/linux_basic/0330regularex/regular_express.txt

内容例如以下:

先来学习”基本正則表達式“

1.直接匹配

例1.分别找出含apple和is 的文本

这应该是最简单的使用正则了

2.方括号[]

[]主要是进行集合方面的匹配。使用方法我们还是用样例说明

例2匹配含有test,tast的文本

能够看出。[]就是从集合[ae]中选出一个一个来匹配

3.方括号[]与中横线-结合

对于想匹配含有一个数字的文本,我们能够写成[0123456789],但这样难免太麻烦,这就须要中横线了对于数字,能够写成[0-9], 相同,对于字母也能够应用上来,大写字母[A-Z],小写字母[a-z],也能够合在一块。如大写和小写字母[a-zA-Z].

例3,找出含有数字的文本

4.方括号[] ,-,^,三者结合

在[]中出现^表示取反,举例说明

例4.取出带有oo。但oo前不含g的文本

最后一个”19:goooooogle yes!”为什么会匹配上呢?尽管前面是goo,明显不满足。可是。 go(oo)oogle,是满足的,所以匹配上了。这也许就是正则的难点之中的一个,你写出的正则也许存在bug,但你还没发现。

例5。 匹配带有oo,的文本。但oo前不含小写字母 

看到了吧,这就是[],-,^共同使用,注意:^在[]内才表示取反。

5.^与$

这里又出现了^,但与上面的不一样。这里的^表示行首,对应的$就表示行尾。

例6 取出以the 开头的文本

例7 取出以数字或字母结尾的文本

例8取出空行

空行用’^$’进行匹配

6.点号. 与星号*

点号.表示有且仅有一个随意字符

星号表示反复前一个0个或多个字符

例9匹配形如g??d的字符串(gd之间有两个字符)

如结果所看到的。点号.是表示一个随意字符。

例10 匹配至少连续两个o以上的字符。

注意到这里。”*”的意义与我们所认识的通配符*是不一样的。

例11匹配g开头g结尾的文本

用’g*g’ 是不行的。由于*和通配符是不一样,正确的是’g.*g’

所以,记住,正則表達式的*和通配符的 *不一样!

7.转义\

假设我们想匹配的文本正好是代表一些特殊字符(《鸟哥的linux私房菜》中说是在shell中有特殊函义,我觉得是不对的,或者说让人误解,仅仅是
shell中的吗?比方他举的样例点号,在shell中代表的是本文件夹吧?事实上真正的原因是.是正则表达字符吧?),该怎样?转义。

如匹配以点号 . 结尾的文本。我们知道.在正則表達式中表示匹配且仅匹配随意一个字符,所以能够用’\.$’

今天就先写到主要的正則表達式吧。

參考资料:

《鸟哥的Linux私房菜》

《Linux程序设计》

http://www.ibm.com/developerworks/cn/education/aix/au-unixtips3/

http://www.cnblogs.com/chengmo/archive/2010/10/10/1847287.html

版权声明:本文博主原创文章,博客,未经同意不得转载。

时间: 2024-08-10 00:26:32

使用方便 正则表达式grep,sed,awk(一)的相关文章

shell脚本知识(三) 正则表达式 grep sed awk

1.正则表达式 匹配给定文本中的所有单词:( ?[a-zA-Z]+ ?) ?用于匹配单词前后可能出现的空格. 匹配IP地址:[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}   括号分割的4个整数. 2.grep "mach_text"  file1 file2 file3-. 递归搜索文件: grep "text" ./ -Rn 3.cut  将文本按列进切分.可以指定分割每列的定界符.在cut术语中,每列一个字段. c

Shell脚本 (四)正则表达式 grep sed awk 工具

正则表达式定义正则表达式,又称正规表达式.常规表达式是使用单个字符串来描述.匹配一系列符合某个句法规则的字符串·正则表达式组成普通字符大小写字母.数字.标点符号及一些其他符号元字符在正则表达式中具有特殊意义的专用字符·基础正则表达式示例查找特定字符利用中括号[]来查找集合字符查找行首^与行尾字符$查找任意一个字符.与重复字符查找连续字符范围{}·基础正则表达式的常见元字符^.$...\..[ ].[^ ].[n1-n2].{n}.{n,}.{n,m}·####查找特定字符####n--表示显示行

grep,sed,awk与简单正则表达式应用

grep,sed,awk与简单正则表达式应用 这里使用的测试文件是linux /etc/passwd文件,最好是复制一份进行练习,方式对文件内容造成损坏.感觉还是要多练习才能很好的使用,习题这里就不贴了,网上一找一大把. grep:   -o 用作计算出现多少次字段  -c 打印符合要求的行数  -n 在输出符合要求的行的同时也打印行号  -v 打印不符合要求的行  -A 后跟一个数字 ps -A2表示打印符合要求的行及下面两行  -B 后跟一个数字 ps -B2表示打印符合要求的行及上面两行 

python 全栈 linux基础 (部分)正则表达式 grep sed

/etc/profile /etc/bashrc  .变量添加到shell环境中,永久生效. /root/.bashrc /root/.bash_profile 正则表达式 定义:正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.(被命令所解释) 三种文本处理工具/命令:grep sed awk grep(过滤) 参数 -n  :显示行号 -o  :只显示匹配的内容 -q  :静默模式,没有任何输出,得用$?来判断执行成功没有,即有没有过滤到想要的内容 -l

LINUX 下 find grep sed awk 的常见基本用法特点

LINUX 下 find grep sed awk 的常见基本用法特点 只为让自己具有更高的水准,这就开始了长达6个月的小白进阶路! 这几天学习linux基础命令有点犯蒙,尤其是对文件查找这块.所有我想把一些我觉得常用的实用的参数项总结下来,大神勿喷哈... 不到之处请大家指教,小女子在此谢过了. 一.find:命令用于查找文件系统中指定的文件,其命令格式为: 1.find pathname -options [ -print  -exec  -ok ... ] (1)find 命令的参数: p

Linux三剑客grep/sed/awk

grep/sed/awk被称为linux的“三剑客” grep更适合单纯的查找或匹配文本: sed更适合编辑匹配到的文本: awk更适合格式化文本,对文本进行较复杂各式处理: Grep --color=auto 或者 --color:表示对匹配到的文本着色显示 -i:在搜索的时候忽略大小写 -n:显示结果所在行号 -c:统计匹配到的行数,注意,是匹配到的总行数,不是匹配到的次数 -o:只显示符合条件的字符串,但是不整行显示,每个符合条件的字符串单独显示一行 -v:输出不带关键字的行(反向查询,反

[CentOS 7系列]grep/sed/awk实战

最近准备和CoreSite - Any2 California接入商建立网络BGP邻居关系.从peeringdb (https://www.peeringdb.com/ix/142)上找到了所有接入商的信息,但是转移信息到本地不是很方便,需要进行多次文本调整,耗时较长.作为萌新,立马就想到近期学习的grep/sed/awk工具.于是就尝试处理数据. 1.下载页面内容 curl https://www.peeringdb.com/ix/142 > peering 将页面内容存入peering文件

十七. 正则以及grep ,sed,awk的简单应用

一.正则表达式:/ / grep,sed,awk 都能解释正则表达式 正则表达式:把一些特殊符号组合到一起描述字符和字符串的方法.^ 以什么开头 grep '^root' /etc/passwd$ 以什么结尾 如能登入系统的所有用 grep 'bash$'/etc/passwd. 任意一个字符 grep '^b.n' /etc/passwd 过滤取到bin的.* 所有字符* 代表前面的字符有0个或者无穷个 grep 'b*' /+ 必须用egrep 或 egrep -E 'ab+'表示前面的字符

find/pg/grep/sed/awk命令

find pathname -options [-print -exec -ok ...] -print: find命令将匹配的文件输出到标准输出. 当前目录下查找文件权限位为 7 5 5的文件 $ find . -perm 755 -print 当前目录及子目录中查找文件名以一个大写字母开头的文件 $ find . -name "[A-Z]*" 希望在系统根目录下查找更改时间在 5日以内的文件 $ find / -mtime -5 -print 为了在/var/adm目录下查找更改时