Linux命令中使用正则表达式

在使用grep、awk和sed命令时,需要使用正则表达式。
比如我通过grep找代码编译结果中是否有错误。或者是否有我代码的错误。
这里说下正则表达式基本的应用:

匹配行首与行尾。
匹配数据集。
只匹配字母和数字。
匹配一定范围内的字符串集。

^ 只匹配行首
$ 只匹配行尾
* 一个单字符后紧跟*,匹配0个或多个此单字符
[] 匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用 - 表示[]内字符序列范围,如用[1-5]代替[12345]
\ 用来屏蔽一个元字符的特殊含义。因为有时在shell中一些元字符有特殊含义。\可以使其失去应有含义。
. 匹配任意单字符
pattern\{n\} 用来匹配前面pattern出现次数。n为次数
pattern\{n,\} 含义同上,但次数最少为n
patter\{n,m\} 含义同上,但pattern出现次数在n与m之间
  1. 使用句点匹配单字符
    句点“.”可以匹配任意单字符。例如,如果要匹配一个字符串,以be g开头,中间夹一个
    任意字符,那么可以表示为be g . n,“.”可以匹配字符串头,也可以是中间任意字符。
    在ls-l命令中,可以匹配一定权限:
    .. . x . . x . . x
    此格式匹配用户本身,用户组及其他组成员的执行权限。
    ~$ ls -l |grep ...x..x..x
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
    ~$
  2. 在行首以^匹配字符串或字符序列
    ^只允许在一行的开始匹配字符或单词。例如,使用ls-l命令,并匹配目录。之所以可以
    这样做是因为ls-l命令结果每行第一个字符是d,即代表一个目录。
    ~$ ls -l |grep ^d
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
  3. 在行尾以$匹配字符串或字符
    可以说$与^正相反,它在行尾匹配字符串或字符,$符号放在匹配单词后。假定要匹配以
    单词lisp结尾的所有行,操作为:
    ~$ ls |grep sp$
    lisp
    site-lisp
    ~$
  4. 使用*匹配字符串中的单字符或其重复序列
    使用此特殊字符匹配任意字符或字符串的重复多次表达式。例如:
    找e*m(以e开头m结束的字符串)
    ~$ ls | grep e*m
    emacs
    leim
    ~$
  5. 使用\屏蔽一个特殊字符的含义
    有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。什么
    是特殊字符?一般意义上讲,下列字符可以认为是特殊字符:
    $ . ‘ " * [ ] ^ | { } \ + ?
    例如:找以.el后缀的文件
    ~/lisp$ ls | grep \.el$
    abbrev.el
    abbrevlist.el
    add-log.el
    align.el
    allout.el
    ansi-color.el
    apropos.el
    arc-mode.el
    array.el
    autoarg.el
    autoinsert.el
    autorevert.el
    avoid.el
    battery.el
    bindings.el
    bookmark.el
    bs.el
    buff-menu.el
    button.el
    calculator.el
    case-table.el
  6. 使用[]匹配一个范围或集合
    使用[]匹配特定字符串或字符串集,可以用逗号将括弧内要匹配的不同字符串分开,但并
    不强制要求这样做(一些系统提倡在复杂的表达式中使用逗号),这样做可以增加模式的可读
    性。
    使用“-”表示一个字符串范围,表明字符串范围从“-”左边字符开始,到“-”右边字
    符结束。
    如果熟知一个字符串匹配操作,应经常使用[]模式。
    假定要匹配任意一个数字,可以使用:
    [0123456789]
    然而,通过使用“-”符号可以简化操作:
    [0-9]
    或任意小写字母
    [a-z]
    要匹配任意字母,则使用:
    [A-Za-z]
    表明从A-Z、a-z的字母范围。
    如要匹配任意字母或数字,模式如下:
    [A-Za-z0-9]
    注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
    [^a-zA-Z]
    匹配任一非字母型字符,而
    [^0-9]
    匹配任一非数字型字符。
    通过最后一个例子,应可猜知除了使用^,还有一些方法用来搜索任意一个特殊字符。
  7. 使用\{\}匹配模式结果出现的次数
    使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用\{ \ },此模式有三种
    形式,即:
    pattern\{n\}匹配模式出现n次。
    pattern\{n,\}匹配模式出现最少n次。
    pattern\{n,m}匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数。
    例如格式如下:前4个字符是数字,接下来是xx,最后4个也是数字,
    操作如下:
    [0-9]\{4\}XX[0-9]\{4\}
    具体含义如下:
    1)匹配数字出现4次。
    2)后跟代码xx。
    3)最后是数字出现4次。

经常使用的正则表达式举例

^                                 行首

$                                 行尾

^ [ t h e ]                      以t h e开头行

[ S s ] i g n a [ l L ]              匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L

[Ss]igna[lL]".                同上,但加一句点

[ m a y M A Y ]             包含m a y大写或小写字母的行

^ U S E R $                  只包含U S E R的行

[tty]$                           以t t y结尾的行

" .                                带句点的行

^ d . . x . . x . . x          对用户、用户组及其他用户组成员有可执行权限的目录

^ [ ^ l ]                        排除关联目录的目录列表

^[^d]                ls –l | grep ^[^d] 只显示非文件夹的文件

[ . * 0 ]                       0之前或之后加任意字符

[ 0 0 0 * ]                  0 0 0或更多个

[ iI]                             大写或小写I

[ i I ] [ n N ]                大写或小写i或n

[ ^ $ ]                         空行

[ ^ . * $ ]                     匹配行中任意字符串

^ . . . . . . $                  包括6个字符的行

[a- zA-Z]                     任意单字符

[ a - z ] [ a - z ] *         至少一个小写字母

[ ^ 0 - 9 " $ ]                非数字或美元标识

[ ^ 0 - 0 A - Z a - z ]     非数字或字母

[ 1 2 3 ]                       1到3中一个数字

[ D d ] e v i c e            单词d e v i c e或D e v i c e

D e . . c e                    前两个字母为D e,后跟两个任意字符,最后为c e

" ^ q                            以^ q开始行

^ . $                            仅有一个字符的行

^".[0-9][0-9]                以一个句点和两个数字开始的行

‘ " D e v i c e " ‘            单词d e v i c e

D e [ V v ] i c e " .               单词D e v i c e或d e v i c e

[ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 2 " } - [ 0 - 9 ] " { 4 " }      对日期格式d d - m m - y y y y

[ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } " . [ 0 - 9 ] " { 3 " } I P地址格式

[ ^ . * $ ]                     匹配任意行

[A-Za-z]*            匹配所有单词

常用的g r e p选项

-c 只输出匹配行的计数。

-i 不区分大小写(只适用于单字符)。

-h 查询多文件时不显示文件名。

-l 查询多文件时只输出包含匹配字符的文件名。

-n 显示匹配行及行号。

-s 不显示不存在或无匹配文本的错误信息。

-v 显示不包含匹配文本的所有行。

时间: 2024-08-08 02:58:21

Linux命令中使用正则表达式的相关文章

linux命令中的“<”和“|”是什么意思?#命令行

linux命令中的"<"和"|"是什么意思? 如:$ .cat < /etc/motd | ./a.out 最佳答案 < 表示的是输入重定向的意思,就是把<后面跟的文件取代键盘作为新的输入设备.| 则表示一个管道的意思,可以理解为东西从管道的一边流向另外一边.你的命令意思就是说从/etc/motd文件中读取内容,然后把cat命令读取出来的内容作为后面一个命令 a.out的输入参数来执行a.out命令. By 网友 artttt & 暗

linux命令中的大神

命令一:rm中的-r参数 首先是创建了temp文件,它所属者是xulinux用户,以及xulinux组,权限通过后3句使得任何人不得写,不得读,不得访问该目录: 可是在root用户下,通过rm -r形式使得它强制的删除了temp,强制的访问,强制的读取,强制删除:故而这个命令非常霸气,可以无视权限,且删除不能恢复,因为它不是删除到回收站中.故而使用者非常小心使用. 待续..... linux命令中的大神,布布扣,bubuko.com

linux sed命令中的正则表达式问号、加号、圆括号等需要转义

linux sed命令内的正则表达式语法分两种,一种叫Basic (BRE) Syntax,另一种叫Extended (ERE) Syntax.默认使用的是BRE. 这个BRE就是一个简化版,语法稍微有点不一样,问号.加号.圆括号.花括号和竖线没有特殊含义,就代表字符本身,如果要原本定义的实现特殊含义,需要用反斜杠(\)转义……详情请见: https://www.gnu.org/software/sed/manual/html_node/BRE-vs-ERE.html#BRE-vs-ERE

Linux命令中service的用法

用途说明 service命令用于对系统服务进行管理,比如启动(start).停止(stop).重启(restart).查看状态(status)等.相关的命令还包括chkconfig.ntsysv等,chkconfig用于查看.设置服务的运行级别,ntsysv用于直观方便的设置各个服务是否自动启动.service命令本身是一个shell脚本,它在/etc/init.d/目录查找指定的服务脚本,然后调用该服务脚本来完成任务. 看看下面的手册页可能更加清楚的了解service的内幕:service运行

linux命令中的“&lt;”和“|”是什么意思?

”<” 表示的是输入重定向的意思,就是把<后面跟的文件取代键盘作为新的输入设备.”| ”则表示一个管道的意思,可以理解为东西从管道的一边流向另外一边. cat file.json | python -m json.tool 程序呢? 简单的说shell程序就是一个包含若干行 shell或者linux命令的文件. 象编写高级语言的程序一样,编写一个shell程序需要一个文本编辑器.如VI等. 在文本编辑环境下,依据shell的语法规则,输入一些shell/linux命令行,形成一个完整的程序文件

Linux grep 命令中的正则表达式详解

在 Linux .类 Unix 系统中我该如何使用 Grep 命令的正则表达式呢? Linux 附带有 GNU grep 命令工具,它支持扩展正则表达式(extended regular expressions),而且 GNU grep 在所有的 Linux 系统中都是默认有的.Grep 命令被用于搜索定位存储在您服务器或工作站上的任何信息. 正则表达式 正则表达式就是用于匹配每行输入的一种模式,模式是指一串字符序列.下面是范例: ^w1 w1|w2 [^ ] grep 正则表达式示例 在 /e

linux命令中which、whereis、locate有什么区别?

1.find find是最常用和最强大的查找命令.它能做到实时查找,精确查找,但速度慢. find的使用格式如下: #find [指定目录] [指定条件] [指定动作] 指定目录:是指所要搜索的目录和其子目录.如果不指定,则默认为当前目录. 指定条件:是指所要搜索的文件的特点. 指定动作:是指对搜索的结果如何处理. 常见选项: -name 根据文件名称查找(严格区分大小写,如果文件名中间有空格,则必须把文件名用双引号引起来) -iname 根据文件名查找(不区分大小写) -regex "PATT

Linux命令汇总之正则表达式

正则表达式分两类:基本正则表达式(BRE)和扩展正则表达式(ERE). 基本正则表达式的元字符含义: 1..:匹配任何单个字符 2.[]:匹配指定范围内的单个字符 3.[^]:匹配指定范围外的单个字符 4.*:匹配其前面任意次数的字符 5.\?:匹配其前面0或1次 6.\+:匹配其前面1或多次 7.\{m\}:精确匹配m次 8.\{m,n\}:匹配至少m次,最多n次 9..*:匹配任意长度的任意字符 10.^:行首锚定, 11.$:行尾锚定 12.\<:词首锚定(也可以用\b) 13.\>:词

linux命令中&quot;|&quot;管道流的意思

在linux中.可以利用符号:"|"来实现管道功能. 那么什么是管道功能呢: 管道是Shell的一大特征.他将多个命令前后连接起来形成一个管道流. 管道流中的每一个命令都作为一个单独的进程运行. 前一个命令的输出结果座位后一个命令的输入. 从左到右依次执行每一个命令 例如: 使用"ls --help|more"命令来显示"ls"命令的帮助信息,由于帮助信息过长,可以使用管道"|"和"more"命令来分页显示