正则表达式、管道和重定向

1、什么是正则表达式

正则表达式是一类字符所书写的模式(pattern)取行：选择，grep，egrep，fgrep

使用正则表达式来描述选择条件

正则表达式：基本正则表达式，扩展正则表达式

元字符：*，？这类字符不表示字符本身的意义，而用于额外功能性的描述

给定选取条件，只显示符合条件的行

grep：默认支持基本正则表达式;

egerp：支持扩展正则表达式;

fgrep：不支持正则表达式元字符，快速搜索，所有的字符都当做字符本身

grep：简单搜索，全局搜索基本正则表达式

grep [options] ‘pattern‘ FILE

# grep ‘root‘ /etc/passwd         #显示含有root字符串的行
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

基本正则表达式的元字符：

^：锚定行首的符合条件的内容，用法格式"^pattern"

# grep ‘^root‘ /etc/passwd
root:x:0:0:root:/root:/bin/bash

$：锚定行尾的符合条件的内容，用法格式"pattern$"

# grep --color=auto ‘sh$‘ /etc/passwd
root:x:0:0:root:/root:/bin/bash
oracle:x:500:500::/home/oracle:/bin/bash
hadoop:x:501:502::/home/hadoop:/bin/bash

^pattern$：以单词开头，并以其结尾

^$：空白行

.：匹配任意单个字符

*：匹配紧挨在其前面的字符任意次数

a*b：ab，aab，acb，b

.*：匹配任意长度的任意字符

[]：匹配指定范围内的任意但个字符

[^]：匹配指定范围外的任意单个字符

\？：匹配紧挨在其前面的字符0次或1次

a\?b：ab，aab，acb，b

\{m,n\}：匹配其前面的字符至少m次，至多n次

a\{1,3\}b：b，ab，aab，aaaab，abc

\{0,n\}：至多n次，0-n次

\{m,\}：至少m次

\{m\}：精确匹配m次

\<：锚定词首，，用法格式：\<pattern

\b：\bpattern

\>：锚定词尾，用法格式：pattern\>

\b：pattern\b

\<pattern\>：锚定单词

：分组，用法格式：$pattern$

$ab$\{1,3\}：ab,aab,abb,abab,ababab

$ab$.*\1：前面与后面一样

# grep "\(gentoo\).*\1" /etc/passwd
gentoo:x:1001:1001:cao yuan lang:/home/gentoo:/bin/bash

grep的选项：

--color=auto

export GREP_COLOR=‘01;36‘ 01表示字体颜色(前景色)，36表示背景颜色

-v：反向选取，只显示不符合模式的行

-o：只显示被模式匹配到的字符串，而不是正行

-i：匹配时，不区分字符大小写

-A N：显示匹配到的行的时候，顺带显示其后面的N个行

-B N：显示匹配到的行的时候，顺带显示其前面的N个行

-C N：显示匹配到的行的时候，顺带显示其前面和后面的N个行

-E：使用扩展的正则表达式

例：

显示/proc/meminfo文件中以不区分大小的s开头的行;

# grep "^[Ss]" /proc/meminfo

显示/etc/passwd中以nologin结尾的行;

# grep "nologin$" /etc/passwd           
# grep "nologin$" /etc/passwd | wc -l      #显示有多少行

取出默认shell为/sbin/nologin的用户列表

# grep "nologin$" /etc/passwd | cut -d: -f1

取出默认shell的bash，且其用户ID号最小的用户名

# grep "/bin/bash$" /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1   #-t 指定分隔符，-k指定第几个字段进行排序

显示/etc/rc.d/rc.sysinit中以#开头，且后面跟一个或多个空白字符，而后面又跟了任意非空白字符的行

# grep "^#[[:spaec:]]\{1,\}[^[:space:]]" /etc/rc.d/rc.sysinit

显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行：即任意但个字符后面跟了个n，n后面有任意长度的任意字符，而后是任意单个字符后面跟了个n

# grep ".n.*.n" /etc/rc.d/rc.sysinit

显示/etc/rc.d/rc.sysinit中符合形为“任意单个字符n任意字符任意单个字符n”模式的行：即任意单个字符后面跟了个n，n后面有任意长度的任意字符，而后是任意单个字符后面跟了个n，但后面的n之前的字符要与前面的n之前的字符相同

# grep "\(.n\).*\1" /etc/rc.d/rc.sysinit

显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行

# grep "^#[[:spaec:]]\{1,\}" /boot/grub/grub.conf

找出某文件中的，1位数，或2位数

# grep "\<[0-9]\{1,2\}\>" /etc/rc.d/rc.sysinit    
# grep -w "[0-9]\{1,2\}" /etc/rc.d/rc.sysinit

找出ifconfig命令结果中的1-255之间的整数

ifconfig | grep

# ifconfig | egerp --color=auto "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>"

100-199：1[0-9][0-9]

200-249：2[0-4][0-9]

250-255：25[0-5]

查找当前系统上名字为student（必须出现在行首）的用户的账号的相关信息，文件为/etc/passwd

# grep "^student:" /etc/passwd

扩展正则表达式元字符：

.：任意单个字符

[]：匹配指定范围内的任意但个字符

[^]：匹配指定范围外的任意单个字符

*：匹配紧挨在其前面的字符任意次数

+：匹配其前面的字符至少1次

？：匹配紧挨在其前面的字符0次或1次

{m,n}：至少m次，至多n次

()：分组，支持引用\1,\2

a|b：二选一

\<：锚定词首，，用法格式：\<pattern

\b：\bpattern

\>：锚定词尾，用法格式：pattern\>

\b：pattern\b

\<pattern\>：锚定单词

^：锚定行首的符合条件的内容，用法格式"^pattern"

$：锚定行尾的符合条件的内容，用法格式"pattern$"

# egrep "c|Cat" /root/test.txt
c,Cat
# egrep "(c|C)at" /root/test.txt
cat,Cat

fgrep：fist

sort：排序

-f：忽略大小写

-n：以数值大小进行排序：默认以ASCII表中的数字大小排序

-r：逆序排序

-u：移除重复的行，具有相同内容的行只保留一个

只有两行一模一样，并且挨着，才算是重复的行

-R：随机排序

-t：指定分隔符

-k：指定用第几个字段进行排序

uniq：

-c：统计每行重复的

-u：只显示没有重复的行

-d：只显示重复过的行

# sort sort.txt | uniq -c
    1 First line.
    1 Four line.
    1 How are you?
    2 Second line.
    2 Third line.
# sort sort.txt | uniq -d
    Second line.
    Third line.
# sort sort.txt | uniq -u
    First line.
    Four line.
    How are you?

文本处理三剑客：grep，sed，awk

2、重定向

Linux I/O重定向，管道

I/O：这是一种统称

Linux为应用程序提供了I/O重定向的功能

程序本身要有输入输出的功能

为了安全起见，所以输入输出都标准化了，标准输入是键盘，标准输出是监视器（显示器），错误输出也是监视器

每一个内核打开的文件都有一个文件描述符：file disciptor，FD

标准输入FD：0 标准输出FD：1 错误输出FD：2

将其默认数据流改为其他设备，就称为IO重定向

输出重定向：

1>：覆盖重定向，即覆盖文件里面的内容 1可以省略

set -C：避免覆盖已经存在的文件的内容

set +C：关闭上述功能

1>>：追加重定向 1可以省略

/dev/null：数据黑洞，bit bucket

错误重定向：

2>：覆盖重定向

2>>：追加重定向

">"改成">>"则表示把输出追加到filename文件的末尾，如果文件不存在则创建它。

同时重定向标准输出和错误输出：

COMMAND > /path/to/stdout 2> /path/to/error

标准输出和错误输出定向至一个文件：

&>>

COMMAND &> /path/to/somewhere 或 COMMAND > /path/to/somewhere 2>&1

输入重定向：

<：

COMMAND < /from/somewhere

<<：Here Document，此处创建文档

cat > /path/to/somefile << EOF 通常用于脚本中生成文档

cat << EOF 通常用于脚本中向用户输出大段信息

3、管道

管道：|

COMMAND1 | COMMAND2 | COMMAND3 |...

管道的最后一个命令是在当前shell的子shell中执行

多道输出：

tee

COMMAND1 | tee /path/to/somefile

# ifconfig | grep "inet addr:" | grep -v ‘127.0.0.1‘ | cut -d:-f2 | cut -d‘ ‘ -f1
192.168.1.1

例：

统计/usr/bin/目录下的文件个数

# ls /usr/bin | wc -l

取出当前系统上所有用户的shell，要求每种shell只显示一次，并且按顺序进行显示

# cut -d: -f7 /etc/passwd | sort -u | grep -v "^$"

如何显示/var/log目录下每个文件的内容类型？

# file /var/log/*     或  # cd /var/log ; file ‘ls /var/log‘

取出/etc/inittab文件的第5行

# head -5 /etc/inittab | tail -1

取出etc/passwd文件中倒数第9个用户的用户名和shell，显示到屏幕上并将其保存至/tmp/users.txt文件中

# tail -9 /etc/passwd | head -1 | cut -d: -f1,7 | tee /tmp/users.txt

显示/etc目录下所有以pa开头的文件，并统计其个数

# ls /etc/pa* | wc -l

不使用文件编辑器，将alias cle=clear一行内容添加至当前用户的.bashrc文尾部

# echo ‘alias cls=clear‘ >> ~/.bashrc

时间： 2024-10-30 18:41:43

正则表达式、管道和重定向的相关文章

004-用户、组、权限管理命令及bash配置文件、管道、重定向、grep

l 1.用户管理命令 1．)创建用户命令 useradd [OPTIONS] USERNAME -u(UID):指定用户UID -g(GID):指定基本组 -G( group,...):指定附加组 -c"COMMENT":指定注释信息 -d(home_dir):指定家目录/path/to/directory -s:指定SHELL路径(/etc/shells指定了当前系统可用的安全shell) -m –k:强行为用户创建家目录 -M:不创建用户家目录 /etc/login.defs

管道，输出，管道，重定向，grep

输出:大于号:将一条命令执行结果(标准输出,或者错误输出,本来都要打印到屏幕上面的)重定向其它输出设备(文件,打开文件操作符,或打印机等等)> 是覆盖原有内容>> 是追加内容 2> 是错误内容覆盖>> 是错误内容追加重定向[[email protected] ~]$ sdfsdfsdf > a.txt bash: sdfsdfsdf: 未找到命令...[[email protected] ~]$ sdfsdfsdf 2>a.txt [[email prote

Linux入门-7 Linux管道、重定向以及文本处理

Linux管道.重定向以及文本处理 1 Linux多命令协作:管道及重定向管道和重定向 2 Linux命令行文本处理工具文件浏览基于关键字搜索-grep 基于列处理文本-cut 文本统计-wc 文本排序-sort 删除重复行文本比较-diff 检查拼写-aspell 处理文本内容-tr 搜索替换-sed 开源的一个重要理念:不要重复发明轮子. 很多开源软件都是现有软件.代码.功能的重新组合. <大教堂与集市> 1 Linux多命令协作:管道及重定向管道和重定向 Linux中,大多数命

管道和重定向笔记

管道和重定向:> < >> << 运算器.控制器: CPU存储器:RAM输入设备/输出设备程序:指令和数据控制器:指令运算器:存储器: 地址总线:内存寻址数据总线:传输数据控制总结:控制指令寄存器:CPU暂时存储器 I/O: 硬盘, 程序 INPUT设备: OUTPUT设备系统设定默认输出设备:标准输出,STDOUT, 1 默认输入设备:标准输入, STDIN, 0 标准错误输出:STDERR, 2 标准输入:键盘标准输出和错误输出:显

shell管道与重定向

输出重定向 ? 1 $ ls -l > lsoutput 这条命令将ls命令执行后的结果输入出到lsoutput文件中. 在linux shell中使用符号 > ,< 来完成输入输出的重定向,同时对应的有三种标准的文件描述符,0(标准输入),1(标准输出),2(标准错误),可以单独的重写向其中的任何一种.你还可以重定向其他的文件描述符,但对标准文件描述符以外进行重定向的情况很少见. 默认情况下>符号在文件已经存在时它会覆盖,需要使用set -o noclobber(或set -

Linux-(16)管道和重定向

Linux的命令行为我们提供了管道和重定向机制,通过管道和重定向就可以完成多命令协作. 命令行shell的数据流有以下三种定义: 名称说明编号默认 STDIN 标准输入 0 键盘 STDOUT 标准输出 1 终端 STDERR 标准错误 2 终端命令通过STDIN接收参数或数据,通过STDOUT输出结果或通过STDERR输出错误,通过管道和重定向可以控制CLI的数据流如果将输出重定向到/dev/null就不会有输出了(这个通常用于在结果中过滤错误信息) 重定向: > 将STDOUT重

Linux shell管道与重定向及实例分析

一.管道管道命令操作符是:"|",它仅能处理由前面一个命令的正确输出信息,也就是standard output的信息,对于stdandard error信息没有直接处理能力:然后,传递给下一个命令,作为标准输入standard input. linux管道执行过程: 管道命令使用说明: command1正确输出,作为command2的输入,然后command2的输出作为command3的输入,command3的输出打印到屏幕上: 通过管道:command1.command2的正确输出

【Linux探索之旅】第三部分第二课：流、管道、重定向，三管齐下

内容简介 1.第三部分第二课:流.管道.重定向,三管齐下 2.第三部分第三课预告:监视系统活动,滴水不漏流.管道.重定向,三管齐下这一课我们来学一些非常有用的内容,而且相当有意思,而且内容很多,而且有可能颠覆你的三<观>(毕竟三管齐下,不颠覆三观也难). 今天的标题中的三个名称,听上去就怪怪的.什么流,管道,重定向,都啥玩意啊.不过希望学完这课,大家能够有拨云见雾的感觉. 到目前为止,我们已经学习了不少Linux的命令了,也已经比较熟悉命令行的用法了.其最基本用法是这样的: 在终端输入命令

linux入门基础——linux多命令协作：管道及重定向

linux多命令协作:管道及重定向不要重复发明轮子开源文化的核心理念之一就是不要重复发明轮子,很多的开源软件都是现有软件.代码.功能的重新组合,就好像通过零件装配机器一样,源代码的开发和共享让这成为了可能,同时也大大的提供了效率和生产力. 管道和重定向在linux系统中,大多数命令都很简单,很少出现复杂功能的命令,每个命令往往只实现一个或者多个很简单的功能,可以通过将不同功能的命令组合在一起使用,以达到完成某个复杂功能的目的.组合命令的技术是管道和重定向. linux中,几乎所有命令的返回

linux 管道与重定向

命令行shell数据流有如下定义: 通过管道和重定向可以控制CLI的数据流