20150827-Linux grep文本过滤工具及正则表达式

待完善。。。。。

grep:

Linux文本处理三剑客:

grep: 文本过滤工具;

sed:文本编辑器(行);stream editor

awk:文本报告生成器;Linux上awk的实现为gawk

grep: Global search REgular expression and Print out the line.

作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;

模式:由正则表达式的元字符及文本字符所编写的过滤条件;

元字符:字符不表示其字面意义,而用于表示通配或控制功能;

分两类:

基本正则表达式:BRE

扩展正则表达式:ERE

正则表达式引擎;

grep [OPTIONS] PATTERN [FILE...]:

选项:

--color=auto:对匹配到的串做高亮显示;

-v:显示模式匹配不到行;

-i: 忽略字符大小写;

-o: 仅显示能够被模式匹配到的串本行;

-q: 静默模式;

-E:使用扩展的正则表达式;

基本正则表达式的元字符:

字符匹配:

.: 匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:匹配指定范围内的任意单个字符;

[:lower:], [:upper:], ...

次数匹配:用于要指定其次数的字符的后面;

*: 任意次;

abxy

xay

xxxxxxxy

grep "x*y"

\?:0或1次;

grep "x\?y"

\+:1或多次;

\{m\}:精确限制为m次;

\{m,n\}: 至少m次,至多n次,[m,n]

\{0,n\}:至多n次;

\{m,\}:至少m次;

.*: 匹配任意长度的任意字符;

位置锚定:

^: 行首锚定;用于模式的最左侧;

$: 行尾锚定;用于模式的最右侧;

\<, \b: 词首锚定;用于表示单词的模式的左侧;

\>, \b:词尾锚定;用于表示单词的模式的右侧;

^$: 空白行;

分组:\(\)

分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...

\1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;

\2:

...

后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

练习:

1、显示/etc/passwd文件中以bash结尾的行;

2、显示/etc/passwd文件中的两位数或三位数;

3、显示‘netstat -tan‘命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;

4、添加用户bash,testbash, basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;

扩展的正则表达式:

grep家庭有三个命令:

grep:基本正则表达式

-E: 扩展正则表达式

-F:不支持正则表达式

egrep:扩展正则表达式

fgrep:不支持正则表达式

扩展正则表达式的元字符:

字符匹配:

.: 任意单个字符

[]:

[^]:

次数匹配:

*

?: 0次或1次;

+: 1次以上;

{m}: 精确匹配m次;

{m,n}: 至少m次,至多n次;

锚定:

^: 锚定行首

$: 锚定行尾

\<, \b

\>, \b

分组:()

后向引用:\1, \2, ...

或者:

a|b

C|cat: 不表示Cat或cat,而表示C或cat;

要写成(C|c)at

练习:

1、显示当前系统上root、centos或user1用户的默认的shell和UID;

2、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;

3、使用echo输出一个路径,而后egrep找出其路径基名;

进一步地:使用egrep取出其目录名;

4、找出ifconfig命令执行结果中1-255之间的数字;

grep命令的使用;

[[:space:]]\{1,\}

时间: 2024-10-10 11:15:20

20150827-Linux grep文本过滤工具及正则表达式的相关文章

Linux grep 命令中的正则表达式详解

在 Linux .类 Unix 系统中我该如何使用 Grep 命令的正则表达式呢? Linux 附带有 GNU grep 命令工具,它支持扩展正则表达式(extended regular expressions),而且 GNU grep 在所有的 Linux 系统中都是默认有的.Grep 命令被用于搜索定位存储在您服务器或工作站上的任何信息. 正则表达式 正则表达式就是用于匹配每行输入的一种模式,模式是指一串字符序列.下面是范例: ^w1 w1|w2 [^ ] grep 正则表达式示例 在 /e

Linux grep命令用法以及正则表达式

1.grep命令和正则表达式的简介 (1).grep(Global search REgular expression and Print out the line),即全局搜索正则表达式并打印出匹配的行,它是Linux系统中一个强大的文本搜索工具,它根据用户指定的"模式(pattern)"对目标文本进行过滤,显示被模式匹配到的行: (2).正则表达式是由一类字符书写的模式,其中有些字符不表示符的字面意义,而是表示控制或通配的功能 2.grep命令的基本语法格式 grep [OPTIO

linux文本处理工具及正则表达式

cat命令:查看文本内容 cat [选项]... [文件]... -E    显示行结束符 -n    显示文本内容时显示行号 -A    显示所以控制符 -b    非空行编号 -s     压缩连续的空行成一行 [[email protected] ~]# cat -n /etc/issue > test.txt ##查看文件内容并显示行号,重定向到test.txt文件中 [[email protected] ~]# cat test.txt 1 \S 2 Kernel \r on an \

关于Linux,用户,组,权限,文本处理工具,正则表达式,vim文本编辑器

一. 用户 ??在Linux系统中,可以创建多个用户,每一个用户都有一个与其对应的ID号,就像每一个人都有一个×××号一样,这就是用户的UID,??在Linux中管理员 root的默认UID为0,普通用户为1-65535,而普通用户又分为系统用户和登录用户,系统用户是不可登录的,对守护进程获取资源进行权限分配使用,其默认UID是1-499(在centos7中是1-1000),普通用户的UID为500-65535(centos7中为1000-65535) ?1. 用户及其属性信息 ??/etc/p

关于 文本处理工具、正则表达式、grep 的简单举例

文本处理工具 抽取文本的工具 文件内容:less和cat 文件截取:head和tail 按列抽取:cut 按关键字抽取:grep 文件查看命令:cat,tac,rev cat [选项] [file] cat -n     对显示出的每一行进行编号 cat -b     非空行编号 cat -ns    连续压缩空行成一行 cat -v     显示回车符 cat -E     显示行结束符$ cat -A     显示所有控制符 tac file   反向显示内容 rev file   反向显示

Linux文本处理工具之grep

文本处理三剑客之GREP 文本过滤工具:glob 用于实现bash中的文件名通配 通配符: *:任意长度的任意字符 ?:任意单个字符 [ ]:明确指明匹配范围内的单个字符 [abc]:abc中的任意一个 注:要匹配通配符本身,需要使用%转义 常用的字符集合表示法: [:alpha:]:任意字母 [:alnum:]:任意数字和字母 [:blank:]:任意空白字符 [:cntrl:]:任意控制字符 [:digit:]:任意数字 [:lower:]:任意小写字母 [:upper:]:任意大写字母 [

linux文本处理工具

linux文本处理工具 1.Linux 文件系统上的特殊权限: SUID     SGID   Sticky 进程的安全上下文:(1)任何一个可执行程序文件能不能启动为进程,取决发起者对程序文件是否拥有执行去权限 (2)启动为进程后,其属主为发起者,属组为发起者所属的组 (3)进程访文件的权限,取决于进程的发起者 (a)  进程的发起者,同文件的属主:则应用文件属主权限                                            (b)  进程的发起者,属于文件属组:则

linux中的逻辑运算和正则表达式

1.与.或.非.异或 && 与:当两边同为真的时候,结果为真 || 或:当两边都为假的时候,结果为假. ! 非:取反 ^ 异或:当左右都相同的时候,结果为假:当左右不相同的时候,结果为真 2.短路运算:在特殊情况下只运算逻辑运算符即可出结果,即可停止运算 &&:当左边为假的时候,结果必然为假.在shell中,只运行左边命令,不运行右边的命令 ||:当左边为真的时候,结果必然为真.在shell中,只运行左边命令,不运行右边命令 eg:ls /etc && ec

linux grep学习整理

第一部分:补充 umask  遮罩码 目录权限为777-umask 用户为 666-umask       如果某一类用户的权限有执行权限,会自动加1 管理员的遮罩码为0022     普通用户的为0002 第二部分:文本处理工具 1.定义: Linux文件三个本地处理工具 A:grep 文本过滤工具 ,搜索工具 B:sed文件编辑工具 C:awk文本报告生成器 Grep :Global research regular expression and printing简写 根据用户指定的模式(p