文本处理三剑客 (regular expression:正则表达式)
grep是一款文本过滤工具,基于正则表达式进行模式匹配
sed:stream editor 流编辑器
awk:linux上实现为gawk,文本报告生成器(格式化文本)
文本搜索工具,根据用户指定的模式,对目标文本逐行进行匹配检查,打印匹配到的行基于Perl的正则表达式
使用格式:grep [选项] 匹配模式 file对象
选项说明:
–color=auto:对匹配到的文本着色,高亮显示
-i:忽略字符大小写
-o:仅显示匹配到的字符串本身
-v:方向匹配,匹配到的文本行不显示,不能匹配到的行显示
-E:表示支持使用扩展的正则表达式,等同于egrep
-q:静默模式,不输出任何信息到标准输出-A(after):显示匹配到的行和其后面的行,给一个数字 grep -A 1 root /etc/passwd
-B(before):显示匹配到的行和其前面的行,给一个数字 grep -B 1 root /etc/passwd
-C(center):显示匹配到的行和其前后的行,给一个数字 grep -C 1 root /etc/passwd
字符匹配:
. :匹配任意单个字符
[ ]:匹配指定范围内的任意单个字符
[^ ]:匹配指定范围外的任意当个字符
[[:digit:]] [[:lower:]] [[:upper:]] [[:alpha:]] [[:alnum:]] [[:punct:]] [[:space:]]
位置锚定:
^:行首锚定,用于模式的最左边$:行尾锚定,用于模式的最右边^pattern$:用于pattern来匹配整行 ^$:空白行^[[:space:]]$:空行或空白字符的行单词:非特殊字符组成的连续字符都称为单词\< 或 \b:词首锚定,用于单词模式的左侧\> 或 \b:词尾锚定,用于单词模式的右侧\<pattern\>:匹配完整单词
匹配次数:
用在要指定其出现的次数的字符的后面,用于限制其前面字符出现的次数,默认为贪婪模式 *:表示匹配其前面的字符任意次,0,1,多次 例如:grep “x*y”.*:匹配任意长度的任意字符\?:匹配其前面的字符0次或一次,即其前面的字符是可有可无的\+:匹配其前面的字符一次或多次,即其前面的字符要出现至少一次\{m\}:精确匹配到其前面字符的m次\{m,n\}:匹配其前面的字符至少m次,至多n次 \{0,n\}:至多n次\{m,\}:至少m次
时间: 2024-10-12 21:05:40