grep--Linux文本处理三剑客之一

Linux文本处理三剑客:grep sed awk

grep: Global search Regular expression and Print out the line.

作用:文本搜索工具,根据用户指定的筛选条件对目标文本进行匹配检查并打印出符合条件的的行

模式:由正则表达式的元字符及文本字符所编写出的过滤条件;

使用:grep [OPTIONS] PATTEN [FILE..]

OPTIONS:

--colour=auto:对匹配到的字符串着色后高亮显示

-i:ignorecase,忽略字符的大小写;

-o:仅显示匹配到的字符串;

-V:匹配到的行不显示,显示不能被匹配的行

-E:支持使用扩展的正则表达式元字符;

-q,--quite,--silent:静默模式,即不输出任何信息;

-A #:after 显示匹配行的后#行

-B #: before 显示匹配行的前#行

-C #: context,显示前后# 行

基本正则表达式元字符

    字符匹配:

.:匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:匹配指定范围外的任意单个字符;

[:diglt:] [:alpha:] [:upper:] [:lower:] [:alnum:] [:punct:] [:space:]

匹配次数:

*:匹配前面字符任意次数,0,1,多次

.*:匹配任意长度的任意字符

\?:匹配其前面字符0次或1次,

\+:匹配其前面字符至少一次;

\{m\}:匹配其前面字符m次

\{m,n\}:匹配其前面字符最少m次,最多n次

\{0,n\}:至多n次

\{m,\}:至少m次

位置锚定:

^:表示以符号后面的字符开头

$:表示以符号前面的字符结尾

\<或\b:词首锚定,用于单词模式的最左侧

\>或\b:词尾锚定,用于单词模式的最右侧

\<PATTEN\>:匹配完整单词PATTEN

分组及应用:

\(\):将一个或多个字符捆绑在一起,当成一个整体进行处理;

注意:分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量中,这些变量为:

\1:模式从左侧起,第一个左括号以及与之匹配的右括号之间的模式所匹配的字符;

\2:模式从左侧起,第二个左括号以及与之匹配的右括号之间的模式所匹配的字符;

\3:...

...

egrep:

支持扩展的正则表达式实现类似于grep文本过滤功能;grep -E

egrep [OPTION] PATTEN [FILE]

选项:

-i,-o,-v,-q,-A,-B,-C

-G:支持基本正则表达式

扩展正则表达式的元字符:

字符匹配:

.:匹配任意单个字符;

[]:匹配指定范围内的任意单个字符;

[^]:匹配指定范围外的任意单个字符;

[:diglt:]、[:alpha:]、[:upper:] [:lower:] [:alnum:] [:punct:] [:space:]

次数匹配:

*:任意次

?:0次或者1次

+:1次或者多次

{m}:m次

{m,n}:至少m次,至多n次

{0,n}、{m,}

位置锚定:

^:表示以符号后面的字符开头

$:表示以符号前面的字符结尾

\<或\b:词首锚定,用于单词模式的最左侧

\>或\b:词尾锚定,用于单词模式的最右侧

\<PATTEN\>:匹配完整单词PATTEN

分组及应用:

():将一个或多个字符捆绑在一起,当成一个整体进行处理;

注意:分组括号中的模式匹配到的内容会被正则表达式引擎自动记录于内部的变量

或者:

a|b:a或者b

C|cat:C或cat

(C|c)at:Cat或cat

时间: 2024-10-24 02:34:36

grep--Linux文本处理三剑客之一的相关文章

linux文本处理三剑客之grep

  一.linux文本处理三剑客介绍 linux中文本三剑客包括grep(egrep,fgrep),sed,awk,三者基本的功能如下: 工具名称 功能 grep,egrep,fgrep 文本过滤工具(搜索工具) sed stream editor, 流编辑器:文本编辑工具 awk 文本报告生成器 二.grep工具详解 1.grep的介绍: grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行

Linux文本处理&quot;三剑客&quot;--grep

稍微接触过linux都会知道有三个非常强大文本处理工具,那就是grep.sed和awk,想必都有听说过吧. Linux文本处理三剑客: grep, egrep, fgrep:文本过滤工具(模式:pattern): grep:基本正则表达式,支持-E,-F egrep:扩展正则表达式, 支持-G,-F fgrep:不支持正则表达式, sed:stream editor, 流编辑器:文本编辑工具: awk:Linux上的实现为gawk,文本报告生成器(格式化文本): 以上三款工具都支持正则表达式 正

Linux文本处理三剑客之grep一族与正则表达式

一,grep一族是什么? Linux上有三种常用的文本处理工具,分别为:grep(egrep.fgrep).sed.awk.这三者被称为Linux文本处理三剑客. grep一族:文本搜索工具 grep:支持使用基本正则表达式: egrep:支持使用扩展正则表达式,相当于grep -E: fgrep:不支持使用正则表达式,相当于grep -F; [PS:fgrep不需要加载正则表达式引擎,因此速度较快,fgrep的搜索效率在当文件达到几亿行时就能体现出来.(大型web网站一天的日志量都是几亿行的,

linux文本处理三剑客—grep

cat:concatenate 文本文件查看工具 cat [option] filename... -n:给显示出来的文本行加上编号 -b:非空行编号 -V:显示 ^ -E:显示行结束符$ -T:显示制表符 -A:显示所有控制符-A=-VET -s:压缩连续的空行成一行 如:cat /etc/fstab /etc/passwd 同时查看多个文件 df | cut -d: tac:文本文件查看工具 用法同cat 只是文件内容的行逆序显示 rec:文本文件查看工具    用法同cat 只是文本文件每

Linux 文本处理三剑客之grep &nbsp; egrep

Linux 文本处理三剑客之grep   egrep grep: Global search REgular expression andPrint out the line. 作用:文本搜索工具,根据用户指定的"模式(pattern)"逐行去搜索目标文本,打印匹配到的行. 模式:由正则表达式的元字符及文本字符所编写的过元字符,其中正则表达示分基本正则表达式,和扩展正则正则表达式2类 元字符不表示其字面意义,而用于表示通配或控制功能滤条件.元字符有下面一些 字符匹配: .:匹配任意单个

linux文本处理三剑客之grep家族及其相应的正则表达式使用详解

一.Linux文本处理三剑客.grep家族和正则表达式介绍 Linux上文本处理三剑客: grep(egrep, fgrep):文本搜索工具:基于"pattern(过滤条件)"对目标文本进行逐行搜索操作: sed:Stream Editor,流编辑器行编辑工具:文本编辑工具: awk:GNU awk,文本格式化工具:文本报告生成器: grep家族: grep: Global search REgular expression and Print out the line,支持使用基本正

linux文本处理三剑客之grep命令详解

Linux文本处理三剑客之grep grep:文本过滤(模式:pattern)工具 grep, egrep, fgrep(不支持正则表达式搜索) sed:stream editor,文本编辑工具 awk:Linux上的实现gawk,文本报告生成器 grep grep: Global search REgularexpression and Print out the line 作用:文本搜索工具,根据用户指定的"模式"对目标文本逐行进行匹配检查:打印匹配到的行 模式:由正则表达式字符及

linux文本处理三剑客之一:grep

linux文本处理三剑客之一:grep grep:文本过滤(模式:pattrn)工具 grep,egrep, fgrep(不支持正则表达式搜索) sed:stream edittor 文本编辑工具 awk:linux上的实现gawk,文本报告生成器 1. grep grep :Global search REguar expression and Print out the line 作用:文本搜索工具,根据用户指定的"模式"对目标文本逐行进行匹配检查:打印匹配到的行 模式:有正则表达

Linux 文本处理三剑客之grep

文本处理都要使用正则表达式,正则表达式有: 基本正则表达式:grep或者egrep -G 扩展正则表达式:egreo或者grep -E Linux 文本处理三剑客: sed:stream editor,流编辑工具程序. awk:linux上是gawk,格式化文本工具程序. grep:Global search Regular expression and print out the line 使用基本正则表达式的命令: grep egrep -G fgrep -G 使用扩展正则表达式的命令: g

Linux文本处理“三剑客”之sed

sed(Stream Editor)是一个行编辑工具.下面我们介绍 sed 的实现原理和基本使用方法. 一.sed 的处理文本的流程 基本处理流程如下: 处理流程是:每次读入文本文件的一行到内存中的模式空间中,在模式空间中处理后将处理的结果输出,默认会打印到屏幕上.因此,默认情况下,不会改变原文件的内容. 二.sed 命令的使用 基本语法:sed [options]... '地址定位 编辑命令' FILE... 地址定位的方法: 1.行定位: start_line[,end_line] 2.模式