grep manual

名称
    grep - 打印匹配的行
语法:

    grep [option] pattern [file...]
    grep [option] [-e pattern] | -f file [file]

简介
    grep 就是从文件或者标准输入中搜索你给的样式,默认把匹配到的行打印下来。
    除grep外,还有其他两个程序可以用,egrep和fgrep。egrep等同于grep -E,frep等同于grep -F。直接使用egrep和fgrep的方法被丢弃了,提供这两个命令时是为了和历史版本相兼容。

选项(option)

        --help  输出帮助信息
        -V ,--version  打印grep 的版本号

选择匹配类型:(Macher Selection)

        -E ,--extended-regexp ,   模式是一个扩展正则表达式
        -F ,--fixed-strings      ,        模式是一个由断行符分隔的定长字符串
        -G,--basic-regexp ,             模式是基本正则表达式,默认就是这
        -P,--perl-regexp ,               模式是perl正则表达式

匹配控制:

        -e pattern ,--regexp=pattern ,    使用pattern作为匹配操作。指定多次匹配操作
        -f  file,--file=file             从文件中获得匹配模式
        -i ,--ignore-case                 在输入的文件和匹配模式中都忽略大小写,
        -v,--invert-match                 打印不匹配的行
        -w,--word-regexp ,               强制匹配仅完全匹配单词,  单词必须和匹配内容一样才打印
        -x,--line-regexp ,              强制模式匹配一行,文件里面行的内容必须和匹配模式一样才打印
[object Object]

[object Object]
[object Object]
[object Object]

一般输出控制:

        -c,--count ,       不输出匹配的内容,仅仅打印匹配到的行数,和-v一块使用,就是打印没匹配的行数        
        --color[= WEHN],    带颜色在终端打印匹配的内容,颜色通过环境变量GREP_COLORS定义, WEHN可以是never,auto,和always        
        -L,--files-without-match          只显示不匹配的文件名        
        -l,--files-with-match            只显示匹配的文件名        
        -o ,--only-matching              打印仅仅匹配到的部分。       
        -q ,--quiet,--silent             安静模式,不输出任何内容,如果有匹配内容,退出状态码为0,       
        -s ,--no-messages                不输出错误信息。
        更好的的做法是不使用-q和-s,而是重定向到/dev/null 中

 

输出行前缀控制:

        -b,--byte-offset      在输出的每一行之前显示包含字符串的行的文件中的字节偏移量,在这里是行偏移量
        -H,--with-filename   打印每次匹配到的文件名,这是默认选项当很多文件要匹配时
        -h ,--nofilename ,    当只有一个文件匹配时,不打印文件名,这是默认选项。
        -n,--line-number  , 打印匹配到的行号

输出上下文的行控制

        -A num ,--after-context=NUM      打印匹配到行的后面NUM行,多次模式匹配中间以 -- 分隔
        -B num ,--before-context=NUM     打印匹配的行之前的NUM行放一个行包含一个组分隔符 (--)在接下来的匹配组中。如果指定了-o选项,这个选项就没有一样了,同时会给一个警告
        -C NUM,--context=NUM,            打印匹配行的上下NUM行

文件和目录选择:

        -a,--text                     加工二进制文件当成文本文件处理。这个选项等同于--binary-files=text
        --binary-files=TYPE 
        -D ACTION ,--device=ACTION    如果输入文件是一个设备文件,FIFO,或者套接字文件,使用ACTION处理它,默认的ACTION是读,也就是说设备文件当成一般文件看待,如果ACTION是skip,设备文件会被跳过。
        -d ACTION,--directores=ACTION 如果输入文件是一个目录 ,使用ACTION去处理这个目录,默认的ACTION是读,也就是把目录当成一般文件来读。如果ACTION是skip,目录会被跳过, 如果ACTION是recurse,grep会递归的读取所有的文件在每一个目录下面
        --exclude=GLOB               跳过文件匹配GLOB,文件名GLOB可以是*,?,和[..] ,也可以是\ 去引用一个通配符或者反斜杠字符
        --exclude-from=FILE          跳过文件谁的名字匹配任何文件名GLOB的,从FILE中读取GLOB的。和--exclude差不多
        --exclude-dir=DIR            排除目录匹配这样式DIR从递归查询中
        -I                           处理二进制文件,把二进制文件当做什么都没有,直接跳过
        --inlclude=GLOB              仅仅搜寻匹配GLOB的文件
        -R,-r,--recursive           读取所有在目录下面的文件,这等价于-d recurse 选项

其它选项:

        --line-buffered 使用行的缓存在输出上,这个可能导致性能损失
        --mmap 如果可能的话,使用mmap系统调用去读取输入,而不是read系统调用。这某些情况下,--mmap导致更好的性能。然而--mmap可能导致无法定义的行为,当一个文件shrinks当grep在操作的时候,或者IO错误发生
        -U 把文件当成二进制文件来看,默认情况下,在DOS和windows操作系统下面,grep猜一个文件的类型通过查看文件的前32kB的内容。如果文件是文本,他去掉CR字符从原始文件。这个选项在其它平台上没有什么作用
        -z ,--null-data 把输入当做很多行,每一个终止通过一个NULL字节代替一个新航,就像-Z或者--null选项,这个选项就像sort -z 去加工随机文件名

正则表达式

正则表达式是一个模式描述一套字符串。正则表达式就像数学表达式差不多,使用不同的操作符构成一个小的表达式 . 正则表达式几乎匹配了所有的字符,数字和正则自己。一些特殊的元字符可以通过在前面加一个反斜杠实现引用。

grep理解三种不同版本的正则表达式语法:basic,extended和perl的。

字符类和括号类表达式:

        . 匹配任何单个字符       [...]   匹配括号列表里面的单个字符在[]内表示范围,可以在两个字符之间加一个 - 代表范围。 匹配任何单字符在两个字符之间。默认的 [a-d]匹配[abcd] ,不过也可能匹配[aBbCcDd] ,为了获得默认的括号表达式类型,你需要设置这LC_ALL环境变量。
            为了匹配一些特殊字符:
                 ] : 把它放在列表首部,  []abcd]  
                ^  :可以放在任何位置除了首部 [abc^d]
                -  :放在最后的位置   [abcd-]
                
[object Object]

另外有几个预定义的括号表达式

            [:alnum:]:表示数字与大小写字母[0-9a-zA-Z]
            [:alpha:]:表示大小写字母[a-zA-Z]
            [:cntr:]: 表示控制按键,Ctrl、Tab...
            [:digit:]:表示数字
            [:graph:]:表示除了空白键与Tab键外的所有按键
            [:lower:]:代表小写字母
            [:print:]:代表任何可以被打印出来的字节
            [:punct:]:代表标点符号
            [:space:]:代给空白键
            [:upper:]:代表大写字母
            [:xdigit:]:代表十六进制的数字类型

锚定符

        ^:匹配行首        $:匹配行尾        \< 和 \> 匹配一个字符串的开始和结束 ,也就是牟定单词。
        \b 相当于\<或\>
        \B  不牟定,类似于\b取反
        \w 等价于 [:alnum:]  
        \W 等价于 [^[:alnum:]]

重复:

        正则表达式可能重复几次撇皮
        ? 前面的字符是可选的和只匹配一次
        * 前面的字符可以匹配0此或者更多次
        + 前面的字符至少匹配一次,可以匹配更多次
        {n} 前面的字符精确匹配 n 此
        {n,}前面的字符匹配n此以上
        {,m}前面的字符至多匹配m次
        \(\):向后引用,引用:\1, \2, \3

基本正则和扩展正则:

        基本正则之间,元字符,?,+,{,|,(,}和)都丢失了他们特殊的意义,应该使用\?,\+,\{,\(,和、)  
        传统egrep不支持{  元字符,一些egrep实现了支持 \{  ,一些脚本应该避免 {   在grep -E 中应该使用 [{] 去匹配"{"

环境变量:grep的行为被一些环境变量影响。自己man吧。

总结:博文到这里结束吧。这篇博文,写的不好,需要时间来不断完善其中的实例。

为什么不好?

1、这种grep例子,都是老生常谈,没有一点点新意,尽管我花了好久时间,时间长不能代表做的好。

2、grep就只是一个命令,我去看manual手册,一直在那翻译,当然翻译的不够好,翻译时好多句式不明白,明白单词的意思,不一定能够明白句子的意思。难道还要看源代码,才能明白其中的原理吗?目前会用就行了吧。

3、在这个平台上面写的第一篇博文,弄个图片好久没弄出来,最后我又撤销了几张图片,都不知道为什么。

下次写博客注意的地方?

1、不要照着manual手册翻译过来,那样是个人都会翻译,而是把自己对manual的理解,与整理之后贴出来,有自己的见解。

2、还要再熟悉熟悉博客平台,才能用好。

时间: 2024-10-09 04:07:13

grep manual的相关文章

安装生物信息学软件-MetaPhlAn2

---恢复内容开始--- 上周20161021-20161028的任务还没有搞完,所以今天来填坑(微笑脸) ××××××××××××××××××××我是萌萌哒分割线××××××××××××××××××××××××××××××× 本文参考:https://bitbucket.org/biobakery/biobakery/wiki/metaphlan2 MetaPhlAn2是使用宏基因组鸟枪法测序数据描绘微生物群落组成的工具. ps: 与系统发育相关的图的表示 安装: 1. 下载并解压 2. 修改

12.26&amp;12.27 -正则表达式

12.26&12.27 正则表达式 第1章 使grep/egrep 过滤出的东西加上颜色 cat >>/etc/profile<<EOF alias grep='grep --color=auto' alias egrep='egrep --color=auto' EOF source /etc/profile alias grep egrep 第2章 正则表达式分类 2.1 基础正则表达式:basic    regular expression  BRE  ^  $  .

Linux下文本搜索工具grep命令使用入门

grep命令入门 如果想通过使用grep命令来实现理想化的文本搜索,对正则表达式的了解是比不可少的.文献1对正则表达式语法做了一个简单的介绍,文献2提供了一个简单的入门.码农也可以自己google一下其他的参考资料.下面就grep命令的使用做个入门级的介绍. 1.1 grep命令的变种 linux下除了grep命令可以完成文本搜索外,还存在egrep,fgrep,rgrep三个命令.这三个命令都是由grep加上一些控制参数演变而来,如egrep=grep -E, fgrep=grep -F, r

使用awk和grep做简单的统计

假如某个广告点击数据记录在文件里面,文件中每一行数据由‘时间’,‘uid’两个字段组成,要求每分钟统计某个uid带来的点击量并计入数据库,可以用shell来实现该功能. #!/bin/bash#广告点击统计,统计前一分钟的点击数stat_time=`date -d "- minutes ago" +"%Y-%m-%d %k:%M"`log_date=`date -d "$stat_time" +%Y-%m-%d`;log_month=`date

[ERROR] Fatal error: Please read &quot;Security&quot; section of the manual to find out how to run mysqld as root!

测试mysqld启动mysql server的时候,报如下错误: 2015-12-17 00:46:02 10785 [ERROR] Fatal error: Please read "Security" section of the manual to find out how to run mysqld as root! 2015-12-17 00:46:02 10785 [ERROR] Aborting 2015-12-17 00:46:02 10785 [Note] Binlo

grep线上环境精典案例后续

请执行命令取出 linux 中 eth0 的 IP 地址(请用 cut,有能力者也可分别用 awk,sed 命令答). 自己的方法: [[email protected]_back ~]# ifconfig eth0 eth0      Link encap:Ethernet  HWaddr 00:0C:29:21:B6:B1 inet addr:192.168.0.131  Bcast:192.168.0.255  Mask:255.255.255.0 inet6 addr: fe80::20

The best manual of how to use &quot;The easiest Xdebug&quot; addon for Firefox

Installation notes 0. Install the best Firefox add-on for remote debugging The easiest Xdebug. I'm not lying. 1. Install the xdebug extension from PECL or from a repo or download sources to compile it manually: git clone git://github.com/derickr/xdeb

Falcon Genome Assembly Tool Kit Manual

Falcon Falcon: a set of tools for fast aligning long reads for consensus and assembly The Falcon tool kit is a set of simple code collection which I use for studying efficient assembly algorithm for haploid and diploid genomes. It has some back-end c

Percona XtraBackup User Manual 阅读笔记

XtraBackup XtraBackup.. 1 2 安装XtraBackup.. 1 2.1 安装XtraBackup binary版本... 1 2.1.1 yum的安装方法:... 1 2.1.2 直接下载rpm包安装... 1 3 XtraBackup使用手册... 1 3.1 使用innobackupex脚本... 1 3.1.1 备份预备工作... 1 3.1.2 全备和全备还原... 1 3.1.2.1 使用innobackupex创建全备... 1 3.1.2.2 使用inno