关于sed中的Pattern Space和Hold Space的随笔

首先是一部分概念和示例,这部分转自:http://coolshell.cn/articles/9104.html
Pattern Space
第零个是关于-n参数的,大家也许没看懂,没关系,我们来看一下sed处理文本的伪代码,并了解一下Pattern Space的概念:
  1. foreach line in file {
  2. //放入把行Pattern_Space
  3. Pattern_Space <= line;
  4. // 对每个pattern space执行sed命令
  5. Pattern_Space <= EXEC(sed_cmd, Pattern_Space);
  6. // 如果没有指定 -n 则输出处理后的Pattern_Space
  7. if (sed option hasn‘t "-n") {
  8.   print Pattern_Space
  9. }
  10. }
Address
第一个是关于address,几乎上述所有的命令都是这样的(注:其中的!表示匹配成功后是否执行命令) 
[address[,address]][!]{cmd} 
address可以是一个数字,也可以是一个模式,你可以通过逗号要分隔两个address 表示两个address的区间,参执行命令cmd,伪代码如下:
  1. bool bexec = false
  2. foreach line in file {
  3. if ( match(address1) ){
  4. bexec = true;
  5. }
  6. if ( bexec == true) {
  7. EXEC(sed_cmd);
  8. }
  9. if ( match (address2) ) {
  10. bexec = false;
  11. }
  12. }

关于address可以使用相对位置,如:

  1. # 其中的+3表示后面连续3行
  2. $ sed ‘/dog/,+3s/^/# /g‘ pets.txt
  3. This is my cat
  4. my cat‘s name is betty
  5. # This is my dog
  6. # my dog‘s name is frank
  7. # This is my fish
  8. # my fish‘s name is george
  9. This is my goat
  10. my goat‘s name is adam
命令打包
cmd可以是多个,它们可以用分号分开,可以用大括号括起来作为嵌套命令。下面是几个例子:
  1. $ cat pets.txt
  2. This is my cat
  3. my cat‘s name is betty
  4. This is my dog
  5. my dog‘s name is frank
  6. This is my fish
  7. my fish‘s name is george
  8. This is my goat
  9. my goat‘s name is adam
  10. # 对3行到第6行,执行命令/This/d
  11. $ sed ‘3,6 {/This/d}‘ pets.txt
  12. This is my cat
  13. my cat‘s name is betty
  14. my dog‘s name is frank
  15. my fish‘s name is george
  16. This is my goat
  17. my goat‘s name is adam
  18. # 对3行到第6行,匹配/This/成功后,再匹配/fish/,成功后执行d命令
  19. $ sed ‘3,6 {/This/{/fish/d}}‘ pets.txt
  20. This is my cat
  21. my cat‘s name is betty
  22. This is my dog
  23. my dog‘s name is frank
  24. my fish‘s name is george
  25. This is my goat
  26. my goat‘s name is adam
  27. # 从第一行到最后一行,如果匹配到This,则删除之;如果前面有空格,则去除空格
  28. $ sed ‘1,${/This/d;s/^ *//g}‘ pets.txt
  29. my cat‘s name is betty
  30. my dog‘s name is frank
  31. my fish‘s name is george
  32. my goat‘s name is adam
Hold Space
接下来,我们需要了解一下Hold Space的概念,我们先来看四个命令:

g: 将hold space中的内容拷贝到pattern space中,原来pattern space里的内容清除 
G: 将hold space中的内容append到pattern space\n后 
h: 将pattern space中的内容拷贝到hold space中,原来的hold space里的内容被清除 
H: 将pattern space中的内容append到hold space\n后 
x: 交换pattern space和hold space的内容

这些命令有什么用?我们来看两个示例吧,用到的示例文件是:

  1. $ cat t.txt
  2. one
  3. two
  4. three

第一个示例:

  1. $ sed ‘H;g‘ t.txt
  2. one
  3. one
  4. two
  5. one
  6. two
  7. three

是不是有点没看懂,我作个图你就看懂了。 

第二个示例,反序了一个文件的行:

  1. $ sed ‘1!G;h;$!d‘ t.txt
  2. three
  3. two
  4. one

其中的 ‘1!G;h;$!d’ 可拆解为三个命令

1!G —— 只有第一行不执行G命令,将hold space中的内容append回到pattern space 
h —— 第一行都执行h命令,将pattern space中的内容拷贝到hold space中 
$!d —— 除了最后一行不执行d命令,其它行都执行d命令,删除当前行 
如图: 

附上自己的一点理解:sed有P区(Pattern space)和H区(Hold space),每读取一行就会把内容放入P区,这时如果我们想对之前对内容做些操作,就需要用到H区用于暂存一些数据。

拿上面最后一个图来说,读取第一行,读取one到P区,然后h命令放到H区;

后面依次读取到P区,然后追加到H区,删除P区是为了不输出内容;

读到最后一行,把数据追加到H区,然后用H区的内容替换掉P区,最后输出P区的内容。

时间: 2024-10-28 23:21:19

关于sed中的Pattern Space和Hold Space的随笔的相关文章

sed - pattern space, hold space

最近看 linux 的 sed 命令,讲有到 pattern space .hold space ,编辑命令 h, x, G 有点难以理解,研究了下得出下面的东西: sed 有两种缓冲区: 通常说的 sed 将输入文件复制到缓冲区,对缓冲区中的副本处理后,将其输出,这个缓冲区叫: Pattern Buffer ( pattern space ); 还有一个就是 Hold Buffer ( hold space ). 在例子之前先看看 sed 是如何工作的, How sed Works sed m

sed修炼系列(四):sed中的疑难杂症

本文目录:1 sed中使用变量和变量替换的问题2 反向引用失效问题3 "-i"选项的文件保存问题4 贪婪匹配问题5 sed命令"a"和"N"的纠葛 1.sed中使用变量和变量替换的问题 在脚本中使用sed的时候,很可能需要在sed中引用shell变量,甚至想在sed命令行中使用变量替换.也许很多人都遇到过这个问题,但引号却死活调试不出正确的位置.其实这不是sed的问题,而是shell的特性.搞懂sed如何解决引号的问题,对理解shell引号问题有

sed中变量的使用方法

一般在sed 中替换都用单引号,如下边sed -in-place 's/8080/8001/g' /home/work/server.xml但是如果需要把8001改成变量,如sed -in-place 's/8080/$port/g' /home/work/server.xml这样就不成功.此时需要把单引号改成双引号,如下边例子$port=8001sed -in-place "s/8080/$port/g" /home/work/server.xml

sed中引入shell变量

sed中引入shell变量的四种方法1.eval sed 's/$a/$b/' filename2.sed "s/$a/$b/" filename3.sed 's/'$a'/'$b'/' filename 4.sed s/$a/$b/ filename

linux在二进制文件中查找pattern的offset

参考:http://stackoverflow.com/questions/14141008/grep-offset-of-ascii-string-from-binary-file strings -a -t x filename | grep foobar linux在二进制文件中查找pattern的offset

sed中的N,P,D

N 把匹配的行写入保持空间,可个觉得可以理解为把匹配到的行写入一个新的文件中,这样会比较好理解,行与行之前用以用.*匹配到"\n",或者是直接用"\n"直接      进行匹配,平时在模式空间(可能理解为你要处理的文字,如你是一个file里面的文字),".* "是不能匹配到"\n"的 P 大写p,把模式空间中匹配到的行写入到保持空间,但只输出匹配到的行或者是部分,即成功匹配到两行,但只输出第一行 D 道理跟P相似,把匹配到的,

sed中的多行匹配

sed中的多行匹配,可以用N,N的意思是把下一行写入保持空间,保持空间可能不好理解,可以理解为机器的内存一样,把一下行也写入内存,可能会好理解多了,当把一下行也写入保持空间的时间,转行符"\n",也可以用.*匹配到了,前几天在帮开发做全局替换,在一对php标签中,替换里面的两行内容,其他有两个字段组合起来就是整个页面都是唯一的 <?php $_web = str_replace(array('s-','www.'),'',$_web);\$_webcontents = file_

java heap space, PermGen space 错误 使用jvisualvm监测设置合理值

使用myeclipse启动tomcat 报java heap space ,PermGen space 错误,分别为 heap内存不足,PermGen内存不足需加大 tomcat启动项参数 Xmx 和 XX:MaxPermSizePermGen是指内存的永久保存区域,它用于存放class和 method 对象,以及String 对象(sun原文:permanent generation is the area of the heap where class and method objects

[转]JVM内存区域划分Eden Space、Survivor Space、Tenured Gen,Perm Gen解释

jvm区域总体分两类,heap区和非heap区.heap区又分:Eden Space(伊甸园).Survivor Space(幸存者区).Tenured Gen(老年代-养老区). 非heap区又分:Code Cache(代码缓存区).Perm Gen(永久代).Jvm Stack(Java虚拟机栈).Local Method Statck(本地方法栈). HotSpot虚拟机GC算法采用分代收集算法: 1.一个人(对象)出来(new 出来)后会在Eden Space(伊甸园)无忧无虑的生活,直