shell中字符串的截取方法、cut基本用法

一、八种基本字符截取方法:

1、使用 # 号操作符。从左边删除第一次出现 substr 左边字符(包括substr ),保留右边字符。

用法为 #*substr

例如:

即删除从左边开始到第一个"//"及其左边所有字符

2、使用 ## 号操作符。从左边删除最后一次出现substr 左边字符(包括substr ),保留右边字符。

用法为 ##*subst

例如:

即删除最后出现的"/"及其左边所有字符

3、使用 % 号操作符。从右边删除第一次出现 substr 右边字符(包括substr ),保留左边字符。

用法为 %substr

例如:

即删除从右边开始到第一个"/"及其右边所有字符

4、使用 %% 号操作符。从右边删除最后一次出现 substr 右边字符(包括substr ),保留左边字符。

用法为 %%substr*

例如:

即删除从右边开始到最后一个"/"及其右边所有字符

5、从左边第几个字符开始以及字符的个数

用法为 :start:len

例如:

即 0 表示左边第一个字符开始,5 表示字符的总个数。

6、从左边第几个字符开始一直到结束

用法为 :start

例如:

即 7 表示左边第8个字符开始

7、从右边第几个字符开始以及字符的个数

用法为 :0-start:len

例如:

即 0-10 表示右边算起第10个字符开始,6 表示字符的个数。

8、从右边第几个字符开始一直到结束

用法为 :0-start

例如:

即 0-4 表示右边算起第4个字符开始。

二、使用 cut 进行字符串截取

cut 命令接受三个定位方法:

1、字节(bytes),用选项-b;

2、字符(characters),用选项-c;

3、域(fields),用选项-f。

三、字节 -b 的使用

(1) 以“字节”定位

例如:

如果我们想提取每一行的第3个字节,就这样:

注:-b后面可以设定要提取哪一个字节,其实-b和3之间没有空格也是可以的,但推荐有空格 :)

(2) 如果“字节”定位中,我想提取第3,第4、第5和第12个字节

-b支持形如3-5的写法,而且多个定位之间用逗号隔开就成了。

例如:

但有一点要 注意,cut命令如果使用了-b选项,那么执行此命令时,cut会先把-b后面所有的定位进行从小到大排序,然后再提取。可不能颠倒定位的顺序哦。

例如:

(3)类似于“3-5”这样的小技巧

例如:

注:-3表示从第一个字节到第三个字节,而3-表示从第三个字节到行尾。可以看到这两种情况下,都包括了第三个字节“e”。如果执行who|cut -b -3,3-,是输出整行,而不会出现连续两个重叠的e的。

四、字符 -c 的使用

例如:

但是,-c 和 -b 怎么没有区别呢? 其实不然,只是因为这个例子举的不好,所以看不出来,who 输出的都是单字节字符,所以用-b和-c没有区别,如果提取中文,区别就出来了。

例如:

如上,用 -c 则会以字符为单位,输出正常;而 -b 只会以字节(8位二进制位)来计算,输出就是乱码。当遇到多字节字符时,可以使用 -n 选项,-n 用于告诉 cut 不要将多字节字符拆开。

例如:

五、域 -f 是怎么回事呢?

(1)为什么会有“域”的提取呢,因为刚才提到的 -b 和 -c 只能在固定格式的文档中提取信息,而对于非固定格式的信息则束手无策,而“域”可以。

比如/etc/passwd文件,它并不像 who 的输出信息那样具有固定格式,而是比较零散的排放。但是,冒号在这个文件的每一行中都起到了非常重要的作用,冒号用来隔开每一个项。

cut命令提供了这样的提取方式,具体的说就是设置“间隔符”,再设置“提取第几个域”,就OK了。

例如(/etc/passwd的前五行内容):

用 -d 设置间隔符为冒号:,然后用 -f 设置要取的是第一个域。

(2)在设定 -f 时,也可以使用 3-5 或者 4- 类似的格式:

(3)如果遇到空格和制表符时,怎么办?

有时候制表符确实很难辨认,有一个方法可以看出一段空格到底是由若干个空格组成的还是由一个制表符组成的。

如果是制表符(TAB),那么会显示为 \t 符号,如果是空格,就会原样显示。通过此方法就可以判断制表符和空格了。

应该在cut -d中用什么符号来设定制表符或空格呢?其实,cut 的 -d 选项的默认间隔符就是制表符\t,所以当你就是要使用制表符的时候,完全就可以省略-d选项,而直接用-f来取域就可以了。

例如:

时间: 2024-10-25 00:14:01

shell中字符串的截取方法、cut基本用法的相关文章

Shell中字符串的截取方法

这篇文章主要介绍了Shell脚本8种字符串截取方法总结,每个方法给出了实例代码和操作结果,一目了然,需要的朋友可以参考下 Linux 的字符串截取很有用.有八种方法. 假设有变量 var=http://www.aaa.com/123.htm. 1. # 号截取,删除左边字符,保留右边字符. 代码如下: echo ${var#*//} 其中 var 是变量名,# 号是运算符,*// 表示从左边开始删除第一个 // 号及左边的所有字符 即删除 http:// 结果是 :www.aaa.com/123

shell中字符串的截取

shell中字符串的截取介绍9种,以 var=http://www.google.com/test/.html为例 (1)方法一:# 号截取,删除左边字符,保留右边字符. echo ${var#*//} var 是变量名,# 号是运算符,*// 表示从左边开始删除第一个 // 号及左边的所有字符, (*: 匹配0个或多个任意字符) 即删除http:// 结果是 :www.google.com/test.html (2)方法二:## 号截取,删除左边字符,保留右边字符. echo ${var##*

字符串的截取方法

linux系统中字符串的截取方法有很多种,可以用正则表达式结合cut awk等实现,也可以用shell或者python字符串的特性实现,本文主要介绍shell 及python字符串的特性是如何实现的 一.shell 字符串截取的方式 ${expression}一共有9种使用方法.${parameter:-word}${parameter:=word}${parameter:?word}${parameter:+word} 上面4种可以用来进行缺省值的替换,替换方式如下: ${parameter:

shell编程中的字符串的截取方法

shell编程中的字符串的截取方法: 一.Gnu Linux shell 截取字符变量的前8位,有方法如下: 1.expr substr "$a" 1 8 2.echo $a|awk '{print substr(,1,8)}' 3.echo $a|cut -c1-8 4.echo $ 5.expr $a : '\(.\\).*' 6.echo $a|dd bs=1 count=8 2>/dev/null 二.按指定的字符串截取 1.第一种方法: ${varible##*stri

java中常用的字符串的截取方法

java中常用的字符串的截取方法   1.length() 字符串的长度 例:char chars[]={'a','b'.'c'}; String s=new String(chars); int len=s.length(); 2.charAt() 截取一个字符 例:char ch; ch="abc".charAt(1); 返回'b' 3.getChars() 截取多个字符 void getChars(int sourceStart,int sourceEnd,char target

Shell中字符串、数值的比较

原文:http://apps.hi.baidu.com/share/detail/31263915 在shell中字符串与数值的比较方法是不同的,要注意区分 整数比较:    -eq       等于,如:if [ "$a" -eq "$b" ]    -ne       不等于,如:if [ "$a" -ne "$b" ]    -gt       大于,如:if [ "$a" -gt "$b&

SHELL中创建临时文件的方法

有时候,我们需要创建文件临时存放一些输出的信息,创建文件时就可能出现文件名存在的问题.如何创建唯一的文件名,Linux为我们提供几个方案: 1.mktemp(强烈推荐) The  mktemp  utility takes the given filename template and overwrites a portion of it to create a unique filename.  The template  may  be  any filename  with  some  

shell中&&和||的使用方法

&&运算符: command1  && command2 &&左边的命令(命令1)返回真(即返回0,成功被执行)后,&&右边的命令(命令2)才能够被执行:换句话说,"如果这个命令执行成功&&那么执行这个命令". 语法格式如下: command1 && command2 [&& command3 ...] 1 命令之间使用 && 连接,实现逻辑与的功能. 2 只

java中字符串切割的方法总结

StringTokenizer最快 ,基本已经不用了,除非在某些需要效率的场合.Scanner最慢. String和Pattern速度差不多.Pattern稍快些. String和Pattern的split 方法效率相当,常用 public   static   void  main(String [] args){ long  start = System.currentTimeMillis(); for ( int  i= 0 ;i< 100000 ;i++){ test1(); } lon