Linux, Mac下Shell 数组 Array 的修理工

我的测试基本都是在Mac,及Unix环境下测试的,如无特别注明,默认就是Mac

不论你看到这篇随笔是被shell array的奇淫巧技,还是发现shell array就在一对{}里面就可以做那么多勾当,然而记不清楚了,当然有可能发现不管是用$*还是[email protected]数组长度都是1,这可怎么办,还是小白,我就从我碰壁的过程中得到的碎屑整理一二,打通你的任督二脉



Shell是有很多种的

  • /bin/sh (已经被 /bin/bash 所取代,在linux中是bash的link)
  • /bin/bash (就是 Linux预设shell,bash 主要兼容sh,而且依据一些使用者需求而加强的shell 版本)
    • 一般认为是1979年, Stephen Bourne发明的,他为UNIX写了第一个主要的shell程序,并命名为Bourne Shell,后来几乎所有的UNIX的shell都是源自它,后来一个新的加强版的逐渐成熟,成为Bourne Again Shell (Bash),在继承"老版"sh的基础上添加了很多功能,一般这个加强或者扩充是Brian Fox以及Chet Ramey完成的
  • /bin/csh (已经被 /bin/tcsh 所取代)
    • 与Bourne Shell同时,University of California, Berkeley的Bill Joy提出了C Shell的思想,Joy认识到Bourne shell的不足(无法后台运行),决定用C语言中的保留字设计C Shell。
  • /bin/ksh (Kornshell 由 AT&T Bell lab. 开发出来的,兼容bash的)
    • 与csh同时,贝尔实验室的David Korn也发明了Korn Shell 来修复C Shell中的不足,并且完全兼容Bourne Shell,而且ksh新版本还提供window功能。
  • /bin/tcsh (整和 C Shell ,提供更多的功能)
    • 1975年, Carnegie Mellon University的Ken Greer受TENEX操作系统启发开始实现Tenex-style文件名补全功能,1981年整合C Shell 然后1983年 Mike Ellis有加入了命令补全功能,最终在1983年发布。
  • /bin/zsh (基于 ksh发展出来的,功能更强大的shell)
    • 是1990年princeton University的一个学生Paul Falstad写的第一版


以Bash为标准来说明

A数组创建

无非就是2中几乎所有的编程语言都有的方法,一种单个赋值,一种是一起()赋值(1,2)。还有两种不正常的(3,4)

  1. array[0]=one;array[1]=two;array[2]=three # 0-based
  2. array=(one two three) #用空格分隔开来
  3. array=([0]=one [1]=two [2]=three) #用空格分隔开来,0-based
  4. array="one two three" #也是可以的,这样就把bash array的本质暴露出来了,就是个字符串

B复制数组

  1. new_array=($old_array_name)
  2. new_array=${old_array_name[@]}
  3. new_array=${old_array_name[*]}
  • new_array=([email protected]) #如果在函数中的话,只有B.1这种,因为[email protected]无法写成${@[@]}

#记得这对括号,只要字符串是以空格分隔的,加一对括号,就变数组,Perl的匿名数组和哈希就用的这套思路

# 加不加括号数组长度一样,但是不加的话,数组的第一个值变成了真个数组的字符串,有用的track就是定义数组的时候array[0]空着,从array[1]开始

C数组下标系统

  • ${array[index]} #绝大多数语言的index都是0-based,Shell也支持0-based

D数组和各元素长度

  • ${#array[@]} #数组元素的个数
  • ${#array[*]}  #数组元素的个数
  • ${#array[n]}  #第n个元素的字符串长度

举个例子来验证一下我说的长度和下标,下面4种分贝对应A创建数组部分的4中形式,

1 array_str="ubuntu deepin elementory opensuse fedora centos"
2 array_ot[0]=ubuntu;array_ot[1]=deepin;array_ot[2]=elementory;array_ot[3]=opensuse;array_ot[4]=fedora;array_ot[5]=centos
3 array_ar=(ubuntu deepin elementary opensuse fedora centos)
4 array_bl=([0]=ubuntu [1]=deepin [2]=elementory [3]=opensuse [4]=fedora [5]=centos)
5
6 array_fstr=($array_str)

然后看一下各种定义数组的长度时候一样,以及第1个和第2个元素是什么

1 echo *********************Length*********************
2 echo -e [email protected],${#array_str[@]},"\t${array_str[0]}>>>${array_str[1]}"
3 echo -e array_fstr*,${#array_fstr[*]},"\t${array_fstr[0]}>>>${array_fstr[1]}"
4 echo -e array_ot,${#array_ot[@]},"\t${array_ot[0]}>>>${array_ot[1]}"
5 echo -e array_ar,${#array_ar[@]},"\t${array_ar[0]}>>>${array_ar[1]}"
6 echo -e array_bl,${#array_bl[@]},"\t${array_bl[0]}>>>${array_bl[1]}"

结果如下,说明4重情况长度都是正常计算的

从结果就可以看出,字符串按数组方式引用的话,就被看作一个元素的数组(array_str),而加了括号之后,就被转换成数组(array_fstr),说明四种都可以的

然后在验证函数中的情况,虽大同,但也有小异

我们来写一个函数,验证$*和[email protected]的不同,以及复制数组是否一致

和整个shell脚本一样,函数也可以用位置变量来引用,$1,$2,$3,$4, ... ...

 1 function say(){
 2     echo -e " ****************From say\033[00m"
 3     echo -e "Length \[email protected]    ",${#@},"\t$1>>>$2"
 4     echo -e "Length \$*    ",${#*},"\t$1>>>$2"
 5     args=([email protected])
 6     echo -e "\033[01;32m>>>>>>>>> args=(\[email protected])\033[00m"
 7     echo -e "Length \$args*",${#args[*]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
 8     echo -e "Length \[email protected]",${#args[@]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
 9     args=[email protected]
10     echo -e "\033[01;32m>>>>>>>>> args=\[email protected]\033[00m"
11     echo -e "Length \$args*",${#args[*]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
12     echo -e "Length \[email protected]",${#args[@]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
13     args=($*)
14     echo -e "\033[01;32m>>>>>>>>> args=(\$*)\033[00m"
15     echo -e "Length \$args*",${#args[*]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
16     echo -e "Length \[email protected]",${#args[@]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
17     args=$*
18     echo -e "\033[01;32m>>>>>>>>> args=\$*\033[00m"
19     echo -e "Length \$args*",${#args[*]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
20     echo -e "Length \[email protected]",${#args[@]},"\t${args[0]}>>>${args[1]}>>>${args[2]}"
21 }
22
23 echo -ne "\033[01;31m=================> \${array_ar[@]}"
24 say ${array_ar[@]}
25 echo -ne "\033[01;31m=================> $array_str"
26 say $array_str

结果分析就是,无论是$*还是[email protected]在复制到新array中的时候都要加括号,不然第一个元素被整个数组字符串覆盖,我们由此想,把第一个元素的位置空出来不就行了吗?但是我还不知道怎么弄

[email protected]:~ => array_ar=("ubuntu" "deepin" "elementary" "opensuse" "fedora" "centos");n=${#array_ar[@]};for ss in `seq 0 $n`;do echo -e "$ss\t${array_ar[$ss]}\t"${#array_ar[$ss]}; done
0       ubuntu  6
1       deepin  6
2       elementary      10
3       opensuse        8
4       fedora  6
5       centos  6
6               0

E数组切片

用习惯了Perl的数组分片,Perl从Bash借鉴了很多东西来

  • ${array:m} #切处第m个元素(included)开始的所有元素切片,为字符串,赋值都是字符串
  • ${array:m:n} #切处第m个元素(included)开始n个元素的切片,为字符串,赋值都是字符串
  • new_slice=({array:m:n})

F元素字符(串)替换/删除

  • 第一个

    • ${array[n|@|*]/what/replacement} #把第n+1个元素/所有元素匹配到what的把what字符(串)替换成replacement,并不会对原数组改变
    • new_array=${array[@]/what/replacement}
    • new_element=${array[n]/what/replacement}
    • 简单说就是:会对你没个指定的元素执行what->replacement的替换,但是只会对每个元素中what第一次出现的位置进行替换,如果某个元素字符串含有多个what字符(串),则只替换第一个
  • 全局的
    • ${array[n|@|*]//what/replacement} # 把第n+1个元素/所有元素匹配到what的把what字符(串)替换成replacement,并不会对原数组改变
    • new_array=${array[@]//what/replacement}
    • 简单说就是:会对你没个指定的元素执行what->replacement的替换,但是会对每个元素中每个出现what的位置都进行替换,即使某个元素字符串含有多个what字符(串),也都会被替换掉
  • replacement为空即为删除,不支持通配符匹配

Fig G.1

Fig G.2

H元素字符(串)删除

  • 可以使用通配符*(元字符)
  • ${array[n|@|*]#pattern}     #删除每个元素中符合pattern的部分,匹配最短,如pattern为u*n,元素为ubunbunbuntu的话,则切的是ubun,留的是bunbuntu, Fig H.1
  • ${array[n|@|*]##pattern}   #删除每个元素中符合pattern的部分,匹配最长,如pattern为u*n,元素为ubunbunbuntu的话,则切的是ubunbunbun,留的是tu, Fig H.1
  • ${array[n|@|*]%pattern}    #删除每个元素中符合pattern的部分,匹配最短,如pattern为n*u,元素为ubunbunbuntu的话,则切的是ntu,留的是ubunbunbu, Fig H.2
  • ${array[n|@|*]%%pattern} #删除每个元素中符合pattern的部分,匹配最长,如pattern为n*u,元素为ubunbunbuntu的话,则切的是nbunbuntu,留的是ubu, Fig H.2
  • 千万注意:限制是必须匹配某一头,#时必须匹配开头,%是=时必须匹配末尾,就是你必须从某一头连续切,不能在中间切一段, Fig H.3

Fig H.1

Fig H.2

Fig H.3

既然字符串可以看作是单个元素的数组,那上面这一套都适合Bash中的字符串处理

Reference:

1. http://bbs.chinaunix.net.sixxs.org/thread-1779167-1-1.html

2. http://www.cnblogs.com.sixxs.org/chengmo/archive/2010/09/30/1839632.html

3. 鸟哥的Linux私房菜 基础版 (第三版)

4. http://en.wikipedia.org/wiki/Tcsh

时间: 2024-07-31 22:13:57

Linux, Mac下Shell 数组 Array 的修理工的相关文章

linux/mac下的配置自定义命令alias

linux/mac下的自定义命令alias,并保存别名使其永久生效(重启不会失效) 在做开发每次提交代码的命令都是一长串参数,不想去记,于是可以使用alias命令来解决这个问题:alias aCommandAlias='aCommand 一堆参数什么的'比如alias gpush='git push origin HEAD:refs/for/master' 这样在终端中,只需要输入gpush就ok了. 但是只是这样的话,会在重启之后失效,解决办法是编辑~/.bashrc文件,每行加入一个alia

linux/mac下命令行rm回收站--rmtrash

linux.mac的命令行下没有回收站功能,很多时候手一抖就把重要文件给 rm -fr * 了,虽然linux下有可能通过lost +found/debugfs找回,但难度也比较大,不能保证一定能够找回.人总是会犯错,本人工作这几年也犯过3次rm -fr删除后后悔的错误,与其后悔不如防范于未然,像桌面操作系统(windows.mac os.Ubuntu)一样加个回收站机制就可以了,经过几天的努力终于实现了,放到github上了,欢迎使用. 源码地址:https://github.com/LaiJ

linux,Mac下lu 一把

习惯Terminal没有不知道ls命令的(等同于DOS的dir),经常只是需要查看目录的内容大小,但ls -h显示的只是目录的本身大小,而且很多项内容 ls 在这方面的两个诟病出现了: 小诟1. 显示的信息很全,我们只提取Size和Name两列,分别是第5和9列 但是发现不对,像Edge的话起码有200G,但是为什么显示的是306B,说明ls只是显示目录的本身大小,不显示内容大小 大诟2. 不显示目录的实际大小,要显示目录(文件夹)的内容大小,需要用到du(disk utility的缩写)来显示

linux,Mac下 ls 查看目录(文件夹)内容大小

习惯Terminal没有不知道ls命令的(等同于DOS的dir),经常只是需要查看目录的内容大小,但ls -h显示的只是目录的本身大小,而且很多项内容 ls 在这方面的两个诟病出现了: 小诟1. 显示的信息很全,我们只提取Size和Name两列,分别是第5和9列 但是发现不对,像Edge的话起码有200G,但是为什么显示的是306B,说明ls只是显示目录的本身大小,不显示内容大小 大诟2. 不显示目录的实际大小,要显示目录(文件夹)的内容大小,需要用到du(disk utility的缩写)来显示

Linux下shell数组

shell当中的数组和其他编程语言的意义是一样的,考虑到shell是一个弱类型的脚本语言,可以在command lime当中直接去定义和使用 例如: $a[1]="Monday" $echo ${a[1]} Monday $ 注意这里用花括号,如果写成echo $a[1] 的话,在执行前shell会进行扩展,结果把a[1]就扩展为"a[1]"的字符串,然后和$结合,就直接输出$后面的字符串,即"a[1]",所以在对数组元素操作的时候要用花括号,以

Linux环境下Shell调用MySQL并实现定时任务

对于一些周期性事务,我们可以在Linux下,使用shell脚本调用mysql数据库存储过程,并设置定时任务. 本来是要mysql数据库中创建事件任务来,定时执行存储过程,做数据传输的...使用crontab来定时执行,调用存储过程. 实现这个数据传输分为两步: 第一步:编写shell脚本调用mysql数据库存储过程,如下: #!/bin/bash # 50 8 * * * sh /home/bgop/hao/detector_task.sh > /dev/null 2>&1 &

Windows/Linux/Mac下myeclipse所有版本下载地址

说明文档:MyEclipse生成注册码   Myeclipse2014激活教程  Myeclipse-2014-GA-破解文件 1.Windows版myeclipse下载地址 MyEclipse2015:myeclipse-2015-2014-07-11-offline-installer-windows.exe MyEclipse2014:myeclipse-spring-2014-GA-offline-installer-windows.exeMyEclipse2013:myeclipse-

Linux CentOS下shell显示-bash-4.1$ 不显示用户名和主机名的解决方法

CentOS下新增加一个用户,登录进去会发现shell脚本信息没有显示用户名和主机名,反而显示的是-bash-4.1$,如图所示: 而不是我们经常看到的[email protected]$的组合,看起来特别别扭不舒服. 问题的原因是因为没有配置.bash_profile的问题,或者说没有这个文件的问题,可以通过配置或者新建这个文件来解决问题. 解决方案: 1.在新建用户的-目录下新建或者更改.bash_profile:这个过程中可能需要root用户来新建或者修改 2.在.bash_profile

linux /mac 下 go环境变量配置

安装了go语言之后,还要设置路径,如果不设置路径,则执行 go 的时候会提示 go: command not found,提示的意思是没有这个命令行.这个是因为还没有设置PATH路径. 设置路径的方式是vi ~/.bash_profile,进去在首行添加一行 export PATH=$PATH:/usr/local/go/bin ,即可. 然后使profile生效: source ~/.bash_profile 1.GOROOT就是go的安装路径 2.GOPATH go install/go g