写 bash 脚本的日子也不短了,但是每次用到 if 语句时大脑还是会卡壳一下,要翻教程和看以前的代码,因为条件部分语法神出鬼没,捉摸不定,于是我还是花点时间狠狠研究了一下,写了这篇文章做总结。
但条件部分代码说得不明不白,只是列出一堆实际例子,例如判断文件存在可以用
所以这篇文章说理解 if 语句,就是指理解 if 语句的条件部分。
大概有如下问题:
最后是靠 Advanced Bash-Scripting Guide 这本书搞清楚的。
说 true 和 false,也就是执行结果是个布尔值,这么说就是造成条件部分难写的原因,被这个说法误导了,所以要换一个角度看。
应该说
什么叫「正常执行」呢?这里要搞懂一个叫「退出状态码」(exit status)概念,有时候也叫「返回状态码」(return code)。也就是子进程退出时向调用它的父进程返回的一个整数值,一般编程语言都有个
对于 bash 来说,调用过的子进程的返回状态码保存在
非要当成布尔值看待的话,可以这样想:为 0 就是正常,正常就是 true,不为 0 就是不正常,不正常就是 false。这跟其它语言 0 当 false 不同,所以特容易搞反。
但是返回什么值是程序自己决定的,一般常见 unix 程序都会仔细定义状态码。
对于 ls 来说,列得到文件表示正常:
先定义一下用语,ls、grep 这些这里称为「程序」,而「命令」是指在提示符(即交互 shell)里打的整条字符串,「程序」名称加上参数或管道就是一条「命令」了。
下面来逐步解释一下。
然后构造一个 ls 命令来判断,不需要反单引号包围,套到 if 语句里:
这里 ls 也输出我们不需要的信息,因为我们只让它更新
这就是 test 程序了,用
即
也可以在直接在提示符里执行,效果跟用普通方法没差别:
为什么要提供这个语法糖呢?估计 bash 觉得这样写更好看吧,也让你打少两个字符。但是这个语法糖,迷惑了我好多年,那么小括号有什么用?
例如,你在 home 目录,cd 到 /tmp 目录,sleep 5 秒,最后 cd 回 home,但是你会在 sleep 的过程中按 Ctrl + c 中断。
如果你使用这个命令:
但是如果你加上小括号:
于是这样就是蛋疼的双重否定了:
如果你想比较两个数字,于是这样写:
那是因为
所以要对
如果显式加上单引号,就清楚了:
所以上面的几个比较其实全部都是字符串比较,只不过长度一样的话,看起来就是按数字比较。
如果想按数字大小怎么办?可以用
所以上面那条命令以
修正如下:
把单括号换成双括号就 OK 了:
前面说说单方括号是语法糖,因为只是 test 命令的另一种写法,bash 最后会调用程序 test,一般就是 /usr/bin/test。
用 type 程序看下类型:
但是说双方括号是「关键词」,关键词就是 bash 自己内建的语法分析:
例如上面的比较大小,对
还可以用
例如给变量赋值:
正是因为是算术表达式,所以比较也是按数字本身而不是字符串:
感觉依然是:到处都是坑啊.
诡异的语法
一般 bash 教程给出的语法示例基本就是:if condition; then
echo yes
else
echo no
fi
看起来很简单,除了 condition
外(也就是条件部分),其余关键字都没什么难懂了,顶多注意一下写在同一行要加分号。但条件部分代码说得不明不白,只是列出一堆实际例子,例如判断文件存在可以用
[ -f file ]
,判断目录用 [ -d dir ]
等等。这些例子也不算复杂,但是真写起来,想构造复杂点条件都能让你调试到欲仙欲死。所以这篇文章说理解 if 语句,就是指理解 if 语句的条件部分。
大概有如下问题:
- 为毛是用方括号,不是小括号?
- 为毛见到有的代码用两个方括号,有的还是两个小括号?
- 为毛有时比较字符串相等可以用
-eq
,但又可以用等号? - 为毛有时还能直接用命令,命令到底要不要加反单引号呢?
- 写了句复合条件,结果一堆看不懂的语法错误?
- 测试好麻烦啊,每次都要 if/then/else 整句写全,有没有简单点测试方法?
最后是靠 Advanced Bash-Scripting Guide 这本书搞清楚的。
条件部分的意义
很多教程都这么说:condition
的代码执行后,如果结果为 true,就继续执行 then
部分,否则继续执行 else
部分。跟其它语言的一样的,没区别,例如 [ -f file ]
判断文件是否存在,文件存在就是 true 了,不存在就是 false 了。说 true 和 false,也就是执行结果是个布尔值,这么说就是造成条件部分难写的原因,被这个说法误导了,所以要换一个角度看。
应该说
condition
的代码正常执行。什么叫「正常执行」呢?这里要搞懂一个叫「退出状态码」(exit status)概念,有时候也叫「返回状态码」(return code)。也就是子进程退出时向调用它的父进程返回的一个整数值,一般编程语言都有个
exit()
函数来直接退出,这个函数的参数就是返回给父进程的状态码,不传默认就是 0。对于 bash 来说,调用过的子进程的返回状态码保存在
$?
环境变量中,每执行过一个命令后都会被更新,可以用 echo 来查看。$ ls; echo $?
0
按 unix 的规范,返回状态码为 0 就是表示正常执行,其它值都表示不正常。非要当成布尔值看待的话,可以这样想:为 0 就是正常,正常就是 true,不为 0 就是不正常,不正常就是 false。这跟其它语言 0 当 false 不同,所以特容易搞反。
但是返回什么值是程序自己决定的,一般常见 unix 程序都会仔细定义状态码。
对于 ls 来说,列得到文件表示正常:
$ ls exists.txt; echo $?;
exists.txt
0
$ ls not_exists.txt; echo $?;
ls: cannot access not_exists.txt: No such file or directory
2
对于 grep 来说,有匹配表示正常:$ echo 'abc' | grep 'a'; echo $?
abc
0
$ echo 'abc' | grep 'd'; echo $?
1
或者具体点说,condition
的代码执行后,这时候环境变量 $? 的值是否为 0。先定义一下用语,ls、grep 这些这里称为「程序」,而「命令」是指在提示符(即交互 shell)里打的整条字符串,「程序」名称加上参数或管道就是一条「命令」了。
下面来逐步解释一下。
test 程序
如果要检查文件是否存在,只要找到一个程序,存在文件返回状态码 0,不存在就返回非 0 就行了,上面的 ls 就这样了。然后构造一个 ls 命令来判断,不需要反单引号包围,套到 if 语句里:
$ if ls exists.txt; then echo yes; else echo no; fi
exists.txt
yes
$ if ls not_exists.txt; then echo yes; else echo no; fi
ls: cannot access not_exists.txt: No such file or directory
no
可以把 if
关键词的作用当成:判断后面跟着的命令的 $?
是否为 0。这里 ls 也输出我们不需要的信息,因为我们只让它更新
$?
就够了,要屏蔽掉这些输出:$ if ls exists.txt &> /dev/null; then echo yes; else echo no; fi
yes
$ if ls not_exists.txt &> /dev/null; then echo yes; else echo no; fi
no
加上了 &> /dev/null
略显丑陋,那有没有其它程序仅仅更新 $?
但没有任何输出呢?这就是 test 程序了,用
-f
参数表示判断是否存在文件,先检查下:$ test -f exists.txt; echo $?
0
$ test -f not_exists.txt; echo $?
1
确实无误,套上 if 语句:$ if test -f exists.txt; then echo yes; else echo no; fi
yes
$ if test -f not_exists.txt; then echo yes; else echo no; fi
no
这里的「文件」指普通文件,如果我要判断其它类型的文件,例如目录、软链接或管道呢?test 也提供判断这些文件类型的参数,可以通过 man test
查看手册。单方括号语法糖
如果你打开了 test 的 man 后,发现几个眼熟的东西:SYNOPSIS
test EXPRESSION
test
[ EXPRESSION ]
[ ]
[ OPTION
bash 给 test 程序特殊优待,可以用另一种语法来编写,也就是把 test 的参数包围在单个方括号里。即
test args
也可以写成 [ args ]
,注意方括号和里面的参数要留个空格,不然提示语法错误,我曾经就被这样折腾了半天。也可以在直接在提示符里执行,效果跟用普通方法没差别:
$ [ -f exists.txt ]; echo $?
0
$ [ -f not_exists.txt ]; echo $?
1
套上 if 语句:$ if [ -f exists.txt ]; then echo yes; else echo no; fi
yes
$ if [ -f not_exists.txt ]; then echo yes; else echo no; fi
no
这就是为什么 if 条件部分用的是单个方括号,bash 会把这个写法转换回一般写法,所以说是语法糖。为什么要提供这个语法糖呢?估计 bash 觉得这样写更好看吧,也让你打少两个字符。但是这个语法糖,迷惑了我好多年,那么小括号有什么用?
单个小括号的作用
单个小括号在 bash 中不像其它语言那样表示分隔符和优先级调整,而是启动一个 subshell 来执行里面的代码,也就是再启动一个 bash 来运行,好处是 subshell 有独立的环境变量。例如,你在 home 目录,cd 到 /tmp 目录,sleep 5 秒,最后 cd 回 home,但是你会在 sleep 的过程中按 Ctrl + c 中断。
如果你使用这个命令:
~$ cd /tmp/; sleep 5; cd ~
^C
/tmp$
你会留在 /tmp 目录中,因为最后的 cd ~
根本没执行。所以如果你希望临时切换别的目录执行某些命令,但又希望中断后回到原来的目录,这个方法就不凑效了。但是如果你加上小括号:
~$ ( cd /tmp/; sleep 5; )
^C
~$
这里没有最后的 cd ~
,因为多此一举,subshell 有自己的工作目录,相当于你另外开一个终端而已,这样避免一些环境变量被某些代码弄乱。取反操作
你会想当然认为就是加!
符号:$ [ ! -f exists.txt ]; echo $?
1
确实对了,但是这只是 test 命令里的内部取反,而不是 bash 的,换回一般写法就是:$ test ! -f exists.txt; echo $?
1
对于 bash 的取反,也就是不正常运行 $?
应该为 0,也是在命令开头加 !
:$ ! test -f exists.txt; echo $?
1
$ ! test -f not_exists.txt; echo $?
0
注意 !
后要有一空格,不然在提示符中会被当成「调用历史命令」解析了,但以脚本执行时不会,反正都加上最好。于是这样就是蛋疼的双重否定了:
$ ! test ! -f exists.txt; echo $?
0
数字和字符串比较
如果你想比较数字是否相等,想当然写成:$ [ 3 == 1 ]; echo $?
1
$ [ 3 != 1 ]; echo $?
0
相等也可以用单个等号,用两个比较符合习惯。但是等号左右一定要有空格,否则结果不如你想,因为没空格就是变量赋值!如果你想比较两个数字,于是这样写:
$ [ 3 > 1 ]; echo $?
0
看起来也如你想的一样,但是如果:$ [ 3 > 6 ]; echo $?
0
这是搞毛啊?赶紧 ls 一下看看当前目录是不是多了两个名字为 1 和 6 的空文件。那是因为
>
不是表示大于,而是标准输出重定向,因为标准输出为空,所以只建立了空文件,相当于 touch 命令了。所以要对
>
符号转义,这样就 OK 了:$ [ 3 \> 1 ]; echo $?
0
$ [ 3 \> 6 ]; echo $?
1
别高兴得太早,这里还有坑:$ [ 3 \> 10 ]; echo $?
0
因为这不是按数字比较,而是按字符串,这里 3
和 10
在 bash 眼中就是字符串,传给 test 后,test 默认也是当成字符串。如果显式加上单引号,就清楚了:
$ [ '3' \> '10' ]; echo $?
0
字符串比较就是按 ASCII 编码比较,因为先比较第一个字符,3 比 1 的 ASCII 编码大。所以上面的几个比较其实全部都是字符串比较,只不过长度一样的话,看起来就是按数字比较。
如果想按数字大小怎么办?可以用
-gt
参数,这样 test 就会把两边当成一个数字看待:$ [ 3 -gt 1 ]; echo $?
0
$ [ 3 -gt 6 ]; echo $?
1
$ [ 3 -gt 10 ]; echo $?
1
同样,-eq
也是按数字比较:$ [ 1 == 01 ]; echo $?;
1
$ [ 1 -eq 01 ]; echo $?;
0
复合条件
假如你要再判断某个目录是否存在,又想当然写成:$ [ -f exists.txt && -d exists_folder ]; echo $?
bash: [: missing `]'
2
结果提示漏了右括号,那是因为 &&
被 bash 预先解析了,而不是当成 test 的参数传递。&&
表示如果左边的命令正常执行了,那么继续执行右边的命令,相当于没有 else 部分的 if 语句简化版。- 而
||
表示如果左边的命令不是正常执行了,那么继续执行右边的命令,相当于没有 then 部分的 if 语句(或者 if not)。
所以上面那条命令以
&&
分开看,左边的 [ -f exists.txt
明显是个不完整命令,漏了个 ]
,当然右边的也漏了 [
。修正如下:
$ [ -f exists.txt ] && [ -d exists_folder ]; echo $?
0
换回一般写法也应该是:$ test -f exists.txt && test -d exists_folder; echo $?
0
使用 ||
则是:$ [ -f not_exists.txt ] || [ -d exists_folder ]; echo $?
0
如果你想先把 &&
和 ||
转义,但 test 不支持这个参数,表示逻辑与和逻辑或的参数分别是 -a
和 -o
,所以这样就 OK 了:$ [ -f exists.txt -a -d exists_folder ]; echo $?
0
$ test -f exists.txt -a -d exists_folder; echo $?
0
这样好处就是只调用了一次 test 程序而不是两次。双方括号关键词
上面我们用[ -f exists.txt && -d exists_folder ]
来表示复合条件,结果发现这是一个坑,于是 bash 后来从 ksh 抄来一个特性来填这个坑,结果挖了更大的一个坑。把单括号换成双括号就 OK 了:
$ [[ -f exists.txt && -d exists_folder ]]; echo $?
0
震惊之情溢于言表,&&
不是隔开两个命令么,怎么用两个方括号又合法了?前面说说单方括号是语法糖,因为只是 test 命令的另一种写法,bash 最后会调用程序 test,一般就是 /usr/bin/test。
用 type 程序看下类型:
$ type [
[ is a shell builtin
$ type test
test is a shell builtin
又说这是叫 builtin,坑爹,不过常用命令如 cd、echo 都是这样的。但是说双方括号是「关键词」,关键词就是 bash 自己内建的语法分析:
$ type [[
[[ is a shell keyword
就因为这是关键词,所以被双方括号包围的代码都有另外一种意义,&&
、||
、>
和 <
这些符号的意义都被改变了,就和其它编程语言的用法一样了。例如上面的比较大小,对
>
不再需要转义了:$ [[ 3 > 1 ]]; echo $?
0
但依然是表示按字符串比较,不是按数字:$ [[ 3 > 10 ]]; echo $?
0
可以看作增强版的 test,因为逻辑与和逻辑或已经可以直接用 &&
和 ||
,所以 -a
,-o
就不能用了,其余的参数和 test 基本一样,-f
和 -d
也可以用。还可以用
=~
来检查是否匹配正则,简单的就不用劳烦 grep 了:$ [[ abc =~ a ]]; echo $?
0
因为对 &&
那几个符号自动转义了,比较直观,不容易搞错,相对安全,所以推荐优先使用 [[
而不是 [
。双小括号的作用
双小括号的作用就是把里面的代码作为算术表达式来执行,像双方括号一样,里面的代码有另外的意义。例如给变量赋值:
$ a=1+1; echo $a
1+1
$ (( b = 1 + 1 )); echo $b
2
a
的 1+1
只是一个字符串,而 b
就是一个算术表达式结果。正是因为是算术表达式,所以比较也是按数字本身而不是字符串:
$ (( 3 > 1 )); echo $?
0
$ (( 3 > 6 )); echo $?
1
$ (( 3 > 10 )); echo $?
1
所以也可以套上 if 语句来用:$ if (( 3 > 1 )); then echo yes; else echo no; fi
yes
真令人抓狂。一些技巧
可以组合多个命令:$ if echo abc; echo def; then echo yes; else echo no; fi
abc
def
yes
也可以用管道:$ if echo abc | grep -q a; then echo yes; else echo no; fi
yes
太长或太复杂的话可以用函数封装:$ function echo_abc() { echo abc | grep -q a; }
$ if echo_abc; then echo yes; else echo no; fi
yes
如果需要保留命令的标准输出到变量以便再使用,可以直接比较 $?
的值,单纯赋值不改变 $?
的:$ text=`echo abc | grep a`;
$ if [[ $? == 0 ]]; then echo 'text:' $text; else echo no; fi
text: abc
$ text=`echo abc | grep d`;
$ if [[ $? == 0 ]]; then echo 'text:' $text; else echo no; fi
no
总结
亲自动手测试了这么多个例子,总算搞把各种堆在一起的概念一一分解开来理解,至少写起来都知道该看参考手册的那一部分了。感觉依然是:到处都是坑啊.