Shell编程
概论
shell是通过命令行与操作系统沟通的语言。
Linux中常见的shell脚本有很多种,常见的有:
Bourne Shell (/usr/bin/sh
或/bin/sh
)
Bourne Again Shell (/bin/bash
)
C Shell (/usr/bin/csh
)
K Shell (/usr/bin/ksh
)
zsh
…
Linux系统中一般默认使用bash ,文件开头需要写#! /bin/bash
,指明bash为脚本解释器。
1
2
#! /bin/bash
echo Hello World # echo类似于C++的字符串
运行方式
1
2
3
4
5
6
7
8
# 作为可执行文件运行
chmod +x test.sh # 增加执行权限 可执行文件为绿色
./test.sh # 当前路径下执行
/home/acs/test.sh # 绝对路径下执行
~/test.sh # 家目录路径下执行
# 解释器执行
bash test.sh
nohup bash test.sh # 后台运行
注释
单行注释 :#
1
2
# 这是一行注释
echo Hello World
多行注释: :<<string string
1
2
3
4
5
6
7
8
9
10
11
12
13
:<<EOF
注释1
注释2
注释3
EOF
# EOF可以替换成其它任意字符串
:<<abc
注释4
注释5
注释6
abc
变量
定义变量
不需要加$
符号,等号两边不能有空格
1
2
3
name1 = 'abc' # 单引号定义字符串
name2 = "abc" # 双引号定义字符串
name3 = abc # 也可以不加引号,同样表示字符串
使用变量
需要加上$
符号,或者${}
符号。花括号是可选的,主要为了帮助解释器识别变量边界。
1
2
3
4
name = abc
echo $name # 输出abc
echo ${ name } # 输出abc
echo ${ name } acwing # 输出abcacwing,等价于echo "${name}acwing"
只读变量
使用readonly
或者declare
将变量变为只读
1
2
3
4
5
name = abc
readonly name
declare -r name # 两种写法均可
name = abc # 会报错,因为此时name只读
type+命令可以解释该命令的来源(内嵌命令。第三方命令等)
1
type readonly #readonly is a shell builtin(shell内部命令)
删除变量
unset
删除变量
1
2
3
name = abc
unset name
echo $name # 输出空行
变量类型
自定义变量(局部变量),子进程不能访问的变量
环境变量(全局变量),子进程可以访问的变量
自定义变量改成环境变量:
1
2
3
name = abc # 定义变量
export name # 第一种方法
declare -x name # 第二种方法
环境变量改为自定义变量:
1
2
export name = abc # 定义环境变量
declare +x name # 改为自定义变量
字符串
单引号与双引号的区别:
单引号中的内容会原样输出,不会执行、不会取变量; 双引号中的内容可以执行、可以取变量; 1
2
3
4
5
name = abc # 不用引号
echo 'hello, $name \"hh\"' # 单引号字符串,输出 hello, $name \"hh\"
echo "hello, $name \"hh\"" # 双引号字符串,输出 hello, abc "hh"
echo ${# name } # 获取字符串长度,输出3
echo ${ name : 0 : 5 } # 提取子串,提取从0开始的5个字符
默认变量
文件参数变量
在执行shell脚本时,可以向脚本传递参数。$1
是第一个参数,$2
是第二个参数,以此类推。特殊的,$0
是文件名(包含路径)
传递参数,超过用大括号,如${10}
其它参数相关变量
参数 说明 $# 代表文件传入的参数个数,如上例值为4 $* 由所有参数构成的用空格隔开的字符串,如上例值为"$1 $2 $3 $4" $@ 每个参数分别用双引号括起来的字符串,如上例中值为"$1" “$2” “$3” “$4” $$ 脚本当前运行的进程ID $? 上一条命令的退出状态(注意不是stdout,而是exit code)。0表示正常退出,其他值表示错误 $(command) 返回command这条命令的stdout(可嵌套) 获取退出状态 command 返回command这条命令的stdout(不可嵌套)获取输出
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#! /bin/bash
echo "文件名:" $0
echo "第一个参数:" $1
echo "第二个参数:" $2
echo "第三个参数:" $3
echo "第四个参数:" $4
echo $#
echo $*
echo $@
echo $$
echo $?
echo $( ls)
echo ` ls`
# 执行
./test.sh 1 2 3 4
文件名:./test.sh
第一个参数:1
第二个参数:2
第三个参数:3
第四个参数:4
4
1 2 3 4
1 2 3 4
1313
0
test.sh
test.sh
数组
数组中可以存放多个不同类型的值,只支持一维数组,初始化时不需要指明数组大小。
数组下标从0开始。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
# 定义数组用小括号表示,元素之间用空格隔开。
array =( 1 abc "def" abc)
array[ 0]= 1
array[ 1]= abc
array[ 2]= "def"
array[ 3]= abc
# 读取数组中某个元素的值
${ array [index] }
array =( 1 abc "def" yxc)
echo ${ array [0] }
echo ${ array [1] }
echo ${ array [2] }
echo ${ array [3] }
# 读取整个数组
${ array [@] } # 第一种写法
${ array [*] } # 第二种写法
array =( 1 abc "def" abc)
echo ${ array [@] } # 第一种写法
echo ${ array [*] } # 第二种写法
# 数组长度,类似于字符串
${# array [@] } # 第一种写法
${# array [*] } # 第二种写法
array =( 1 abc "def" abc)
echo ${# array [@] } # 第一种写法
echo ${# array [*] } # 第二种写法
expr 命令
expr 命令用于求表达式的值,格式为:expr 表达式
用空格隔开每一项
用反斜杠放在shell特定的字符前面(发现表达式运行错误时,可以试试转义)
对包含空格和其他特殊字符的字符串要用引号括起来
expr会在stdout中输出结果。如果为逻辑关系表达式,则结果为真时,stdout输出1,否则输出0。
expr的exit code:如果为逻辑关系表达式,则结果为真时,exit code为0,否则为1。
字符串表达式
length string
:返回string的长度
index string charset
charset中任意单个字符在string 中最前面的字符位置,下标从1开始。如果在string 中完全不存在charset中的字符,则返回0。
substr string postion length
返回STRING字符串中从postion 开始,长度最大为length的子串。如果postion 或length为负数,0或非数值,则返回空字符串。
1
2
3
4
5
str = "Hello World!"
echo ` expr length $str ` #等价于echo `expr length Hello World!`;中间有空格,length只船一个参数,一般加双引号字符串传入 syntax error:unexpecter argument 'World!'.
echo ` expr length " $str " ` # ``不是单引号,表示执行该命令,输出12
echo ` expr index " $str " aWd` # 输出7,下标从1开始
echo ` expr substr " $str " 2 3` # 输出 ell
整数表达式
expr支持普通的算术操作,算术表达式优先级低于字符串表达式,高于逻辑关系表达式。
+-:加减运算。两端参数会转换为整数,如果转换失败则报错。 / %:乘,除,取模运算。两端参数会转换为整数,如果转换失败则报错。 () 可以改变优先级,但需要用反斜杠转义 1
2
3
4
5
6
7
8
9
a = 3
b = 4
echo ` expr $a + $b ` # 输出7
echo ` expr $a - $b ` # 输出-1
echo ` expr $a \* $b ` # 输出12,*需要转义
echo ` expr $a / $b ` # 输出0,整除
echo ` expr $a % $b ` # 输出3
echo ` expr \( $a + 1 \) \* \( $b + 1 \) ` # 输出20,值为(a + 1) * (b + 1)
逻辑关系表达式
|
如果第一个参数非空且非0,则返回第一个参数的值,否则返回第二个参数的值,但要求第二个参数的值也是非空或非0,否则返回0。如果第一个参数是非空或非0时,不会计算第二个参数。
&
如果两个参数都非空且非0,则返回第一个参数,否则返回0。如果第一个参为0或为空,则不会计算第二个参数。
< <= = == != >= >
比较两端的参数,如果为true,则返回1,否则返回0。”==”是”=”的同义词。”expr”首先尝试将两端参数转换为整数,并做算术比较,如果转换失败,则按字符集排序规则做字符比较。
() 可以改变优先级,但需要用反斜杠转义
&&
表示与,||
表示或
二者具有短路原则:
expr1 && expr2
:当expr1为假时,直接忽略expr2
expr1 || expr2
:当expr1为真时,直接忽略expr2
表达式的exit code为0,表示真;为非零,表示假。(与C/C++中的定义相反)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
a = 3
b = 4
# 除了转义字符还可直接加单引号
echo ` expr $a \> $b ` # 输出0,>需要转义
echo ` expr $a '<' $b ` # 输出1,也可以将特殊字符用引号引起来
echo ` expr $a '>=' $b ` # 输出0
echo ` expr $a \<\= $b ` # 输出1
c = 0
d = 5
echo ` expr $c \& $d ` # 输出0
echo ` expr $a \& $b ` # 输出3
echo ` expr $c \| $d ` # 输出5
echo ` expr $a \| $b ` # 输出3
read命令
read命令用于从标准输入中读取单行数据。当读到文件结束符时,exit code为1,否则为0。
-p: 后面可以接提示信息
-t:后面跟秒数,定义输入字符的等待时间,超过等待时间后会自动忽略此命令
1
2
3
4
5
6
7
8
acs@9e0ebfcd82d7:~$ read name # 读入name的值
acwing yxc # 标准输入
acs@9e0ebfcd82d7:~$ echo $name # 输出name的值
acwing yxc #标准输出
acs@9e0ebfcd82d7:~$ read -p "Please input your name: " -t 30 name # 读入name的值,等待时间30秒
Please input your name: acwing yxc # 标准输入
acs@9e0ebfcd82d7:~$ echo $name # 输出name的值
acwing yxc # 标准输出
echo命令
echo用于输出字符串。命令格式:echo string
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# 显示普通字符串
echo "Hello AC Terminal"
echo Hello AC Terminal # 引号可以省略
# 显示转义字符
echo "\"Hello AC Terminal\"" # 注意只能使用双引号,如果使用单引号,则不转义
echo \" Hello AC Terminal\" # 也可以省略双引号
# 显示变量
name = abc
echo "My name is $name " # 输出 My name is abc
# 显示换行
echo -e "Hi\n" # -e 开启转义
echo "acwing"
# 显示不换行
echo -e "Hi \c" # -e 开启转义 \c 不换行
echo "acwing"
# 显示结果定向至文件
echo "Hello World" > output.txt # 将内容以覆盖的方式输出到output.txt中
# 原样输出字符串,不进行转义或取变量(用单引号)
name = acwing
echo '$name\"'
# 显示命令的执行结果
echo ` date` # Thu Apr 6 15:30:20 CST 2023
printf 命令
printf命令用于格式化输出,类似于C/C++中的printf函数。默认不会在字符串末尾添加换行符。
命令格式:printf format-string [arguments...]
1
2
3
4
5
6
7
8
9
printf "%10d.\n" 123 # 占10位,右对齐
printf "%-10.2f.\n" 123.123321 # 占10位,保留2位小数,左对齐
printf "My name is %s\n" "abc" # 格式化输出字符串
printf "%d * %d = %d\n" 2 3 ` expr 2 \* 3` # 表达式的值作为参数
# 输出结果
123.
123.12 .
My name is abc
2 * 3 = 6
test命令
在命令行中输入man test
,可以查看test命令的用法。
test
命令用于判断文件类型,以及对变量做比较。
test
命令用exit code
返回结果,而不是使用stdout。0表示真,非0表示假。
expr stdout输出 1表示真,0表示假。 test exit code退出状态 0表示真,非0表示假。
1
2
3
4
5
6
7
8
9
10
acs@a1d78bab476e:~learn$ test 2 -lt 3
acs@a1d78bab476e:~learn$ echo $?
0
acs@a1d78bab476e:~learn$ ls # 列出当前目录下的所有文件
output.txt test.sh
# 使用&& ||实现if判断
acs@a1d78bab476e:~learn$ test -e test.sh && echo "exist" || echo "Not exist"
exist # test.sh 文件存在
acs@a1d78bab476e:~learn$ test -e tesh.sh && echo "exist" || echo "Not exist"
Not exist # tesh.sh 文件不存在
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
test -e filename # 判断文件是否存在
test -f filename # 是否为文件
test -d filename # 是否为目录
# 权限判断
test -r filename# 判断文件是否可读
test -w filename# 判断文件是否可写
test -x filename# 判断文件是否可执行
test -s filename# 判断是否为非空文件
# 整数比较
test $a -eq $b # a是否等于b equal(相等)
test $a -ne $b # a是否不等于b not equal(不等)
test $a -gt $b # a是否大于b greater than(大于)
test $a -lt $b # a是否小于b less than(小于)
test $a -ge $b # a是否大于等于b greater than or equal(大于或等于)
test $a -le $b # a是否小于等于b less than or equal(小于或等于)
# 字符串比较
test -z STRING # 判断STRING是否为空,如果为空,则返回true
test -n STRING # 判断STRING是否非空,如果非空,则返回true(-n可以省略)
test str1 == str2 # 判断str1是否等于str2
test str1 != str2 # 判断str1是否不等于str2
# 多重条件判定
test -r filename -a -x filename
test -r filename -o -x filename
test ! -r filename
-a # 两条件是否同时成立
-o # 两条件是否至少一个成立
! # 取反。如 test ! -x file,当file不可执行时,返回true
判断符号[]
[]与test用法几乎一模一样,更常用于if语句中。[[]]是[]的加强版,支持的特性更多。
1
2
3
4
5
6
7
8
9
acs@a1d78bab476e:~learn$ [ 2 -lt 3]
acs@a1d78bab476e:~learn$ echoi $?
0
acs@a1d78bab476e:~learn$ ls # 列出当前目录下的所有文件
output.txt test.sh
acs@a1d78bab476e:~learn$ [ -e test.sh ] && echo "exist" || echo "Not exist"
exist # test.sh 文件存在
acs@a1d78bab476e:~learn$ [ -e tesh.sh ] && echo "exist" || echo "Not exist"
Not exist # tesh.sh 文件不存在
注意:
[]内的每一项都要用空格隔开
[]]内的变量,最好用双引号括起来
[]]内的常数,最好用单或双引号括起来
1
2
3
name = "acwing abc"
[ $name == "acwing abc" ] # 错误,等价于 [ acwing abc == "acwing abc" ],前面参数太多
[ " $name " == "acwing abc" ] # 正确
判断语句
if..then
形式
单层if
1
2
3
4
5
6
if condition
then
语句1
语句2
...
fi
1
2
3
4
5
6
7
8
9
# 实例
a = 3
b = 4
if [ " $a " -lt " $b " ] && [ " $a " -gt 2 ]
then
echo ${ a } 在范围内
fi
# 输出 3在范围内
单层if-else
命令格式
1
2
3
4
5
6
7
8
9
10
if condition
then
语句1
语句2
...
else
语句1
语句2
...
fi
1
2
3
4
5
6
7
8
9
10
11
# 实例
a = 3
b = 4
if ! [ " $a " -lt " $b " ]
then
echo ${ a } 不小于${ b }
else
echo ${ a } 小于${ b }
fi
# 输出 3小于4
多层if-elif-elif-else
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
if condition
then
语句1
语句2
...
elif condition
then
语句1
语句2
...
elif condition
then
语句1
语句2
else
语句1
语句2
...
fi
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#示例:
a = 4
if [ $a -eq 1 ]
then
echo ${ a } 等于1
elif [ $a -eq 2 ]
then
echo ${ a } 等于2
elif [ $a -eq 3 ]
then
echo ${ a } 等于3
else
echo 其他
fi
# 输出 其他
case…esac形式
类似于C/C++中的switch语句。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
case $变量名称 in
值1)
语句1
语句2
...
;; # 类似于C/C++中的break
值2)
语句1
语句2
...
;;
*) # 类似于C/C++中的default
语句1
语句2
...
;;
esac
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# 示例:
a = 4
case $a in
1)
echo ${ a } 等于1
;;
2)
echo ${ a } 等于2
;;
3)
echo ${ a } 等于3
;;
*)
echo 其他
;;
esac
# 输出:其他
循环语句
for…in…do…done
1
2
3
4
5
6
for var in val1 val2 val3
do
语句1
语句2
...
done
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 示例1,输出a 2 cc,每个元素一行:
for i in a 2 cc
do
echo $i
done
#示例2,输出当前路径下的所有文件名,每个文件名一行:
for file in ` ls`
do
echo $file
done
# 示例3,输出1-10;seq返回一个序列
for i in $( seq 1 10)
do
echo $i
done
# 示例4,使用{1..10} 或者 {a..z}
for i in { a..z}
do
echo $i
done
for ((…;…;…)) do…done
1
2
3
4
5
for (( expression; condition; expression))
do
语句1
语句2
done
1
2
3
4
5
# 示例,输出1-10,每个数占一行:
for (( i = 1; i<= 10; i++))
do
echo $i
done
while…do…done循环
1
2
3
4
5
6
while condition
do
语句1
语句2
...
done
1
2
3
4
5
# 示例,文件结束符为Ctrl+d,输入文件结束符后read指令返回false。
while read name
do
echo $name
done
until…do…done循环
当条件为真时结束。
1
2
3
4
5
6
until condition
do
语句1
语句2
...
done
1
2
3
4
5
# 示例,当用户输入yes或者YES时结束,否则一直等待读入。
until [ " ${ word } " == "yes" ] || [ " ${ word } " == "YES" ]
do
read -p "Please input yes/YES to stop this program: " word
done
break命令
跳出当前一层循环,注意与C/C++不同的是:break不能跳出case语句。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 示例
while read name
do
for (( i = 1; i<= 10; i++))
do
case $i in
8)
break
;;
*)
echo $i
;;
esac
done
done
# 该示例每读入非EOF的字符串,会输出一遍1-7。
# 该程序可以输入Ctrl+d文件结束符来结束,也可以直接用Ctrl+c杀掉该进程。
continue命令
跳出当前循环。
1
2
3
4
5
6
7
8
9
10
# 示例:
for (( i = 1; i<= 10; i++))
do
if [ ` expr $i % 2` -eq 0 ]
then
continue
fi
echo $i
done
# 该程序输出1-10中的所有奇数。
死循环的处理方式
如果AC Terminal可以打开该程序,则输入Ctrl+c
即可。
否则可以直接关闭进程:
使用top
命令找到进程的PID或者ps aux
返回当前打开的所有进程。shift+M
按照内存排序
输入kill -9 PID
即可关掉此进程
函数
bash中的函数类似于C/C++中的函数,但return
的返回值与C/C++不同,返回的是exit code
,取值为0-255,0表示正常结束。
如果想获取函数的输出结果,可以通过echo
输出到stdout
中,然后通过$(function_name)
来获取stdout中的结果。
函数的return值可以通过$?
来获取。
1
2
3
4
5
[ function ] func_name() { # function关键字可以省略
语句1
语句2
...
}
不获取 return值和stdout值
1
2
3
4
5
6
7
func() {
name = abc
echo "Hello $name "
}
func
# 输出结果:Hello abc
获取 return值和stdout值
不写return时,默认return 0。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
func() {
name = abc
echo "Hello $name "
return 123
}
output = $( func)
ret = $?
echo "output = $output "
echo "return = $ret "
# 输出结果:
# output = Hello abc
# return = 123
函数的输入参数
在函数内,$1表示第一个输入参数,$2表示第二个输入参数,依此类推。
函数内的$0仍然是文件名,而不是函数名。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
func() { # 递归计算 $1 + ($1 - 1) + ($1 - 2) + ... + 0
word = ""
while [ " ${ word } " != 'y' ] && [ " ${ word } " != 'n' ]
do
read -p "要进入func( $1 )函数吗?请输入y/n:" word
done
if [ " $word " == 'n' ]
then
echo 0
return 0
fi
if [ $1 -le 0 ]
then
echo 0
return 0
fi
sum = $( func $( expr $1 - 1))
echo $( expr $sum + $1 )
}
echo $( func 10)
# 输出结果:55
函数内的局部变量
可以在函数内定义局部变量,作用范围仅在当前函数内。
可以在递归函数中定义局部变量。
local 变量名=变量值
1
2
3
4
5
6
7
8
9
10
11
#! /bin/bash
func() {
local name = abc
echo $name
}
func
echo $name
# 输出结果:abc
# 第一行为函数内的name变量,第二行为函数外调用name变量,会发现此时该变量不存在。
exit命令
exit命令用来退出当前shell进程,并返回一个退出状态;使用$?可以接收这个退出状态。
exit命令可以接受一个整数值作为参数,代表退出状态。如果不指定,默认状态值是 0。
exit退出状态只能是一个介于 0~255 之间的整数,其中只有 0 表示成功,其它值都表示失败。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#! /bin/bash
if [ $# -ne 1 ] # 如果传入参数个数等于1,则正常退出;否则非正常退出。
then
echo "arguments not valid"
exit 1
else
echo "arguments valid"
exit 0
fi
# 执行该脚本:
./test.sh acwing
arguments valid
echo $? # 传入一个参数,则正常退出,exit code为0
0
./test.sh
arguments not valid
echo $? # 传入参数个数不是1,则非正常退出,exit code为1
1
文件重定向
每个进程默认打开3个文件描述符:
stdin标准输入,从命令行读取数据,文件描述符为0
stdout标准输出,向命令行输出数据,文件描述符为1
stderr标准错误输出,向命令行输出数据,文件描述符为2
可以用文件重定向将这三个文件重定向到其他文件中。
命令 说明 command > file 将stdout重定向到file中 command < file 将stdin重定向到file中 command » file 将stdout以追加方式重定向到file中 command n> file 将文件描述符n重定向到file中 command n» file 将文件描述符n以追加方式重定向到file中
输入和输出重定向
1
2
3
4
5
6
echo -e "Hello \c" > output.txt # 将stdout重定向到output.txt中
echo "World" >> output.txt # 将字符串追加到output.txt中
read str < output.txt # 从output.txt中读取字符串
echo $str # 输出结果:Hello World
同时重定向stdin和stdout
1
2
3
4
5
6
7
8
9
10
11
12
13
14
#! /bin/bash
read a
read b
echo $( expr " $a " + " $b " )
创建input.txt,里面的内容为:
3
4
# 执行命令:
./test.sh < input.txt > output.txt # 从input.txt中读取内容,将输出写入output.txt中
cat output.txt # 查看output.txt中的内容
7
引入外部脚本
类似于C/C++中的include操作,bash也可以引入其他文件中的代码。
. filename
# 注意点和文件名之间有一个空格
source filename
1
2
3
4
5
6
7
8
9
10
11
# test1.sh
#! /bin/bash
name = abc # 定义变量name
# 创建test2.sh
#! /bin/bash
source test1.sh # 或 . test1.sh
echo My name is: $name # 可以使用test1.sh中的变量
# 执行命令:
./test2.sh
My name is: abc
文本处理三剑客
grep
适合单纯的查找或匹配文本
grep -l './hip-prof-3912.db' log_*.txt
:查找文本
sed
更适合编辑匹配到的文本
更适合格式化文本,对文本进行较复杂格式处理
AWK执行的流程 :读(Read)、执行(Execute)与重复(Repeat)
读(Read ):从输入流(文件、管道或标准输入)中读取一行,然后将其存入内存中。
执行(Execute) :对于每一行的输入,所有的AWK命令按顺序执行。
重复(Repeat) :一直重复上述两个过程,直到文件结束。
程序结构
开始块(BEGIN block ):启动,只执行一次;BEGIN是关键字需大写;可选(程序可以没有开始块)
主体块(Body block) :输入行,执行命令
结束块(END block) :介素执行,END是关键字需大写;可选(程序可以没有开始块)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
[ user553@login05 shell] $ cat stu.txt
1) 张三 物理 60
2) 李四 数学 70
3) 王五 英语 80
4) 赵六 语文 90
5) 孙七 化学 100
[ user553@login05 shell] $ awk '{print}' stu.txt
1) 张三 物理 60
2) 李四 数学 70
3) 王五 英语 80
4) 赵六 语文 90
5) 孙七 化学 100
[ user553@login05 shell] $ awk 'BEGIN{printf "编号\t姓名\t科目\t成绩\n"} {print}' stu.txt
编号 姓名 科目 成绩
1) 张三 物理 60
2) 李四 数学 70
3) 王五 英语 80
4) 赵六 语文 90
5) 孙七 化学 100
语法
1
awk [ options] ' Pattern{Action} ' <file>
awk中最常用的动作Action
就是print
和printf
逐行处理的,默认以换行符
为标记,识别每一行;awk会按照用户指定的分隔符去分割当前行,如果没有指定分隔符,默认使用空格作为分隔符。
$0
和$NF
均为内置变量。$NF
表示当前行分割后的最后一列。
内置变量不能加双引号,否则会当文本输出
1
2
3
4
[ user553@login05 shell] $ echo aaa | awk '{print $1}'
aaa
[ user553@login05 shell] $ echo aaa | awk '{print "$1"}'
$1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# 通过管道输出磁盘信息;printf中可以格式化输出的字符串,确保输出是等宽字符显示。
[ user553@login05 shell] $ df -h | awk '{print $1"\t"$2"\t"%5}'
Filesystem Size0
/dev/sda3 422G0
devtmpfs 126G0
/dev/sda1 2.0G0
ParaStor_01_work 27P0
ParaStor_01_home 215T0
/dev/sdc1 15T0
ParaStor_01_nvme 388T0
[ user553@login05 shell] $ df -h | awk '{printf "%20s\t %s\t %s\t\n", $1,$2,$5}'
Filesystem Size Use%
/dev/sda3 422G 16%
devtmpfs 126G 0%
/dev/sda1 2.0G 9%
ParaStor_01_work 27P 15%
ParaStor_01_home 215T 59%
/dev/sdc1 15T 1%
ParaStor_01_nvme 388T 2%
Pattern
,其实就是选择的条件
AWK支持正则表达式;正则表达式被放入两个斜线中:/正则表达式/。
1
2
3
4
5
# 从/etc/passwd文件中找出以root开头的行
[ user553@login05 shell] $ grep "^root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
[ user553@login05 shell] $ awk '/^root/ {print $0}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
[Options]
可选参数。最常用的是:
-F, 用于指定输入分隔符;
-v varname=value 变量名区分字符大小写, 用于设置变量的值
1
2
3
4
$ awk -v myvar = 'hello world!' 'BEGIN {print myvar}'
hello world!
[ user553@login05 shell] $ awk -F" " 'NR==2 {print $0}' stu.txt
2) 李四 数学 70
awk if语句 :必须用在{}中,且比较内容用()括起来。
1
2
3
# 统计uid小于等于500和大于500的用户个数
[ user553@login05 shell] $ awk -F: 'BEGIN {i=0;j=0} {if($3<=500) {i++} else {j++}} END{print i, j}' /etc/passwd
41 24
for循环
1
2
3
4
5
6
[ user553@login05 shell] $ awk 'BEGIN {for(i=1; i<=10;i++){if(i%2!=0) continue;print i}}'
2
4
6
8
10