Shell编程

Shell编程

概论

shell是通过命令行与操作系统沟通的语言。

Linux中常见的shell脚本有很多种,常见的有:

Bourne Shell (/usr/bin/sh/bin/sh)

Bourne Again Shell (/bin/bash)

C Shell (/usr/bin/csh)

K Shell (/usr/bin/ksh)

zsh

Linux系统中一般默认使用bash,文件开头需要写#! /bin/bash,指明bash为脚本解释器。

1
2
#! /bin/bash
echo Hello World  # echo类似于C++的字符串

运行方式

1
2
3
4
5
6
7
8
# 作为可执行文件运行
chmod +x test.sh  # 增加执行权限  可执行文件为绿色
./test.sh         # 当前路径下执行
/home/acs/test.sh # 绝对路径下执行
~/test.sh         # 家目录路径下执行
# 解释器执行
bash test.sh
nohup bash test.sh # 后台运行

注释

单行注释#

1
2
# 这是一行注释
echo Hello World

多行注释: :<<string string

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
:<<EOF
注释1
注释2
注释3
EOF

# EOF可以替换成其它任意字符串

:<<abc
注释4
注释5
注释6
abc

变量

定义变量

不需要加$符号,等号两边不能有空格

1
2
3
name1='abc'  # 单引号定义字符串
name2="abc"  # 双引号定义字符串
name3=abc    # 也可以不加引号,同样表示字符串

使用变量

需要加上$符号,或者${}符号。花括号是可选的,主要为了帮助解释器识别变量边界。

1
2
3
4
name=abc
echo $name  # 输出abc
echo ${name}  # 输出abc
echo ${name}acwing  # 输出abcacwing,等价于echo "${name}acwing"

只读变量

使用readonly或者declare将变量变为只读

1
2
3
4
5
name=abc
readonly name
declare -r name  # 两种写法均可

name=abc  # 会报错,因为此时name只读

type+命令可以解释该命令的来源(内嵌命令。第三方命令等)

1
type readonly #readonly is a shell builtin(shell内部命令)

删除变量

unset删除变量

1
2
3
name=abc
unset name
echo $name  # 输出空行

变量类型

  1. 自定义变量(局部变量),子进程不能访问的变量

  2. 环境变量(全局变量),子进程可以访问的变量

自定义变量改成环境变量:

1
2
3
name=abc # 定义变量
export name      # 第一种方法
declare -x name  # 第二种方法

环境变量改为自定义变量:

1
2
export name=abc  # 定义环境变量
declare +x name  # 改为自定义变量

字符串

单引号与双引号的区别:

  1. 单引号中的内容会原样输出,不会执行、不会取变量;
  2. 双引号中的内容可以执行、可以取变量;
1
2
3
4
5
name=abc  # 不用引号
echo 'hello, $name \"hh\"'  # 单引号字符串,输出 hello, $name \"hh\"
echo "hello, $name \"hh\""  # 双引号字符串,输出 hello, abc "hh"
echo ${#name}  # 获取字符串长度,输出3
echo ${name:0:5}  # 提取子串,提取从0开始的5个字符

默认变量

文件参数变量

在执行shell脚本时,可以向脚本传递参数。$1是第一个参数,$2是第二个参数,以此类推。特殊的,$0是文件名(包含路径)

传递参数,超过用大括号,如${10}

其它参数相关变量

参数说明
$#代表文件传入的参数个数,如上例值为4
$*由所有参数构成的用空格隔开的字符串,如上例值为"$1 $2 $3 $4"
$@每个参数分别用双引号括起来的字符串,如上例中值为"$1" “$2” “$3” “$4”
$$脚本当前运行的进程ID
$?上一条命令的退出状态(注意不是stdout,而是exit code)。0表示正常退出,其他值表示错误
$(command)返回command这条命令的stdout(可嵌套) 获取退出状态
command返回command这条命令的stdout(不可嵌套)获取输出
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#! /bin/bash
echo "文件名:"$0
echo "第一个参数:"$1
echo "第二个参数:"$2
echo "第三个参数:"$3
echo "第四个参数:"$4
echo $#
echo $*
echo $@
echo $$
echo $?
echo $(ls)
echo `ls`
# 执行
./test.sh 1 2 3 4
    文件名:./test.sh
    第一个参数:1
    第二个参数:2
    第三个参数:3
    第四个参数:4
    4
    1 2 3 4
    1 2 3 4
    1313
    0
    test.sh
    test.sh

数组

数组中可以存放多个不同类型的值,只支持一维数组,初始化时不需要指明数组大小。 数组下标从0开始。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
# 定义数组用小括号表示,元素之间用空格隔开。
array=(1 abc "def" abc)
array[0]=1
array[1]=abc
array[2]="def"
array[3]=abc

# 读取数组中某个元素的值
${array[index]}

array=(1 abc "def" yxc)
echo ${array[0]}
echo ${array[1]}
echo ${array[2]}
echo ${array[3]}

# 读取整个数组
${array[@]}  # 第一种写法
${array[*]}  # 第二种写法

array=(1 abc "def" abc)
echo ${array[@]}  # 第一种写法
echo ${array[*]}  # 第二种写法

# 数组长度,类似于字符串
${#array[@]}  # 第一种写法
${#array[*]}  # 第二种写法

array=(1 abc "def" abc)
echo ${#array[@]}  # 第一种写法
echo ${#array[*]}  # 第二种写法

expr 命令

expr 命令用于求表达式的值,格式为:expr 表达式

用空格隔开每一项

用反斜杠放在shell特定的字符前面(发现表达式运行错误时,可以试试转义)

对包含空格和其他特殊字符的字符串要用引号括起来

expr会在stdout中输出结果。如果为逻辑关系表达式,则结果为真时,stdout输出1,否则输出0。

expr的exit code:如果为逻辑关系表达式,则结果为真时,exit code为0,否则为1。

字符串表达式

length string:返回string的长度

index string charset

charset中任意单个字符在string 中最前面的字符位置,下标从1开始。如果在string 中完全不存在charset中的字符,则返回0。

substr string postion length

返回STRING字符串中从postion 开始,长度最大为length的子串。如果postion 或length为负数,0或非数值,则返回空字符串。

1
2
3
4
5
str="Hello World!"
echo `expr length $str`  #等价于echo `expr length Hello World!`;中间有空格,length只船一个参数,一般加双引号字符串传入 syntax error:unexpecter argument 'World!'.
echo `expr length "$str"`  # ``不是单引号,表示执行该命令,输出12
echo `expr index "$str" aWd`  # 输出7,下标从1开始
echo `expr substr "$str" 2 3`  # 输出 ell

整数表达式

expr支持普通的算术操作,算术表达式优先级低于字符串表达式,高于逻辑关系表达式。

  • +-:加减运算。两端参数会转换为整数,如果转换失败则报错。
  • / %:乘,除,取模运算。两端参数会转换为整数,如果转换失败则报错。
  • () 可以改变优先级,但需要用反斜杠转义
1
2
3
4
5
6
7
8
9
a=3
b=4

echo `expr $a + $b`  # 输出7
echo `expr $a - $b`  # 输出-1
echo `expr $a \* $b`  # 输出12,*需要转义
echo `expr $a / $b`  # 输出0,整除
echo `expr $a % $b` # 输出3
echo `expr \( $a + 1 \) \* \( $b + 1 \)`  # 输出20,值为(a + 1) * (b + 1)

逻辑关系表达式

  • | 如果第一个参数非空且非0,则返回第一个参数的值,否则返回第二个参数的值,但要求第二个参数的值也是非空或非0,否则返回0。如果第一个参数是非空或非0时,不会计算第二个参数。

  • & 如果两个参数都非空且非0,则返回第一个参数,否则返回0。如果第一个参为0或为空,则不会计算第二个参数。

  • < <= = == != >= > 比较两端的参数,如果为true,则返回1,否则返回0。”==”是”=”的同义词。”expr”首先尝试将两端参数转换为整数,并做算术比较,如果转换失败,则按字符集排序规则做字符比较。

  • () 可以改变优先级,但需要用反斜杠转义

  • && 表示与,|| 表示或

    二者具有短路原则:

    expr1 && expr2:当expr1为假时,直接忽略expr2

    expr1 || expr2:当expr1为真时,直接忽略expr2

    表达式的exit code为0,表示真;为非零,表示假。(与C/C++中的定义相反)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
a=3
b=4
# 除了转义字符还可直接加单引号
echo `expr $a \> $b`  # 输出0,>需要转义
echo `expr $a '<' $b`  # 输出1,也可以将特殊字符用引号引起来
echo `expr $a '>=' $b`  # 输出0
echo `expr $a \<\= $b`  # 输出1

c=0
d=5

echo `expr $c \& $d`  # 输出0
echo `expr $a \& $b`  # 输出3
echo `expr $c \| $d`  # 输出5
echo `expr $a \| $b`  # 输出3

read命令

read命令用于从标准输入中读取单行数据。当读到文件结束符时,exit code为1,否则为0。

-p: 后面可以接提示信息

-t:后面跟秒数,定义输入字符的等待时间,超过等待时间后会自动忽略此命令

1
2
3
4
5
6
7
8
acs@9e0ebfcd82d7:~$ read name  # 读入name的值
acwing yxc  # 标准输入
acs@9e0ebfcd82d7:~$ echo $name  # 输出name的值
acwing yxc  #标准输出
acs@9e0ebfcd82d7:~$ read -p "Please input your name: " -t 30 name  # 读入name的值,等待时间30秒
Please input your name: acwing yxc  # 标准输入
acs@9e0ebfcd82d7:~$ echo $name  # 输出name的值
acwing yxc  # 标准输出

echo命令

echo用于输出字符串。命令格式:echo string

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
# 显示普通字符串
echo "Hello AC Terminal"
echo Hello AC Terminal  # 引号可以省略

# 显示转义字符
echo "\"Hello AC Terminal\""  # 注意只能使用双引号,如果使用单引号,则不转义
echo \"Hello AC Terminal\"  # 也可以省略双引号

# 显示变量
name=abc
echo "My name is $name"  # 输出 My name is abc

# 显示换行
echo -e "Hi\n"  # -e 开启转义
echo "acwing"

# 显示不换行
echo -e "Hi \c" # -e 开启转义 \c 不换行
echo "acwing"

# 显示结果定向至文件
echo "Hello World" > output.txt  # 将内容以覆盖的方式输出到output.txt中

# 原样输出字符串,不进行转义或取变量(用单引号)
name=acwing
echo '$name\"'

# 显示命令的执行结果
echo `date` # Thu Apr 6 15:30:20 CST 2023

printf 命令

printf命令用于格式化输出,类似于C/C++中的printf函数。默认不会在字符串末尾添加换行符。

命令格式:printf format-string [arguments...]

1
2
3
4
5
6
7
8
9
printf "%10d.\n" 123  # 占10位,右对齐    
printf "%-10.2f.\n" 123.123321  # 占10位,保留2位小数,左对齐 
printf "My name is %s\n" "abc"  # 格式化输出字符串 
printf "%d * %d = %d\n"  2 3 `expr 2 \* 3` # 表达式的值作为参数
# 输出结果
      123.
123.12   . 
My name is abc
2 * 3 = 6

test命令

在命令行中输入man test,可以查看test命令的用法。

test命令用于判断文件类型,以及对变量做比较。

test命令用exit code返回结果,而不是使用stdout。0表示真,非0表示假。

exprstdout输出1表示真,0表示假。
testexit code退出状态0表示真,非0表示假。
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
acs@a1d78bab476e:~learn$ test 2 -lt 3
acs@a1d78bab476e:~learn$ echo $?
0
acs@a1d78bab476e:~learn$ ls  # 列出当前目录下的所有文件
output.txt  test.sh 
# 使用&& ||实现if判断
acs@a1d78bab476e:~learn$ test -e test.sh && echo "exist" || echo "Not exist"
exist  # test.sh 文件存在
acs@a1d78bab476e:~learn$ test -e tesh.sh && echo "exist" || echo "Not exist"
Not exist  # tesh.sh 文件不存在
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
test -e filename  # 判断文件是否存在   
test -f filename # 是否为文件
test -d filename # 是否为目录
# 权限判断
test -r filename# 判断文件是否可读
test -w filename# 判断文件是否可写
test -x filename# 判断文件是否可执行
test -s filename# 判断是否为非空文件
# 整数比较
test $a -eq $b  # a是否等于b    equal(相等)
test $a -ne $b  # a是否不等于b   not equal(不等)
test $a -gt $b  # a是否大于b    greater than(大于)
test $a -lt $b  # a是否小于b    less than(小于)
test $a -ge $b  # a是否大于等于b  greater than or equal(大于或等于)
test $a -le $b  # a是否小于等于b  less than or equal(小于或等于)

# 字符串比较
test -z STRING	# 判断STRING是否为空,如果为空,则返回true
test -n STRING	# 判断STRING是否非空,如果非空,则返回true(-n可以省略)
test str1 == str2	# 判断str1是否等于str2
test str1 != str2	# 判断str1是否不等于str2

# 多重条件判定
test -r filename -a -x filename
test -r filename -o -x filename
test ! -r filename 
-a	# 两条件是否同时成立
-o	# 两条件是否至少一个成立
!	# 取反。如 test ! -x file,当file不可执行时,返回true

判断符号[]

[]与test用法几乎一模一样,更常用于if语句中。[[]]是[]的加强版,支持的特性更多。

1
2
3
4
5
6
7
8
9
acs@a1d78bab476e:~learn$ [2 -lt 3]
acs@a1d78bab476e:~learn$ echoi $?
0
acs@a1d78bab476e:~learn$ ls  # 列出当前目录下的所有文件
output.txt  test.sh 
acs@a1d78bab476e:~learn$ [ -e test.sh ] && echo "exist" || echo "Not exist"
exist  # test.sh 文件存在
acs@a1d78bab476e:~learn$ [ -e tesh.sh ] && echo "exist" || echo "Not exist"
Not exist  # tesh.sh 文件不存在

注意:

[]内的每一项都要用空格隔开 []]内的变量,最好用双引号括起来 []]内的常数,最好用单或双引号括起来

1
2
3
name="acwing abc"
[ $name == "acwing abc" ]  # 错误,等价于 [ acwing abc == "acwing abc" ],前面参数太多
[ "$name" == "acwing abc" ]  # 正确

判断语句

if..then形式

单层if

1
2
3
4
5
6
if condition
then
    语句1
    语句2
    ...
fi
1
2
3
4
5
6
7
8
9
# 实例
a=3
b=4

if [ "$a" -lt "$b" ] && [ "$a" -gt 2 ]
then
    echo ${a}在范围内
fi
# 输出 3在范围内

单层if-else

命令格式

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
if condition
then
    语句1
    语句2
    ...
else
    语句1
    语句2
    ...
fi
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# 实例
a=3
b=4

if ! [ "$a" -lt "$b" ]
then
    echo ${a}不小于${b}
else
    echo ${a}小于${b}
fi
# 输出 3小于4

多层if-elif-elif-else

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
if condition
then
    语句1
    语句2
    ...
elif condition
then
    语句1
    语句2
    ...
elif condition
then
    语句1
    语句2
else
    语句1
    语句2
    ...
fi
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
#示例:
a=4

if [ $a -eq 1 ]
then
    echo ${a}等于1
elif [ $a -eq 2 ]
then
    echo ${a}等于2
elif [ $a -eq 3 ]
then
    echo ${a}等于3
else
    echo 其他
fi
# 输出 其他

case…esac形式

类似于C/C++中的switch语句。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
case $变量名称 in
    值1)
        语句1
        语句2
        ...
        ;;  # 类似于C/C++中的break
    值2)
        语句1
        语句2
        ...
        ;;
    *)  # 类似于C/C++中的default
        语句1
        语句2
        ...
        ;;
esac
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
# 示例:
a=4

case $a in
    1)
        echo ${a}等于1
        ;;  
    2)
        echo ${a}等于2
        ;;  
    3)                                                
        echo ${a}等于3
        ;;  
    *)
        echo 其他
        ;;  
esac
# 输出:其他

循环语句

for…in…do…done

1
2
3
4
5
6
for var in val1 val2 val3
do
    语句1
    语句2
    ...
done
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 示例1,输出a 2 cc,每个元素一行:
for i in a 2 cc
do
    echo $i
done

#示例2,输出当前路径下的所有文件名,每个文件名一行:
for file in `ls`
do
    echo $file
done

# 示例3,输出1-10;seq返回一个序列
for i in $(seq 1 10)
do
    echo $i
done

# 示例4,使用{1..10} 或者 {a..z}
for i in {a..z}
do
    echo $i
done

for ((…;…;…)) do…done

1
2
3
4
5
for ((expression; condition; expression))
do
    语句1
    语句2
done
1
2
3
4
5
# 示例,输出1-10,每个数占一行:
for ((i=1; i<=10; i++))
do
    echo $i
done

while…do…done循环

1
2
3
4
5
6
while condition
do
    语句1
    语句2
    ...
done
1
2
3
4
5
# 示例,文件结束符为Ctrl+d,输入文件结束符后read指令返回false。
while read name
do
    echo $name
done

until…do…done循环

当条件为真时结束。

1
2
3
4
5
6
until condition
do
    语句1
    语句2
    ...
done
1
2
3
4
5
# 示例,当用户输入yes或者YES时结束,否则一直等待读入。
until [ "${word}" == "yes" ] || [ "${word}" == "YES" ]
do
    read -p "Please input yes/YES to stop this program: " word
done

break命令

跳出当前一层循环,注意与C/C++不同的是:break不能跳出case语句。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
# 示例
while read name
do
    for ((i=1;i<=10;i++))
    do
        case $i in
            8)
                break
                ;;
            *)
                echo $i
                ;;
        esac
    done
done
# 该示例每读入非EOF的字符串,会输出一遍1-7。
# 该程序可以输入Ctrl+d文件结束符来结束,也可以直接用Ctrl+c杀掉该进程。

continue命令

跳出当前循环。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
# 示例:
for ((i=1;i<=10;i++))
do
    if [ `expr $i % 2` -eq 0 ]
    then
        continue
    fi
    echo $i
done
# 该程序输出1-10中的所有奇数。

死循环的处理方式

如果AC Terminal可以打开该程序,则输入Ctrl+c即可。

否则可以直接关闭进程:

使用top命令找到进程的PID或者ps aux返回当前打开的所有进程。shift+M按照内存排序 输入kill -9 PID即可关掉此进程

函数

bash中的函数类似于C/C++中的函数,但return的返回值与C/C++不同,返回的是exit code,取值为0-255,0表示正常结束。

如果想获取函数的输出结果,可以通过echo输出到stdout中,然后通过$(function_name)来获取stdout中的结果。 函数的return值可以通过$?来获取。

1
2
3
4
5
[function] func_name() {  # function关键字可以省略
    语句1
    语句2
    ...
}

不获取 return值和stdout值

1
2
3
4
5
6
7
func() {
    name=abc
    echo "Hello $name"
}

func
# 输出结果:Hello abc

获取 return值和stdout值

不写return时,默认return 0。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
func() {
    name=abc
    echo "Hello $name"

    return 123
}

output=$(func)
ret=$?

echo "output = $output"
echo "return = $ret"
# 输出结果:
# output = Hello abc
# return = 123

函数的输入参数

在函数内,$1表示第一个输入参数,$2表示第二个输入参数,依此类推。 函数内的$0仍然是文件名,而不是函数名。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
func() {  # 递归计算 $1 + ($1 - 1) + ($1 - 2) + ... + 0
    word=""
    while [ "${word}" != 'y' ] && [ "${word}" != 'n' ]
    do
        read -p "要进入func($1)函数吗?请输入y/n:" word
    done

    if [ "$word" == 'n' ]
    then
        echo 0
        return 0
    fi  
    
    if [ $1 -le 0 ] 
    then
        echo 0
        return 0
    fi  
    
    sum=$(func $(expr $1 - 1))
    echo $(expr $sum + $1)
}

echo $(func 10)
# 输出结果:55

函数内的局部变量

可以在函数内定义局部变量,作用范围仅在当前函数内。 可以在递归函数中定义局部变量。 local 变量名=变量值

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
#! /bin/bash

func() {
    local name=abc
    echo $name
}
func

echo $name
# 输出结果:abc
# 第一行为函数内的name变量,第二行为函数外调用name变量,会发现此时该变量不存在。

exit命令

exit命令用来退出当前shell进程,并返回一个退出状态;使用$?可以接收这个退出状态。

exit命令可以接受一个整数值作为参数,代表退出状态。如果不指定,默认状态值是 0。

exit退出状态只能是一个介于 0~255 之间的整数,其中只有 0 表示成功,其它值都表示失败。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
#! /bin/bash

if [ $# -ne 1 ]  # 如果传入参数个数等于1,则正常退出;否则非正常退出。
then
    echo "arguments not valid"
    exit 1
else
    echo "arguments valid"
    exit 0
fi
# 执行该脚本:
./test.sh acwing
arguments valid
echo $?  # 传入一个参数,则正常退出,exit code为0
0
 ./test.sh 
arguments not valid
echo $?  # 传入参数个数不是1,则非正常退出,exit code为1
1

文件重定向

每个进程默认打开3个文件描述符:

stdin标准输入,从命令行读取数据,文件描述符为0

stdout标准输出,向命令行输出数据,文件描述符为1

stderr标准错误输出,向命令行输出数据,文件描述符为2

可以用文件重定向将这三个文件重定向到其他文件中。

命令说明
command > file将stdout重定向到file中
command < file将stdin重定向到file中
command » file将stdout以追加方式重定向到file中
command n> file将文件描述符n重定向到file中
command n» file将文件描述符n以追加方式重定向到file中

输入和输出重定向

1
2
3
4
5
6
echo -e "Hello \c" > output.txt  # 将stdout重定向到output.txt中
echo "World" >> output.txt  # 将字符串追加到output.txt中

read str < output.txt  # 从output.txt中读取字符串

echo $str  # 输出结果:Hello World

同时重定向stdin和stdout

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
#! /bin/bash

read a
read b

echo $(expr "$a" + "$b")
创建input.txt,里面的内容为:

3
4
# 执行命令:
./test.sh < input.txt > output.txt  # 从input.txt中读取内容,将输出写入output.txt中
cat output.txt  # 查看output.txt中的内容
7

引入外部脚本

类似于C/C++中的include操作,bash也可以引入其他文件中的代码。

. filename # 注意点和文件名之间有一个空格 source filename

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
# test1.sh
#! /bin/bash
name=abc  # 定义变量name
# 创建test2.sh
#! /bin/bash
source test1.sh # 或 . test1.sh

echo My name is: $name  # 可以使用test1.sh中的变量
# 执行命令:
./test2.sh 
My name is: abc

文本处理三剑客

grep

适合单纯的查找或匹配文本

grep -l './hip-prof-3912.db' log_*.txt:查找文本

sed

更适合编辑匹配到的文本

awk

更适合格式化文本,对文本进行较复杂格式处理

AWK执行的流程:读(Read)、执行(Execute)与重复(Repeat)

读(Read):从输入流(文件、管道或标准输入)中读取一行,然后将其存入内存中。

执行(Execute):对于每一行的输入,所有的AWK命令按顺序执行。

重复(Repeat):一直重复上述两个过程,直到文件结束。

程序结构

开始块(BEGIN block):启动,只执行一次;BEGIN是关键字需大写;可选(程序可以没有开始块)

主体块(Body block):输入行,执行命令

结束块(END block):介素执行,END是关键字需大写;可选(程序可以没有开始块)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
[user553@login05 shell]$ cat stu.txt 
1)     张三    物理    60
2)     李四    数学    70
3)     王五    英语    80
4)     赵六    语文    90
5)     孙七    化学    100
[user553@login05 shell]$ awk '{print}' stu.txt 
1)     张三    物理    60
2)     李四    数学    70
3)     王五    英语    80
4)     赵六    语文    90
5)     孙七    化学    100
[user553@login05 shell]$ awk 'BEGIN{printf "编号\t姓名\t科目\t成绩\n"} {print}' stu.txt 
编号    姓名    科目    成绩
1)     张三    物理    60
2)     李四    数学    70
3)     王五    英语    80
4)     赵六    语文    90
5)     孙七    化学    100

语法

1
awk [options] ' Pattern{Action} '<file>

awk中最常用的动作Action就是printprintf

逐行处理的,默认以换行符为标记,识别每一行;awk会按照用户指定的分隔符去分割当前行,如果没有指定分隔符,默认使用空格作为分隔符。

$0$NF均为内置变量。$NF表示当前行分割后的最后一列。

内置变量不能加双引号,否则会当文本输出

1
2
3
4
[user553@login05 shell]$ echo aaa | awk '{print $1}'
aaa
[user553@login05 shell]$ echo aaa | awk '{print "$1"}'
$1
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
# 通过管道输出磁盘信息;printf中可以格式化输出的字符串,确保输出是等宽字符显示。
[user553@login05 shell]$ df -h | awk '{print $1"\t"$2"\t"%5}'
Filesystem      Size0
/dev/sda3       422G0
devtmpfs        126G0
/dev/sda1       2.0G0
ParaStor_01_work        27P0
ParaStor_01_home        215T0
/dev/sdc1       15T0
ParaStor_01_nvme        388T0
[user553@login05 shell]$ df -h | awk '{printf "%20s\t %s\t %s\t\n", $1,$2,$5}'
          Filesystem     Size    Use%
           /dev/sda3     422G    16%
            devtmpfs     126G    0%
           /dev/sda1     2.0G    9%
    ParaStor_01_work     27P     15%
    ParaStor_01_home     215T    59%
           /dev/sdc1     15T     1%
    ParaStor_01_nvme     388T    2%

Pattern,其实就是选择的条件

AWK支持正则表达式;正则表达式被放入两个斜线中:/正则表达式/。

1
2
3
4
5
# 从/etc/passwd文件中找出以root开头的行
[user553@login05 shell]$ grep "^root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
[user553@login05 shell]$ awk '/^root/ {print $0}' /etc/passwd
root:x:0:0:root:/root:/bin/bash

[Options]可选参数。最常用的是:

-F, 用于指定输入分隔符;

-v varname=value 变量名区分字符大小写, 用于设置变量的值

1
2
3
4
$ awk -v myvar='hello world!' 'BEGIN {print myvar}'
hello world!
[user553@login05 shell]$ awk -F" " 'NR==2 {print $0}' stu.txt 
2)     李四    数学    70

awk if语句:必须用在{}中,且比较内容用()括起来。

1
2
3
# 统计uid小于等于500和大于500的用户个数
[user553@login05 shell]$ awk -F: 'BEGIN {i=0;j=0} {if($3<=500) {i++} else {j++}} END{print i, j}' /etc/passwd
41 24

for循环

1
2
3
4
5
6
[user553@login05 shell]$ awk 'BEGIN {for(i=1; i<=10;i++){if(i%2!=0) continue;print i}}'
2
4
6
8
10
0%