7.awk数组使用实例
| [zkpk@master as]$ awk 'BEGIN{a=1;print a; a=a+1 ; print a}' 1 2 [zkpk@master as]$ awk 'BEGIN{a=1;print a; a++ ; print a}' 1 2 |
将变量a设置为1,对其进行自加运算,则其数值会增加1,这不难理解,那么如果变量a是一个字符串哪?
| [zkpk@master as]$ awk 'BEGIN{a="test";print a; a++ ; print a}' test |
当a的值为字符串时,竟然也可以参与运算,而且可以看出,字符串被当成数字0参与运算,那么空字符串参与运算时也会被当成0运算吗?
| [zkpk@master as]$ awk 'BEGIN{a="";print a; a++ ; print a}' ____(空) |
结果显示,空字符串在参与运算时也会被当做数字0,之前我们说过,当我们引用数组中一个不存在的元素,元素被赋值成空字符串,当对这个元素进行自加运算时,元素的值就变成了1,因此当我们对一个不存在的元素进行自加运算后,这个元素的值就变成了自加的次数,自加x次,元素的值就被赋值为x,自加y次元素的值就被赋值为y,所以我们可以通过awk数组的这个特性来统计文本中某字符串出现的次数,代码如下所示
| [zkpk@master as]$ cat text Alice Bob Tom Peter Alice Alice Tom Bob Peter Bob [zkpk@master as]$ awk '{count[$1]++};END{for(i in count){print i,count[i]}}' text Bob 3 Tom 2 Alice 3 Peter 2 |
这回你该发现awk数组这个特性的强大所在了吧,好,也许你会说我不用awk照样可以统计啊,代码如下所示:
| [zkpk@master as]$ cat text | sort | uniq -c 3 Alice 3 Bob 2 Peter 2 Tom |
好吧,我承认你这个思路很棒,但是你看看下面例子哪?统计文本中人名出现的次数
| [zkpk@master as]$ cat -tE text Alice^IBob$ Bob^IAlice Alice Peter$ Tom Bob$ Peter Alice $ Alice Tom$ Alice^I^ITom $ Tom Peter$ Bob Bob$ Peter Alice$ Bob Alice Alice Tom$ #我们可以看出上面的文本中人名之间的分隔符有制表符,也有空格,来吧,统计人名出现的次数吧, #我使用awk数组的方式可以这样统计 [zkpk@master as]$ awk '{for(i=1;i<=NF;i++){count[$i]++} }END{for(j in count) {print j , count[j]}}' text Bob 6 Tom 5 Alice 9 Peter 4 |
但若你不用awk,非得用其他命令实现可以参考如下代码( ^_^ )
| [zkpk@master as]$ cat text | tr -s "t" " " | tr -s " " "n" | sort | uniq -c 9 Alice 6 Bob 4 Peter 5 Tom |
结尾
本文介绍了awk数组的基本使用方法,但是要学会灵活的运用,我在上面的示例中也写出了一些可以在某种程度上替换awk数组的方式,所以本文不单单是介绍awk数组该如何使用,而是如何在合适的场景,选择出最优的解决方案,快速高效的解决问题。这就是我一直追求的,也是我学习Linux命令的真实意图。








