Perl Sort函数用法总结和使用实例

2019-10-01 12:16:58刘景俊

各选项说明如下:
-0777   -   读入整个文件,而不是单行
-a     -   自动分割模式,将行分割到@F数组
-e     -   从命令行读取和运行脚本
-n     -   逐行遍历文件:while (<>) { ... }
$,     -   print函数的输出域分割符
file   -   文件名

9. 高效sorting: Orcish算法和Schwartzian转换

对每个key,sort的子函数通常被调用多次。假如非常在意sort运行时间,可使用Orcish算法或Schwartzian转换,以便每个key仅被计算1次
考虑如下示例,它根据文件修改日期来sort文件列表。

# 强迫算法--对每个文件要多次访问磁盘
@sorted = sort { -M $a <=> -M $b } @filenames;

# Orcish算法--在hash里创建keys
@sorted = sort { ($modtimes{$a} ||= -M $a) <=>
          ($modtimes{$b} ||= -M $b)
          } @filenames;

很巧妙的算法,是不是?因为文件的修改日期在脚本运行期间是基本不变的,所以-M运算一次后,把它存起来就可以了呀。
如下是Schwartzian转换的用法:

@sorted = map( { $_->[0] }
          sort( { $a->[1] <=> $b->[1] }
              map({ [$_, -M] } @filenames)
            )
        );

这个code结合用了map,sort分了好几层,记住偶以前提过的方法,从后往前看。map({ [$_, -M] } @filenames)返回一个列表,列表元素是匿名数组,匿名数组的第一个值是文件名,第二个值是文件的修改日期。

sort( { $a->[1] <=> $b->[1] }...再对上述产生的匿名数组列表进行sort,它根据文件的修改日期进行sort
sort返回的结果是经过排序后的匿名数组。

最外围的map( { $_->[0] }...就简单了,它从上述sort产生的匿名数组里提取出文件名。这个文件名就是根据修改日期进行sort过的呀,并且每个文件只运行了一次-M。
这就是著名的Schwartzian转换,这种用法在国外perl用户里很流行