効率的なシェルパイプラインを記述しようとしましたが、扱いにくくなり、低速または不正確になりました。たとえば、
find . -depth -printf '%h\n' | uniq -c | awk '$1>1000'
1000以上のファイルが含まれるリーフディレクトリ(および他のいくつか)をリストします。そのため、時間とRAMの両方で効率的に実行するPerlスクリプトを次に示します。出力は
«サブツリー内のファイル»«ディレクトリ内のファイル直接»«ディレクトリ名»
したがって、通常のツール、たとえば上記のsort(1)またはawk(1)を使用して、簡単にマッサージおよびフィルタリングできます。
#! /usr/bin/perl -w
# Written by Kjetil Torgrim Homme <kjetil.homme@redpill-linpro.com>
use strict;
use File::Find;
my %counted;
my %total;
sub count {
++$counted{$File::Find::dir};
}
sub exeunt {
my $dir = $File::Find::dir;
# Don't report leaf directories with no files
return unless $counted{$dir};
my $parent = $dir;
$parent =~ s!/[^/]*$!!;
$total{$dir} += $counted{$dir};
$total{$parent} += $total{$dir} if $parent ne $dir;
printf("%8d %8d %s\n", $total{$dir}, $counted{$dir}, $dir);
delete $counted{$dir};
delete $total{$dir};
}
die "Usage: $0 [DIRECTORY...]\n" if (@ARGV && $ARGV[0] =~ /^-/);
push(@ARGV, ".") unless @ARGV;
finddepth({ wanted => \&count, postprocess => \&exeunt}, @ARGV);