Linuxでは、多くのファイルを含むディレクトリがあります。一部には非ASCII文字がありますが、すべて有効なUTF-8です。1つのプログラムにバグがあり、ASCII以外のファイル名で機能しないため、影響を受けるファイルの数を調べる必要があります。私はこれを使ってこれを行いfind
、次にgrepを実行して非ASCII文字を出力し、次にa wc -l
を実行して数字を見つけていました。grepである必要はありません。私は、任意の標準的なUnix使用できる正規表現のように、Perlの、sedは、AWKなどを、
しかし、「ASCII文字以外の文字」の正規表現はありますか?
/[\x00-\x08\x0B\x0C\x0E-\x1F\x7F-\x9F]