ディレクトリに配置されているすべてのファイルのエンコーディングを見つける必要があります。使用されているエンコーディングを見つける方法はありますか?
file
コマンドは、これを実行することはできません。
私にとって興味深いエンコーディングは、ISO-8859-1です。エンコードがそれ以外の場合は、ファイルを別のディレクトリに移動します。
apropos encoding
。すべてのマンページのタイトルと説明を検索します。私は私のマシン上でこれを行うと、私はその説明から判断すると、私を助けるかもしれない3つのツールを参照してくださいchardet
、chardet3
、chardetect3
。次に、man chardet
マンページを読んでみると、それchardet
が必要なユーティリティであることがわかります。
us-ascii
ですが、中国語のコメントを1行追加すると、になりutf-8
ます。file
ファイルの内容を読んで推測することで、エンコーディングを判別できます。