マウントされたハードドライブfile name
に3種類のエンコーディングがありますreiserfs
:CP1251、KOI-8、UTF-8、ASCII。すべてのエンコーディングを再帰的にUTF-8に変換する必要があります。ソースエンコーディングを検出してUTF-8に変換するユーティリティはありますか、それともPythonスクリプトを記述する必要がありますか?
一般的なケースでは、名前のエンコーディングを自動的に「推測」することはできません(たとえば、ほとんどのバイトシーケンスは有効なKOI-8およびCP1251(ただし差分)ファイル名です)。名前のエンコーディングを知る手がかりはありますか?
他の手がかりはありません:(
—
Pablo
はい、小文字と(すべて)の両方のファイル名を持っています。
—
Pablo
困っている人はいますか?チェックしてください
—
Alwin Kesler
detox
。ISO-8859-1とUTF-8の間で次の方法を使用して動作しました-s iso8859_1-only