外部ソースからの〜10,000個の画像ファイルを含むディレクトリがあります。
ファイル名の多くには、DBフレンドリまたはWebフレンドリではないスペースと句読点が含まれています。また、すべてのファイル名の末尾にSKU番号を追加します(アカウンティングのため)。ほとんどではないにせよ、多くのファイル名には、SEOの目的で保持したい拡張ラテン文字も含まれています(具体的には、ファイル名がGoogleイメージのファイルの内容を正確に表しているため)
すべてのファイルの名前を希望の結果に変更(コピー)するbashスクリプトを作成しました。bashスクリプトはUTF-8で保存されます。実行後、約500個のファイルが省略されます(ファイルを統計できません...)。
私が実行したUTF-8 -t UTF-8 -f convmvをディレクトリに、これらの500個のファイル名がされて発見ない(convmvはUTF-8ですでにファイル名を検出し、無視することができます)UTF-8でエンコード
私は見つけることができます簡単な方法があるどの彼らが現在使用している言語エンコーディングは?
私が自分自身を理解できた唯一の方法は、端末エンコーディングをUTF-8に設定し、convmvで可能性のあるすべての候補エンコーディングを繰り返して、「正しいように見える」変換された名前を表示することです。これらの500個のファイルがすべて同じエンコードを使用していることを確認する方法がないため、このプロセスを500回繰り返す必要があります。「正しく見える」よりも自動化された方法が欲しいです!!!