テキストファイルのエンコード/コードページを検出する方法
私たちのアプリケーションでは、テキストファイル(受信.txt、.csv多様なソースから、など)。読み取り時、これらのファイルは別の/不明なコードページで作成されているため、ゴミが含まれる場合があります。 テキストファイルのコードページを(自動的に)検出する方法はありますか? detectEncodingFromByteOrderMarks、上のStreamReaderコンストラクタ、のために働くUTF8 と他のユニコードマークされたファイルが、私は次のように、コードページを検出する方法を探していますibm850、windows1252。 あなたの答えをありがとう、これは私がやったことです。 私たちが受け取るファイルはエンドユーザーからのものであり、コードページについての手掛かりはありません。レシーバーもエンドユーザーです。これまでに、これはコードページについて知っていることです。コードページが存在し、迷惑です。 解決: 受信したファイルをメモ帳で開き、文字化けしたテキストを確認します。誰かがフランソワか何かと呼ばれる場合、あなたの人間の知性であなたはこれを推測することができます。 ユーザーがファイルを開くために使用できる小さなアプリを作成し、正しいコードページが使用されたときにファイルに表示されることをユーザーが知っているテキストを入力しました。 すべてのコードページをループして、ユーザーが提供したテキストでソリューションを提供するコードページを表示します。 複数のコードページがポップアップする場合は、さらにテキストを指定するようユーザーに依頼します。