特定のシェープファイルに使用される文字セットを決定する方法はありますか?
特定のシェープファイルに使用される文字セットを決定する方法はありますか?
回答:
試行錯誤。Ms ExcelまたはOpenOfficeで別の設定を使用して、すべてが正しくなるまで.dbfファイルを開いてみてください。
より多くの手がかりのためにこの投稿を見てください:https : //stackoverflow.com/questions/319095/how-do-i-determine-the-character-set-of-a-string
プログラムがシェープファイルの文字セットを決定するには、2つの方法があります。
このfile
ユーティリティは、テキストファイルのエンコーディングを推測できます。ファイルがない場合ogr2ogr
、元のエンコードを保持する変換に使用します。.cpg
ogr2ogr -f CSV file.csv file.dbf
file file.csv
出力例:
file.csv: ISO-8859 text
最も頻繁に使用される2つのエンコーディング、UTF-8とlatin1でテストしました。Ubuntuでそのまま使用できますが、OS Xについてはわかりませんfile
。Windowsのユーティリティについては知りません。
注:.cpg
エンコードを示す対応するファイルがあればすぐに、ogr2ogr
それを尊重し、出力はUTF-8になります。しかし、CSV出力が正しく見える場合、.cpg
ファイル内の情報が正確であることを知っています。
* .dbfの29バイト目をコードページに変換する別のテーブル:http : //webhelp.esri.com/arcpad/8.0/referenceguide/index.htm#locales/task_code.htm