シェープファイルの文字セットをどのように決定しますか?


回答:


9

試行錯誤。Ms ExcelまたはOpenOfficeで別の設定を使用して、すべてが正しくなるまで.dbfファイルを開いてみてください。

より多くの手がかりのためにこの投稿を見てください:https : //stackoverflow.com/questions/319095/how-do-i-determine-the-character-set-of-a-string


エンコードについて何もわからない場合は、まずlatin1またはUTF-8を試してみる価値があります。
krlmlr

MS Excelで.dbfを開くと、文字が正常に表示されます。Excelが使用/検出しているエンコーディングを確認するにはどうすればよいですか?だから私は... QGISでそれを設定することができること
user3386170

12

プログラムがシェープファイルの文字セットを決定するには、2つの方法があります。


+1 dBaseファイル形式ページへのリンクはすばらしい。ただし、知る限り、コードページはdBase III形式に含まれていませんでした。この形式のFoxPro拡張機能への参照は、すべての.dbfファイルにコードページ情報が含まれるわけではないことを示唆しています(または、ある場合は、ヘッダーの空き領域に表示されるゴミバイトの結果である可能性があります) )。しかし、この情報を掘り下げることができれば、試行錯誤の検索の良い出発点です。ところで、私たちのサイトへようこそ!
whuber

一部のpython dbfライブラリは、情報があればコードページを読み取ることができます。
パウロスカルディン

5

このfileユーティリティは、テキストファイルのエンコーディングを推測できます。ファイルがない場合ogr2ogr、元のエンコードを保持する変換に使用します.cpg

ogr2ogr -f CSV file.csv file.dbf
file file.csv

出力例:

file.csv: ISO-8859 text

最も頻繁に使用される2つのエンコーディング、UTF-8とlatin1でテストしました。Ubuntuでそのまま使用できますが、OS Xについてはわかりませんfile。Windowsのユーティリティについては知りません。

.cpgエンコードを示す対応するファイルがあればすぐに、ogr2ogrそれを尊重し、出力はUTF-8になります。しかし、CSV出力が正しく見える場合、.cpgファイル内の情報が正確であることを知っています。


弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.