私はtxtファイルを持っています:
$ file -i x.txt
x.txt: text/plain; charset=unknown-8bit
$ file x.txt
x.txt: Non-ISO extended-ASCII text, with CRLF line terminators
また、誤ってエンコードされた文字がいくつかあります。
trwa³y, sta³y, usuwaæ
このファイルのエンコーディングをUTF-8に変更するにはどうすればよいですか?私はこれまでに次の方法を試しました:
$ iconv -f ASCII -t UTF-8 x.txt
puiconv: illegal input sequence at position 4
どういうわけかextended ASCII
(high ASCII
)を使用する必要がありますが、iconv
のエンコードリストで見つけることができません。
iconv -f windows-1252 -t utf-8 file