これは、何が起こっているのかを理解する前にもしばらくの間起こりました-これがこのようなことが起こる例の例です-(それが重要な場合、私はこのビルドに固有のものである場合、私はWindowsにいます) -
UTF-8でエンコードされたファイルがあり、Latin-1またはWindows-1252コードページでエンコードされたWebサイトのテキストをいくつか貼り付けたとします。たとえば、ウムラウト付きのO、または中かっこなどです。
これで、UTF-8でエンコードされた文字のシーケンスに続いて、UTF-8には意味がないか、誤って解釈される可能性のある文字が続きます。それを正しいUTF-8シーケンスとして解釈できない場合は、生の値として表示されます(例:8進数の\ 326(Latin-1コードページのウムラウト付きのO))。これは、UTF-8の場合、特に\ 326の後に、上位2ビットが10の何かが続くことが想定されており、そうでない場合、それをどうするかがわからないためです。
たとえば、https://www.gnu.org/software/emacs/manual/html_node/emacs/Intro.html#Introにアクセスして、「GNUの `G '」のように、中かっこを含むテキストをコピーします。そして、それをUTF-8エンコードされたバッファーに貼り付けると、「GNUの\ 221G \ 222」になります。
じゃあ何をすればいいの?
まず、さまざまなエンコーディングシステムでバッファを調べて、それらの文字が正しく表示されるかどうかを確認できます。たとえば、Windows-1252とLatin-1はかなり一般的です-
M-x revert-buffer-with-coding-system windows-1252 RET
M-x revert-buffer-with-coding-system latin-1 RET
この方法でドキュメントの見栄えが良くなった場合は、この新しいエンコーディングで保存できます。あり、多くの異なる符号化方式のはも。
UTF-8に戻すには、次のようにします。
M-x revert-buffer-with-coding-system utf-8 RET
なぜこれが発生するのかはわかりません-Emacsが何かがクリップボードにエンコードされた方法を知っていて、それに応じて翻訳しているように見えますが、そうではないようです。
詳細については、https://stackoverflow.com/questions/1543613/how-does-utf-8-variable-width-encoding-workおよびhttp://kunststube.net/encoding/を参照してください。
-*- coding: utf-8-hfs-unix;-*-
ファイルの最初の行に追加してみませんか?(gnu.org/software/emacs/manual/html_node/emacs/...)