Notepad ++でUnicodeテキストを編集するにはどうすればよいですか?


26

時々、Unicode文字を含む英語のテキストを編集します。何らかの理由で、私のPCでは、Notepad ++がUnicode文字を???に変換するため、テキストが破損し、すべてのデータが失われます。Unicode文字を保持しながら、このようなテキストを編集する方法を探しています。フォントとしてConsolasを使用しています。フォントにこれらの文字がすべて含まれていない場合、Notepad ++からテキストを(Windowsのクリップボードを介して)コピーすると、なぜデータが失われるのですか?


Unicodeをサポートしていないプラグインを使用している可能性がありますか?
イヴォFlipse

これらがボックス内の疑問符である場合、それは実際には欠落しているグリフのフォントのグリフであり、データは失われません
ジョーイ

いいえ、箱の中ではなく、代わりにプレーンな「?」キャラクター。確認済み。
ロビニックス

1
フォントを変更する必要がある場合があります。参照superuser.com/questions/16831/...
RamyenHead

回答:


15

ファイルが実際にUnicodeでエンコードされている場合、Notepad ++はそれを自動的に検出するはずです。Consolasフォントが私のためによく働きます。次の2つのメニューオプションのいずれかを試すことができます。

  • エンコード -> UTF-8でエンコード
  • エンコーディング -> UTF-8に変換

最初のものがあなたが望むことをするだろうと確信しています。


[書式]メニューがありません。
ヴァル

1
後世のために、あなたはエンコーディングメニューを必要とし、フォーマットしない
ケン・ベローズ

15

質問で説明されている問題は、空のドキュメントまたは新しいドキュメントが「ANSI」に設定され、Unicode文字がそこに貼り付けられたときに発生します。

空のドキュメントや新しいドキュメントで使用した場合、少なくとも私がテストしたNotepad ++のバージョン(v5.4.5)では自動検出は行われません。「ANSI」は、メニュー設定環境設定 →タブ新規文書/保存ディレクトリーを開くで設定されていない限り、新規文書のNotepad ++のデフォルトです。

溶液

解決策は、貼り付け前にエンコードをUTF-8に設定し、メニューの[ 形式] →[ UTF-8でエンコード ]を選択することです。

メニューコマンド「menu Format / Encode in UTF-8」が実行されようとしています

Wikipediaページロシア語を表示するFirefox から、新しいNotepad ++ドキュメント、ロシア語(русскийязык、russkiy yazyk)にテキストをコピーしました。

エンコードが「ANSI」から変更されていない場合、これが結果です。

Unicode文字列「ロシア語(русскийязык、russkiy yazyk)」を、デフォルトの「ANSI」からエンコードを変更せずに、新しいNotepad ++ドキュメントに貼り付けた結果。

エンコード変更された場合、これが結果です。

Unicode文字列「ロシア語(русскийязык、russkiy yazyk)」を、デフォルトの「ANSI」から「UTF-8」に変更した後、新しいNotepad ++ドキュメントに貼り付けた結果。

次の図に見られるように(キリル部分が強調表示されています)、Notepad ++は実際にUnicode文字をASCII 63(16進数3F)、疑問符に変換します。そのため、クリップボードからテキストをコピーするとUnicode文字が("ANSI"モードで)失われます(フォントの問題ではなく、情報が失われます)。

当該文書の16進表示のスクリーンショット

テスト済み:Notepad ++ v5.4.5(UNICODE)。


5

良いニュースと悪いニュースがあります。

良いニュース: Notepad ++はUnicodeをサポートしています(少なくとも私が収集できるものから)。

悪いニュース:どうやらUnicodeサポートはWindows XPでのみ行われているようです。

実際、私の前にWindowsマシンはありません。私が覚えていることから、どこかにフォーマットメニューの下にエンコードメニューがあります。Unicodeのエンコードは、実際には最も一般的にはUTF-8です。

以下は、Notepad ++でのUnicodeサポートの「きれいな」画像です。

ここに画像の説明を入力してください


3

UnicodeはWindows 7で完全に動作します。発生する唯一の問題は、変更された文字を再入力する必要があることです。それは私に起こった。私はスカンジナビア文字で書いているので、ä-> E4、ö-> F6。それらをすべて置き換えるのは苦痛ですが、それだけの価値はあります。

ANSI-> UTF-8からページをエンコードすると、文字の問題が発生します。

最初にUTF-8で新しいページを作成してから、情報をコピーして貼り付けることをお勧めします。その場合、問題は発生しません/発生しません。


1

これは私のために働いています:

PCのスタイルコンフィギュレーターでフォントをCourier Newに変更しました(Windows 7で英語/米国文字セット、非Unicodeセットのルーマニア語)。Courier New&Tahomaフォント+ UTF-8エンコーディングで動作します。


0

上部のメニューでを選択してEncodingから選択するEncode in UTF-8Encode in UTF-8 Without BOM、Unicodeエンコードのテキストを編集できます。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.