ソースコードで引用符付きの文字列または文字にプレーンテキストを入力でき、実際の文字を確認できるのは非常に便利です。たとえば、pi記号「π」または表意文字「𠀊」は、piの場合は同等の「\ u3c0」、表意文字の場合はL '\ u2000A'よりもはるかに優れています。
まともなエディターで、ASCII文字の場合と同じように、これらの文字を直接入力するか、コピーしてソースコードに貼り付けることができます。
具体的な例は、単語の説明が時々家に帰らないように見えるものを概念化して理解するのに役立ちます。次の簡単なコードスニペットの例のように、ソースコードに入力されたUnicode文字定数を概念化します。
const unsigned char ASCII_0X7E = (unsigned char) '~';
const unsigned short UNICODE_0X3C0 = (unsigned short) 'π';
const unsigned long UNICODE_0X2000A = (unsigned long) '𠀊';
const unsigned long UNICODE_0X2893D = (unsigned long) '𨤽';
ASCIIチルダ文字「〜」はASCIIまたはUTF-8ソースファイルに保存できますが、Unicode文字はASCII形式で保存できません。PIシンボル「π」はUnicodeコードポイント0x3c0であり、UTF-8形式で2バイト値0xcf、0x80として格納できます。Unicodeコードポイント0x2000aおよび0x2893dの表意文字には、4バイトのUTF-8シーケンスが必要です。
これらの文字が意図した値を保持し、コンパイラーがそれらを意図したとおりに解釈するためには、ソースコードをUTF-8やUTF-16などのUnicode文字セットをサポートする形式で保存する必要があります。UTF-8として保存すると、適切なコンパイラーが意図したとおりに値を理解および解釈し、適切なエディターが文字を適切にロードして表示します。
他の人が指摘しているように、ASCII範囲外の文字がソースコードに含まれていない場合、UTF-8として保存すると、ASCIIファイルの保存と何の違いもありません。 8は、ASCII文字範囲でASCIIとオーバーラップするように設計されています。ASCIIコードの範囲外の文字をソースコードに入力するとすぐに、適切なエディタから、ファイルの保存に使用するエンコーディングを選択する必要があることが通知されます。UTF-8は、ASCIIをそのまま処理でき、開発環境でサポートされているほぼすべての他の文字を処理できるため、適切な選択です。