Notepad ++出力でのSTX、SOH、およびGSの意味は何ですか?


20

電子メール(おそらく国際文字を含む)のMIMEソースを確認すると、Notepad ++に次のようなものが表示されます。

ここに画像の説明を入力してください

私はそれCRLFが復帰改行であることを理解していますが、他はどうですか?何がSOHGSと、STX意味?

回答:


19

Notepad ++は、これらの記号を使用して制御文字または非印刷文字を表します。

制御キャラクター-ウィキペディア

制御文字または非印刷文字は、文字セット内のコードポイント(数字)であり、書かれた記号を表しません。

C0およびC1制御コード-ウィキペディア

STX-テキストの開始-メッセージテキストの最初の文字。メッセージの見出しを終了するために使用できます。

SOH-ヘッダーの開始-メッセージヘッダーの最初の文字。

GS-グループ区切り-データ構造のフィールドをマークするための区切り文字として使用できます。階層レベルに使用する場合、USは最も低いレベル(プレーンテキストデータ項目を分割する)であり、RS、GS、およびFSはレベルを上げて、その下のレベルの項目で構成されるグループを分割します。


うーん...電子メールのヘッダーに印刷されない文字が含まれている理由がわかりません。「制御文字または非印刷文字は、書かれたASCIIシンボルを表さない文字セット内のコードポイント(数字)である」という意味で、以前の説明を解釈するのは正確でしょうか。
マイクB

メールヘッダーの仕様や、印刷できない文字が含まれている理由についてはよく知りません。ただし、Notepad ++は(示されているように)独自のシンボルを使用して、これらの制御文字を表示します。
スティーブン

印刷できない文字はすべて、X-Exampleヘッダー内の引用符内に表示されます。そのヘッダーは、メール標準の一部ではありません(stackoverflow.com/questions/14469110/…を参照)。電子メールを作成したクライアント、またはおそらく途中のトランスポートのいずれかによって設定されます。いずれにせよ、電子メールの処理に関する限り、それは事実上コメントであり、何でもかまいません。それはまるで誰かが封筒に小さなハートを描いたようなものです-それは郵便基準の一部ではなく、配達にはまったく影響しません。
ランディオリソン

...まあ、もちろんそれは実際に物事を壊さない限りです。UNICODE文字列が非常に長いX-ヘッダーは、トランスポートプログラムでバッファオーバーフローのバグを引き起こす可能性があり、アドレスに書かれたハートは郵便配達員を混乱させる可能性があります。しかし、理由の範囲内で、それはただ無視されます。
ランディオリソン

6

SOHStart Of Header

STXStart of teXt

GSGroup Seperator

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.