UnicodeおよびASCIIの下位互換性


回答:


-1

後にANSIと呼ばれるASCIIは、バイトと文字の間に1:1の関係があります。Unicodeを含むマルチバイト文字システムには、追加のストレージを必要とする代わりに追加の文字を表示するという利点があります。さらに、マルチバイト文字システムには多くの実装があります。一部では、バイト順はBOMによって指定されます。UTF-8、UTF-16、およびUTF-32の解釈により、同じバイト文字列に対して異なる値が生成されます。さらに、「オーランド諸島」のように、A-minuscule-oを使用したスカンジナビアの実装など、アルファベットごとに異なるISO標準があります。

そのため、たとえば、単純なデータベースの目的のため、または非常に限られたストレージで使用するために、ANSIにはスペースの利点があり、誤解の影響を受けません。ただし、多くのアルファベットの完全な文字セットを表示する必要がある場合は、マルチバイトセットが便利です。


ASCIIとUnicodeには異なるストレージがあることを理解していますが、文字 "a"には
-Stribor

同じエンコードは異なるパディングのみですか?それは正確ですか?
ストライバー

1
ISO / IEC 8859-xはシングルバイト文字セットです。私は、US-ASCIIを「ANSI」と呼ぶ知識のある情報源を見たことはありません。
トーマスディッキー

1
@ThomasDickey Windowsの世界では、8ビットのデフォルトGUIコードページを示すために「ANSI」が使用されていました。適切かどうか(どちらかといえばそうではありません)が、まだ広く使用されています。たとえばmsdn.microsoft.com/en-us/library/windows/desktop/dd317752.aspxを 参照してくださいWindows code pages, commonly called "ANSI code pages"
-dxiv

2
そして、(Windowsの以外の)正しいコンテキストでANSIは意味組織 ansi.orgアイガードとworkbootsに工作機械にmagtapesから暗号化に写真フィルムに、ASCII以外のものの何千ものための標準を開発したり採用しています。
dave_thompson_085
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.