私はこの質問が古く、すでに受け入れられた回答があることを知っていますが、いくつかの例を提供したいと思います(誰かに役立つことを願っています)。
私の知る限り、古いASCII文字は1文字あたり1バイトを使用していました。
正しい。実際、ASCIIは7ビットエンコーディングであるため、128個のコード(そのうち95個は印刷可能)をサポートしているため、(意味がある場合)半バイトしか使用しません。
Unicode文字には何バイト必要ですか?
Unicodeは文字をコードポイントにマッピングするだけです。それらをエンコードする方法は定義されていません。テキストファイルにはUnicode文字は含まれていませんが、Unicode文字を表すバイト/オクテットは含まれています。
1つのUnicode文字に任意の言語のすべての可能な文字を含めることができると思います-私は正しいですか?
いいえ。しかし、ほとんど。だから基本的にはい。しかし、まだ違います。
それでは、1文字あたり何バイト必要ですか?
2番目の質問と同じです。
そして、UTF-7、UTF-6、UTF-16などはどういう意味ですか?それらはある種のUnicodeバージョンですか?
いいえ、それらはエンコーディングです。それらは、バイト/オクテットがUnicode文字をどのように表すかを定義します。
いくつかの例。それらの一部がブラウザーで表示できない場合(おそらくフォントがそれらをサポートしていないため)、に移動してhttp://codepoints.net/U+1F6AA
(1F6AA
16進数のコードポイントに置き換えます)、画像を表示します。
- U + 0061ローマ字小文字A:
a
- Nº:97
- UTF-8:61
- UTF-16:00 61
- U + 00A9著作権記号:
©
- Nº:169
- UTF-8:C2 A9
- UTF-16:00 A9
- U + 00AE登録記号:
®
- Nº:174
- UTF-8:C2 AE
- UTF-16:00 AE
- U + 1337 ETHIOPIC SYLLABLE PHWA:
ጷ
- Nº:4919
- UTF-8:E1 8C B7
- UTF-16:13 37
- U + 2014 EM DASH:
—
- Nº:8212
- UTF-8:E2 80 94
- UTF-16:20 14
- U + 2030 PER MILLE SIGN:
‰
- Nº:8240
- UTF-8:E2 80 B0
- UTF-16:20 30
- U + 20ACユーロ記号:
€
- Nº:8364
- UTF-8:E2 82 AC
- UTF-16:20 AC
- U + 2122商標記号:
™
- Nº:8482
- UTF-8:E2 84 A2
- UTF-16:21 22
- U + 2603スノーマン:
☃
- Nº:9731
- UTF-8:E2 98 83
- UTF-16:26 03
- U + 260E黒電話:
☎
- Nº:9742
- UTF-8:E2 98 8E
- UTF-16:26 0E
- U + 2614雨滴付き傘:
☔
- Nº:9748
- UTF-8:E2 98 94
- UTF-16:26 14
- U + 263Aホワイトスマイルフェイス:
☺
- Nº:9786
- UTF-8:E2 98 BA
- UTF-16:26 3A
- U + 2691ブラックフラグ:
⚑
- Nº:9873
- UTF-8:E2 9A 91
- UTF-16:26 91
- U + 269B ATOM記号:
⚛
- Nº:9883
- UTF-8:E2 9A 9B
- UTF-16:26 9B
- U + 2708飛行機:
✈
- Nº:9992
- UTF-8:E2 9C 88
- UTF-16:27 08
- U + 271Eシャドウホワイトラテンクロス:
✞
- Nº:10014
- UTF-8:E2 9C 9E
- UTF-16:27 1E
- U + 3020 POSTAL MARK FACE:
〠
- Nº:12320
- UTF-8:E3 80 A0
- UTF-16:30 20
- U + 8089 CJK統合IDEOGRAPH-8089:
肉
- Nº:32905
- UTF-8:E8 82 89
- UTF-16:80 89
- U + 1F4A9 POO OF POO:
💩
- Nº:128169
- UTF-8:F0 9F 92 A9
- UTF-16:D8 3D DC A9
- U + 1F680ロケット:
🚀
- Nº:128640
- UTF-8:F0 9F 9A 80
- UTF-16:D8 3D DE 80
よし私は夢中になっています...
おもしろ情報: