タグ付けされた質問 「utf」

12
UTF-8、UTF-16、およびUTF-32
UTF-8、UTF-16、UTF-32の違いは何ですか? それらはすべてUnicodeを格納し、それぞれが文字を表すために異なるバイト数を使用することを理解しています。どちらを選択するかには利点がありますか?
487 unicode  utf-8  utf-16  utf  utf-32 


5
UTF-8とUTF-16の違いは?
UTF-8とUTF-16の違いは?なぜこれらが必要なのですか? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

15
MacとWindowsの両方のExcelでCSVファイルを正しく開くエンコーディングはどれですか?
BOMなしで、UTF-8の外部文字を含むCSVファイルをエクスポートするWebアプリがあります。WindowsとMacの両方のユーザーがExcelで文字化けを取得します。BOMでUTF-8に変換してみました。Excel / Winはそれで大丈夫です、Excel / Macは意味不明です。Excel 2003 / Win、Excel 2011 / Macを使用しています。ここに私が試したすべてのエンコーディングがあります: Encoding BOM Win Mac -------- --- ---------------------------- ------------ utf-8 -- scrambled scrambled utf-8 BOM WORKS scrambled utf-16 -- file not recognized file not recognized utf-16 BOM file not recognized Chinese gibberish utf-16LE -- file not recognized file not recognized …
137 windows  excel  macos  csv  utf 


1
C ++ 11での文字列リテラルのUnicodeエンコーディング
関連する質問に続いて、C ++ 11の新しい文字と文字列リテラルタイプについて質問したいと思います。現在、4種類の文字と5種類の文字列リテラルがあるようです。文字タイプ: char a = '\x30'; // character, no semantics wchar_t b = L'\xFFEF'; // wide character, no semantics char16_t c = u'\u00F6'; // 16-bit, assumed UTF16? char32_t d = U'\U0010FFFF'; // 32-bit, assumed UCS-4 そして文字列リテラル: char A[] = "Hello\x0A"; // byte string, "narrow encoding" wchar_t B[] = L"Hell\xF6\x0A"; …

6
Unicodeで何文字をマッピングできますか?
Unicodeで可能なすべての有効な組み合わせの数を説明付きで求めています。charは1、2、3、または4バイトとしてエンコードできることを知っています。また、その文字の開始バイトで長さがクリアされているのに、継続バイトに制限がある理由もわかりません。
82 unicode  utf-8  utf 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.