タグ付けされた質問 「text-encoding」

8
複数のUnicodeエンコーディングがあるのはなぜですか?
Unicodeは、以前の試み(ASCIIなど)のほとんどでアドレス空間(8ビット)が小さいため、多くの異なるエンコーディングを使用するという問題全体を回避するように設計されていると思いました。 では、なぜ多くのUnicodeエンコーディングがあるのですか?UTF-8、UTF-16などの(本質的に)同じバージョンの複数のバージョンでも

4
UTF-8がエンコードでいくつかのビットを浪費する理由
ウィキペディアの記事によると、UTF-8の形式は次のとおりです。 最初のコード最後のコードバイトバイト1バイト2バイト3バイト4 ポイントポイント使用済み U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx U + 10000 U + 1FFFFF 4 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx xは、このビットを使用してコードポイントを選択することを意味します。 これにより、各継続バイトで2ビット、最初のバイトで1ビットが無駄になります。UTF-8が次のようにエンコードされないのはなぜですか? 最初のコード最後のコードバイトバイト1バイト2バイト3 ポイントポイント使用済み U + 0000 U + …

4
文字列を短くするためにどのタイプのエンコードを使用できますか?
私が持っている文字列のエンコードに興味があり、使用できるエンコードの種類があり、英数字のみを含み、文字列を表すために必要な文字数を短くすることが望ましいかどうかに興味があります。 これまで、Base64エンコーディングを使用してこれを行うことを検討しましたが、文字列が長く==なるようで、回避したい場合もあります。例: テスト名| 120101 になる dGVzdCBuYW1lfDEyMDEwMQ == 16文字から24文字になり、英数字以外が含まれます。 私の要件を達成するために使用できる別の種類のエンコーディングを知っていますか?ボーナスは、.NETフレームワークに組み込まれている場合、またはエンコードを実行するサードパーティライブラリが存在する場合にポイントします。

2
電子メールの解析に関して、UTF-7はどの程度関連性がありますか?
私は最近、アプリケーションと男の子に受信メールを実装しましたが、地獄の門を開けましたか?それ以来、隔日でメールが届き、アプリが別の方法で失敗します。 それらの1つは、UTF-7としてエンコードされた電子メールです。ほとんどの電子メールは、ASCII、ラテンエンコーディングの一部、またはありがたいことにUTF-8として送信されます。 Hotmailのエラーメッセージ(メールアドレスが存在しない、割り当てが超過しているなど)は、UTF-7として送信されているようです。残念ながら、UTF-7はRubyが理解できるエンコーディングではありません。 > "hello world".encode("utf-8", "utf-7") Encoding::ConverterNotFoundError: code converter not found (UTF-7 to UTF-8) > Encoding::UTF_7 => #<Encoding:UTF-7 (dummy)> 私のアプリケーションはクラッシュせず、実際にはメールを非常にうまく処理しますが、潜在的なエラーに関する通知を送信します。 私はしばらくグーグルで過ごしましたが、少なくともRuby 1.9.3 Encoding :: Converterとしてではなく、変換を実装した人を見つけることができません。 だから、私の質問は、UTF-7で実際の人から実際のコンテンツを含む電子メールを受け取ったことがないので、そのエンコーディングはどの程度関連があるのでしょうか。安全に無視できますか?
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.