タグ付けされた質問 「ascii」

5
UTF-8よりもASCIIエンコードを選択する利点は何ですか?
ASCIIのすべての文字は、ストレージを増やすことなくUTF-8を使用してエンコードできます(どちらも1バイトのストレージが必要です)。 UTF-8には、「ASCII文字」を超える文字サポートの利点があります。その場合は、なぜ我々がします今までに UTF-8を超えるASCIIエンコードを選ぶのか? UTF-8の代わりにASCIIを選択するユースケースはありますか?

6
データベース構成に関しては、Latin-1をUTF-8で使用する必要がありますか?
私が働いている会社でMySQLを使用しており、Ruby on Railsを使用してクライアント向けアプリケーションと内部アプリケーションの両方を構築しています。 ここで働き始めたとき、私は今まで遭遇したことのない問題に遭遇しました。実稼働サーバー上のデータベースはLatin-1に設定されます。これは、ユーザーがUTF-8文字をコピーして貼り付けるユーザー入力があるたびに、MySQL gemが例外をスローすることを意味します。 私の上司は、これらのほとんどが印刷できない文字であるため、これらの「悪い文字」と呼び、それらを取り除く必要があると言います。これを行う方法はいくつかありますが、最終的にはUTF-8文字が必要な状況に陥りました。さらに、特にこの問題について読んだ唯一の解決策はデータベースをUTF-8に設定することであるように思えるので、少し面倒です(私にとって理にかなっています)。 Latin-1に固執することについて聞いた唯一の議論は、印刷できないUTF-8文字を許可すると、MySQLでテキスト/フルテキスト検索が台無しになる可能性があるということです。これは本当ですか? UTF-8ではなくLatin-1を使用する他の理由はありますか?それが優れており、よりユビキタスになることは私の理解です。

1
ASCIIテーブルの句読点が至る所にあるのはなぜですか?
ではASCIIテーブル、句読点は(非印字文字の間や数字の前に表示される!"#$%&')*+,-./数字と大文字(間、) :;<=>?@)、大文字(間[\]^_`)と小文字の文字、小文字(後{|}~)。 一見すると、これらが一緒にグループ化されることが期待されます。すべての英数字の前または後ろにある可能性があります。しかし、これは事実ではありません。それらはこれらの異なるグループに広がっています。 これはなぜですか?キャラクターがこのようにグループ化される理由はいくつかあります(歴史的な可能性がある)。
13 strings  ascii 

5
ASCII文字列をどのように少ないバイト数に圧縮しますか?
私は、他のデバイスにメッセージを送信する独自​​のプロトコルを備えた組み込みデバイスで作業しており、送信されたパケットを解析するアプリケーションを作成しています。各パケットは8バイトを運びます。プロトコルは、最初のバイトがヘッダーで、残りの7バイトがデータであると定義されています。 特定のID文字列を渡そうとしていますが、ID文字列は8文字(ASCII)であるため、7バイトに収まりません。 私の同僚が私に言ったのは、元の文字列の8バイトのASCII文字列を整数(10進数)に変換し、その4バイトを送信するということです。彼らは、4バイトから元の文字列を取得できるはずだと言った。これに頭を包むのに苦労しています。 「IO123456」のようなID文字列がある場合、それは0x49 0x4f 0x31 0x32 0x33 0x34 0x35 0x36のASCIIです。それを整数に変換して4バイトで圧縮すると、元の文字列を取得できます?何かが足りないのですか、同僚が間違っていますか?これは本当に奇妙な質問であると理解していますが、これは私にはまったく意味がありません。
12 strings  ascii  byte 
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.