これらは、主に日本で開発されているスクリプト言語RubyのUTF-8または別のUnicode表現をデフォルトの文字エンコーディングにしないことを私が覚えていた理由です。
- 理由1:ハン統一。中国、韓国、日本に使用されている文字セット(ここで「アルファベット」が正しいかどうかはわかりません)は共通の歴史から発展したもので、詳細はわかりません。Unicodeコンソーシアムは、3つの言語すべてで外観が異なっていても、単一のUnicodeコードポイントのみを使用して、歴史的な同じ文字のすべてのバリアント(中国語、日本語、韓国語)をエンコードすることを決定しました。その理由は、テキストの表示に使用されるフォントによって外観を決定する必要があるということです。
どうやら、この推論は、ラテン語のアルファベットがギリシャ語のアルファベットから発展したので、ギリシャ語のアルファの単一のコードポイントを持っているだけで十分であると英語の読者に主張するのと同じくらい、日本のユーザーにとってばかげていると思われますα」およびラテン語「a」。使用するフォントによって外観を決定します。(「β」=「b」、「γ」=「g」などに同じ)
(スタックエクスチェンジの場合、ギリシャ文字をここに含めることはできないことに注意してください。)
- 理由2:非効率的な文字変換。
文字をUnicodeから従来の日本語エンコーディングに変換し、逆変換するにはテーブルが必要です。つまり、Unicodeコードポイント値から従来のコードポイント値へ、またはその逆への単純な計算はありません。また、あるエンコーディングのすべてのコードポイントが他のエンコーディングで一意の表現を持っているわけではないため、変換時に情報がいくらか失われます。
私はもう覚えていないというより多くの理由が与えられたかもしれません。