全般
これらの文字は、通常のラテンアルファベットテキストではなく、音声記号、キリルアルファベットテキスト、数学記号(変数を表す)などとして使用するためのものです。基本的なラテンアルファベットでテキストをエンコードする唯一のUnicode準拠の方法は、この目的のために主に使用される文字を使用することです(つまり、Basic Latin Unicodeブロックから)。
他の多くの標準と同様に、Unicodeの違反についてよく考えてください。また、Unicodeは非常に多くの書記体系、ユースケースを含み、そしてちょうど他の規格との後方互換性のために存在するもの1、完全にそのすべての動機を理解し、独自の科学です。簡単に言えば、自分が何をしているのかを本当に理解していない限り、リモートでさえ考えていなかった何かが壊れる可能性が非常に高くなります。
具体例
アクセシビリティ
エンコードされたテキストは、一部のフォントでレンダリングされるためだけに存在するわけではありません。また、スクリーンリーダーなどで解釈することもできます。また、スクリーンリーダーは次のことを推測する必要はありません。
𝓽𝓱𝓮
は、定冠詞または変数𝓽、𝓱、およびmathematicalの数学的積2であることを意味します。したがって、最良の動作は、これらの文字を綴ることです。たとえば、文字通り次のように言います。
大胆なスクリプト小t、大胆なスクリプト小h、大胆なスクリプト小e
代わりに「the」を言うべきではありません。シンボルが発音可能な単語を形成する数学テキストを適切に読み取れないからです。3
移植性
あなたのテキストがあなたのマシンでうまくレンダリングされていれば、これはそれが読者のテキストにもあることを意味しません。最も明白な例は、読者がこれらの文字をサポートするフォントを持っていないか、代替フォントをサポートしていないソフトウェアによってテキストがレンダリングされることです。確かに、これはますます一般的ではなくなりつつあります。失読症のような人の中には、これらの文字をサポートする可能性が低い特別なフォントを必要とする人がいることに留意してください。
しかし、読者のマシンが異なるフォントのみを使用している場合でも、これによりテキストがかなり読みにくくなる可能性があります。以下のために最初の例は、これは𝓉𝒽ℯ2種類のフォントでレンダリングされます。
Free Serifは、特殊文字を使用してテキストをシミュレートする場合、つまり連続したストロークで手書き文字をシミュレートする場合に、おそらくレンダリングされるテキストをレンダリングします。ただし、これらの文字は数学記号として使用するために作成されており、接続することは意味がありません。したがって、数学的な目的のために特別に設計されたSTIXによるレンダリングは、これらの文字がどのように使用されることを意図しているかにより一致しています。
では第二の例、あなたや読者が何らかの理由で「сᴜтмyвᴀʀ」をitaliciseとします。良いフォントを使用すると、4が得られます。
これは、スモールキャップが(部分的に)キリル文字でシミュレートされており、キリルイタリックが直立した文字とは大きく異なる場合があるためです。繰り返しますが、これは適切な動作です。
検索可能性
最初の例として、文字𝒲(数学スクリプトW)を使用して合理的な検索を行う場合を考えます。検索には2つのモード、デフォルトモードと正確なモード(通常は大文字と小文字を区別する)があると仮定します。この文字は次のとおりです。
デフォルトモードでwまたはWを検索したときに見つかりました-特殊文字を検索フィールドに入力したりコピーペーストしたりしたくない人のために。
正確なモードでforを検索したときに見つかりました-数学文書で対応する変数が言及されている場所を検索したい人向け³
上記と同様の検索を中断するために、正確モードで𝓌、wまたはWを検索する場合は見つかりません。
ただし、この文字を使用して通常のテキストをシミュレートする場合、Wまたはforを正確モードで検索すると検出されるはずです。これは上記と競合します。
2番目の例として、ラテン文字を検索するときはキリル文字は絶対に見つけられないことを検討してください。ただし、キリル文字を使用してラテン語のスモールキャップをシミュレートする場合、検索可能性を壊したくない場合は、これを行う必要があります。これにより、人気のあるキリル文字(またはその逆)の偽のスモールキャップに偶然一致するまれなラテン文字を検索すると、人々は多くの無駄なものを見つけることになります。
これらのアルファベットの他の目的のために予約されているため、正確な検索オプションではこの問題を解決できません。
一般に、特殊文字を使用してスタイル付きラテンテキストをシミュレートしても破損しない検索(非常識な量のオプションなし)を構築することは不可能です。
1 あなたは、XKCDが標準を統一することの避けられない失敗について知っていますか?さて、Unicodeは成功しました。
2 または空の演算子が適切な慣習にあるもの
3 現在、このエンコードまたはそれに互換性のあるものをサポートしている数学テキストは非常に少ないことを知っていますが、ポイントはいつかできることです。Unicodeを乱用するテキストがまだ残っていて、読んでいる可能性があります。
4 マケドニア語またはセルビア語にローカライズしている場合を除き、異なる場合でも、望ましくない結果が得られます。