この質問はタイポグラフィのサイトの提案で見ましたが、答えがわからないのではと悩みました。私は常に「グリフ」と「キャラクター」を交換可能として扱いました。
Unicode Character Encoding Modelページで説明を読んだ後、私の理解は大体次のとおりです。
- 文字は、言語の意味、グリフ、外観によって定義されます。したがって、審美的に組み合わせるための合字
fi
は、1つのグリフですが、2つの文字です。
だから、私の信念は(私が間違っている場合は私を修正してください)実用的な違いは次のようになります:
- テキストの審美性に興味のないテキストパーサーは、グリフをそれぞれの文字として読み取ります。そう:
- グリフを含むテキストをコピーしてプレーンテキストエディタに貼り付けると、グリフはそれぞれの文字に変換されます(
fi
合字グリフはf
andになりますi
) - テキスト解析に基づいた適切に作成された自動化システム(検索エンジンクローラー、スクリーンリーダー、スペルチェッカー)は、グリフをそれぞれの文字として解釈します。
- 1つの文字に多数のグリフまたはグリフセットを含めることができます。1つのグリフには1つの文字しか使用できないと言いたいのですが、リンクされた記事に3つのグリフと、それぞれが文字と文字のセットに対応しているように見えるグリフセットの例があるので、これは明らかに正しくありません。私はこれがどのように機能するのかよくわかりません:確かにそれはそれらのグリフが解釈される方法に一貫性や曖昧さがあり、インタープリターによって異なることを意味しますか?(または、言語やフォントによって異なりますか?)
- グリフブラウザ(Illustratorのブラウザなど)にはフォントの完全なグリフセットが含まれていますが、文字マップ(Windowsの文字マップなど)には文字のみが含まれ、合字のような複数の文字であるグリフは含まれていません(これまで気づかなかったもの)
- グリフを含むテキストをコピーしてプレーンテキストエディタに貼り付けると、グリフはそれぞれの文字に変換されます(
だけではなく、「一つのグリフ複数の文字」ものが、また、合字と行動をコピー&ペーストすることはできません:私はほとんどそこだけど、私ははっきりと線に沿って誤解何かどこかをしたような気がかなり私が期待したもの:
- リガチャー
fi
をIllustratorからこの入力ボックスにコピーしますfi
。期待どおりに(2文字)貼り付けます。 - HTMLコードを貼り付け
fi
ます()-コードブロックにないときに合字として表示します(Fi-このフォントでは合字のようには見えませんが、半分だけを選択すると表示されます) )、およびコードブロック内のコード(fi
)、期待どおり。 - レンダリングされた非コードブロック合字をコピーして入力ボックスに貼り付けます。合字文字として貼り付けられ、コードブロック内にあるかどうかに関係なく合字としてレンダリングされます(FIおよび
fi
)。同様にそれを含む単語:適合ミスフィット(fit misfits
)適合ミスフィットとしてペースト(fit misfits
)。たぶん、貼り付けられている場所が使用されているエンコーディングを理解しているかどうかに依存しますか?
私の理解はどこまで間違っていますか?誰かが私を正しく言うことができます:グリフと文字の違いの明確な定義を述べて(私のものが間違っているか改善できる場合)、実際にそれが意味するものよりも明確/より正確な例を挙げてください?