HTMLでのUnicode記号の表示

Question 1

HTMLページにティック（✔）とクロス（✘）の記号を表示したいのですが、ボックスまたはグープとして表示されます。これは明らかにエンコーディングと関係があります。

メタタグをutf-8を表示するように設定しましたが、明らかに何かが足りません。

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

編集/解決策：行われたコメントから、FireBugを使用して、ページから渡されるヘッダーが実際には「Content-Type：text / html」であり、UTF-8ではないことがわかりました。Notepad ++を使用してファイル形式を見ると、私のファイルは「BOMなしのUTF-8」としてフォーマットされていることがわかりました。これをUTF-8だけに変更すると、シンボルが正しく表示されるようになりました...しかし、firebugは同じコンテンツタイプを示しているようです。

Question 2

HTTPサーバーのヘッダーが正しいことを確認する必要があります。

特に、ヘッダー：

Content-Type: text/html; charset=utf-8

存在する必要があります。

HTTPヘッダーが存在する場合、メタタグはブラウザによって無視されます。

また、ファイルを提供する前に、ファイルが実際にUTF-8としてエンコードされていることを確認し、以下を確認/試してください。

エディタがUTF-8として保存していることを確認してください。
FTPまたはファイル転送プログラムがファイルを台無しにしないことを確認してください。
のようなHTMLエンコードされたエンティティで試してください&#uuu;。
確かに、ファイルを16進ダンプし、文字のように見えます。✔の場合は、E2 9C94である必要があります。

注：システムがグリフを見つけられない（その文字を含むフォントがない）Unicode文字を使用する場合、ブラウザーは疑問符または記号のようなブロックを表示する必要があります。しかし、あなたのように複数のローマ字が表示される場合、これはエンコーディングの問題を示しています。

Question 3

私は答えがすでに受け入れられていることを知っていますが、いくつかのことを指摘したいと思いました。

content-typeおよびを設定することcharsetは明らかに良い習慣です。サーバー上でそれを行うことは、アプリケーション全体の一貫性を保証するため、はるかに優れています。

ただし、UTF-8アプリケーションの言語で、UTF-8文字セットでのみ使用できる文字が多数使用されている場合にのみ使用します。いずれかの場合にUnicode文字または記号を表示したい場合charsetは、ページのを変更せずに表示できます。

HTMLレンダラーは、ページで記号について言及している限り、ページのエンコード文字セットの一部ではない記号を常に表示できますnumeric character reference (NCR)。奇妙に聞こえますが、本当です。

したがって、のhtmlエンコーディングansiまたはいずれかのiso文字セットがあることを示すヘッダーがある場合でも、そのhtml文字参照を10進数で使用してチェックマークを表示できます-＆＃10003; または16進数-＆＃x2713;

そのため、ページでこの問題に直面している理由を理解するのは少し難しいです。NCR値が正しいかどうかを確認できますか？これは良いリファレンスですhttp://www.fileformat.info/info/unicode/char/2713/index.htm

Question 4

実際にファイルをUTF-8として保存するか&#nnn;、特殊文字にHTMLエンティティ（）を使用するようにしてください。

Question 5

Nicolasによって提案されたものとは異なり、metaタグは実際にはブラウザによって無視されません。ただし、Content-TypeHTTPヘッダーmetaは、ドキュメント内のタグの存在よりも常に優先されます。

したがって、HTTPヘッダーを介して正しいエンコーディングを送信するか、このHTTPヘッダーをまったく送信しないようにしてください（非推奨）。metaタグは、主にHTTPトラフィックを介して送信されていない地元の文書のためのフォールバックオプションです。

HTMLエンティティの使用も回避策と見なす必要があります。これは、実際の問題を回避するためのヒントです。Webサーバーを適切に構成することで、多くの迷惑を防ぐことができます。

Question 6

これはファイルの問題だと思います。ファイルをlatin-1のような1バイトのエンコーディングで保存しただけです。エディターをグーグルで検索し、ファイルをutf-8に設定する方法。

デフォルトでutf-8に設定されていないエディターがあるのはなぜだろうか。