unicodeユーティリティを試してください。
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
または、ICUパッケージのuconv
ユーティリティ:
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
recode
ユーティリティを介して情報を取得することもできます。
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
またはPerlの場合:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
これらは、グリフ全体ではなく、そのグリフを構成する文字に関する情報を提供することに注意してください。たとえば、é
(eと鋭アクセントの組み合わせ)の場合:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
スタンドアロンのé文字とは異なります:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
uconv
それらを再結合するように依頼することができます(結合されたフォームを持つものの場合):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(éは結合形式ですが、b́はありません)。
unicode
?私はそれをインストールしていないようです(Arch Linuxリポジトリで見つけることができません)。また、一体何exclarrogatif
ですか?[編集:私のシステムはフランス語ではありませんが、ここでもそれを取得します。]