タグ付けされた質問 「unicode」

Unicodeは、世界のほとんどの書記体系で表現されるテキストの一貫したエンコーディング、表現、および処理のためのコンピューティング業界標準です。

3
BOM(FF FE)で始まるファイルを処理する
FF FEBOM を含む.csvファイルを受け取りました。 $ head -n1 dotan.csv | hd 00000000 ff fe 41 00 64 00 20 00 67 00 72 00 6f 00 75 00 |..A.d. .g.r.o.u.| を使用awkして解析すると、nullバイトが大量に取得されますが、これはバイトオーダーが原因であると考えられます。このファイルのバイトオーダーを(CLIを使用して)スワップして、通常のツールがそれで動作するようにするにはどうすればよいですか? このファイルはASCII文字(BOMを除く)だけであるとgrep思いますが、バイナリファイルであるとは考えられないため、確認できません。 $ grep -P '^[\x00-\x7f]' dotan.csv Binary file dotan.csv matches VIMで同じ文字列を検索すると、一致するすべての文字が表示されます。 iconvASCIIへの変換に使用しても\ x00値は削除されません。UTF-8ではなくnullバイトのように見えるため、実際には問題がさらに悪化します。 $ iconv -f UTF-8 -t ASCII dotan.csv > …

3
すべてのパーセントエンコードされたUTF-8サブストリングをプレーンUTF-8テキストに置き換える方法は?
URLに多くの%エンコードされたUTF-8テキストを含むhtmlファイルを持っています。 たとえば、「%D1%80%D0%B5%D1%81%D1%83%D1%80%D1%81%D1%8B」は「ресурсы」(ロシア語では「リソース」)を表します。 タスクは、そのようなすべての部分文字列を読み取り可能なUTF-8テキストに置き換えることです。 タスクを簡略化するため%に、ファイルに他の符号の使用がないと見なすことができます。文字の数字は大文字と小文字の両方にすることができます。 私はこれがでエレガントに行うことができます疑いがあるsed、perl、awkまたは何かが、方法がわかりません。 このWebアプリケーションは、そこに貼り付けたテキストでトリックを行うようです。

4
双方向テキストをサポートする端末エミュレーターはありますか?
探してみたが手ぶらで出てきた。端末エミュレーターに右から左へのUnicode書記素クラスターを正しく表示させることは可能ですか? 使用例:アラビア語の文字を端末に出力するスクリプトを書いていて、現在はグリフを逆の順序で出力しているため、接続する方法が混乱し、視覚的に読みにくくなっています。

1
UTF-8文字を表示するようにbashコンソールのフォントを変更する方法
bashでUTF-8文字を正しく表示するのに問題があります。名前にアクセント付き文字が含まれているzipファイルを抽出しようとしたところ、無効なマルチバイト文字エラーが発生していました。私.bash_profileはこれで作成しました: export LANG=en_US.UTF-8 export LOCALE=UTF-8 これは抽出の問題を解決しました。しかし、コンソールはまだアクセント付き文字を正しく表示しません。Konquerorはアクセント付き文字に問題はありません。私は何をしなければなりませんか?
9 bash  unicode 

3
ミント17(シナモン):CTRL + Shift + UでUnicode記号を入力できない
この質問には簡単な答えがあると思います。私はUbuntu(Unity)の出身で、Unicode記号をCtrl+ Shift+で入力しU、その後に記号のコードとを入力するのに慣れていますEnter。 これはMint 17(シナモン)では機能しないようです。私はググってみましたが、これに対する答えは見つかりませんでした。 ユニコード記号をどのように入力しますか?

4
xtermがユニコードを表示しない
端末にユニコード記号を表示させることができませんでした。たとえば、現在のOSを使用する前に、ctrl + aをvimのギリシャ語muにマップしました。これは他のコンピューターでは機能しますが、現在のxtermでは機能しません。ここに私の関連セクションがあります.vimrc: set encoding=utf-8 "map control-a to mu imap <C-a> <C-k>m* また、Pythonでsympy方程式を出力する必要があります。これは他のコンピューターでは機能しますが、現在のxtermでは機能しません。これの代わりに: $ python Python 2.7.3 (default, Mar 14 2014, 11:57:14) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import sympy >>> x = sympy.symbols('x') >>> sympy.init_printing() >>> (sympy.sqrt(x**3/(x+1)), 1) ⎛ _______ ⎞ …
8 xterm  unicode 

1
UnicodeのサポートのためにUbuntuの/ etc / default / localeにあるにもかかわらず、ロケールでLANGを設定する方法は?
を実行しましたがUbuntu 12.04、ロケールをに設定できませんen_US.utf8。私は設定LANGの設定で/etc/default/locale説明したように、ここで。 $cat /etc/default/locale LANG=en_US.utf8 $locale LANG= LANGUAGE= LC_CTYPE="POSIX" LC_NUMERIC="POSIX" LC_TIME="POSIX" LC_COLLATE="POSIX" LC_MONETARY="POSIX" LC_MESSAGES="POSIX" LC_PAPER="POSIX" LC_NAME="POSIX" LC_ADDRESS="POSIX" LC_TELEPHONE="POSIX" LC_MEASUREMENT="POSIX" LC_IDENTIFICATION="POSIX" LC_ALL=POSIX しかし、上記のように機能しません。このLANG変数をどのように設定しますen_US.utf8か? 私が尋ねる理由は、を実行するecho -e "\x03\bb"とunicode greek letter lambda symbol正しく表示されるのですが、私の問題はemacsにあります。:emacsのでは、私はユニコードのシンボル、例えば表示できないC-x 8 RET 03bb出力\u03bb、代わりにgreek letter lambda symbol。問題はこれらのロケール設定にあると思いましたが、設定できません。 編集:問題は修正されたと思います。 $su $USER -c 'env; echo ==; locale' | egrep '==|LANG' LANG=en_US LANGUAGE=en_US == LANG=en_US …

3
リモートのRed-Hatマシンで漢字を正しく表示する方法
Ubuntu14.04を使用してリモートホストに接続しています。 そのバージョンは次のとおりです。 Linuxバージョン2.6.32-431.11.5.el6.yyyzzz.x86_64(gccバージョン4.4.7 20120313(Red Hat 4.4.7-4)(GCC))#1 SMP Thu Jul 3 09:42:34 CST 2014 そのマシンのアップロードファイルで漢字が正しく表示されません。ファイルを開き、Ubuntuでランダムに漢字を入力しますibus input method。そしてそれは示しています: ~R~V�~K~B~I~W个~I~N~T�饭~T~E オンラインで検索し、次の2つの方法を試しました。 1:ロケールを調べる It shows: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC=en_US.UTF-8 LC_TIME=en_US.UTF-8 LC_COLLATE="en_US.UTF-8" LC_MONETARY=en_US.UTF-8 LC_MESSAGES="en_US.UTF-8" LC_PAPER=en_US.UTF-8 LC_NAME=en_US.UTF-8 LC_ADDRESS=en_US.UTF-8 LC_TELEPHONE=en_US.UTF-8 LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=en_US.UTF-8 LC_ALL= 問題ないようです。 2:中国語サポートパッケージをインストールする やった: yum install "@Chinese Support" そのマシンに178Mのファイルをインストールしました。 その後、別のファイルを開き、ibusで中国語を入力してみます。しかし、問題は残っています、それをどのように解決しますか? update1 後でさらに調査を行いました。一部の文字は(ピンイン入力方式、ibusを介して)正しく入力できることがわかりました。お気に入り: 起 度 顿 客 …

1
ImageMagick(またはその他)を使用して画像をUTF-8テキストに変換
を使用して多くの単一文字の画像を作成しようとしていますconvert。その目的は、キーボードのキートップに印刷する画像をプラスチックのスペシャリストに提供することです。 ImageMagickのドキュメントは、このような何かを示唆しています: printf "\u2318" | convert -size 100x100 label:@- -font unifont-Medium command.png または echo ⌘ | convert -size 100x100 label:@- -font unifont-Medium command.png または convert -size 100x100 label:'⌘' -font unifont-Medium command.png 興味のある場所の記号を印刷することになっていますが、代わりに疑問符が表示されます。 フォントセットに実際にこのグリフが含まれていることを(を使用してcharmap)確認しましたunifont-Medium。私のシステムの他のフォントもこのグリフを提供できることを知っています。ユニフォントをインストールする前にそれを見ることができたのですが、それらの名前がわからないのです。 LaTeX(例:すべての追加機能とutf8xパッケージを含むTexLive)も使用してみましたが、サポートされている特殊文字はありません。 imagemagickやその他の特殊文字を使用して漢字を印刷することについては、フォーラムでの質問がたくさんあります。次の方法でうまくいきます。 convert -background lightblue -fill blue -pointsize 32 \ label:' é è à ù ç Ö …
弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.