タグ付けされた質問 「unicode」

Unicodeは、世界のほとんどの書記体系で表現されるテキストの一貫したエンコーディング、表現、および処理のためのコンピューティング業界標準です。

2
iconv不正な入力シーケンス-なぜですか?
テキストファイルをASCIIに変換しようとすると、エラーメッセージが表示されiconv: illegal input sequence at positionます。 私が使用するコマンドは iconv -f UTF-8 -t ascii//TRANSLIT file 問題の文字はæです。 テキストファイル自体はここにあります。 なぜ違法なシーケンスと言うのですか?入力文字は適切なUTF-8文字(U + 00E6)です。

2
vimはASCII文字のみを表示し、他のバイトをバイナリデータとして処理できますか?
私はすでに知っているvim -b、それは単一の文字として(UTF-8のような)マルチバイト文字を表示し、使用するロケールに応じて、しかし、。 vimASCIIの印刷可能文字のみを表示し、文字セットに関係なく残りをバイナリデータとして扱うようにするにはどうすればよいですか?

2
UnicodeシンボルとTrueTypeフォントをxterm / uxtermで機能させるにはどうすればよいですか?
xterm / uxterm(バージョン278)でTrueTypeフォントを使用したいのですが、Unicodeシンボルに問題があります(たとえば、表示がうまくなるので、utf8が無効になっていないか、ロケールの問題ではありません)。 $ echo -e "\xE2\x98\xA0" 次の設定でinsteadの代わりに正方形を与えます: UXTerm*faceName: Liberation Mono UXTerm*faceSize: 9 XTerm*faceName: Liberation Mono XTerm*faceSize: 9 ctrlの右クリックメニューを使用してTrueTypeフォントを無効にすると、デフォルトのフォントを使用してシンボルが正常に表示されますが、これはまったく良くありません。uxrvtを試してみましたが、十分な文字間隔がないときに同じ問題が発生しましたが、増やすと問題なく動作します。しかし、私が試した他のすべてのターミナルエミュレーターと同様に、uxrvtには他にも多くの問題がありました。誰にもアイデアがありますか?
12 fonts  xterm  unicode  ttf 

2
入力文字列のUnicodeグリフ名を印刷する方法は?
走れるようになりたい unicode-names 'abç' 対応するUnicode文字名を確認します。 LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA 文字列を一連のUnicodeグリフ名として印刷すると、いくつかの場合に役立ちます。 「i」や「í」などの混乱しやすい文字を区別します。 リテラル文字列が実際に何を含んでいるかを説明します(たとえば、印刷不可または割り当てられていない、ゼロ幅の文字)。

1
mutt:絵文字を正しく表示するには?
muttで絵文字を適切に表示したいのですが、たとえば、💗がmuttのページャーで^ Jとして表示されます。ランニング :set pager=view メッセージを再度開くと、vimで文字が正しく表示されます。 問題のメールはPGPで暗号化されていますが、暗号化されていないメール(https://groups.google.com/forum/#!topic/comp.mail.mutt/50_MpyYkXR4)でも同じだと思います。 私はこの投稿も見つけました(/programming/23526353/how-to-get-ncurses-to-output-astral-plane-unicode-characters)。これは私が遭遇している可能性のある問題を説明しています、しかし、先に述べたように、vimは同じ端末ウィンドウで文字をうまく表示します。さらに、私はglibc 2.19を使用していますが、これら2つのアプリケーションが同じシステム上で異なるバージョンのglibcをどのように使用できるのかわかりません。 muttの組み込みのポケットベルでこれらを正しく表示する方法はありますか? 編集:だから私は「mutt」と「vim」以外の関連するものを含めるのを忘れました...私はmutt-patchedパッケージでDebianの安定版を実行しています。 $ uname -r 3.16.0-4-amd64 $ lsb_release -a No LSB modules are available. Distributor ID: Debian Description: Debian GNU/Linux 8.0 (jessie) Release: 8.0 Codename: jessie $ mutt -v Mutt 1.5.23 (2014-03-12) Copyright (C) 1996-2009 Michael R. Elkins and others. Mutt comes …
11 vim  mutt  unicode 

4
lprによるutf-8エンコーディングのサポート
介してプリンタにテキストファイルを送信しようとしたときlprからxterm、コンテンツは原形をとどめないほど破損している、の原因は、最終的にファイルのエンコーディングに追跡しました。代わりにiconv(例:)を使用してテキストを処理するとiconv -f utf-8 -t ascii//TRANSLIT、ファイルは正常に印刷されます。私が遭遇したもう1つの提案は、ドキュメント形式(例:)の設定ですlpr -o document-format=text/utf8が、これはエラーを返しますlpr: Unsupported document-format "text/utf8"。lprコマンドによるエイリアスを付けて、による処理を含めることもできますiconvが、CUPS/ lprシステムでのネイティブutf-8サポートのより一般的な方法はありますか? 編集:私のOSはDebian 8で、ウィンドウマネージャーはopenbox(デスクトップ環境なし)です。MacOS XとDebian7 / Gnome3システムから問題なくこのファイルを印刷できます。 現在のシステムでは、文字エンコードをUTF-8からASCIIに変更した後でも、改行文字はによって考慮されないlprため、行が連結され、用紙のマージンに達するまで印刷されます。iconvMacOS Xでの再コーディングと音訳の後でも、印刷は正常に機能します(したがって、改行の問題は現在のシステムに固有です)。

2
UTF8数学記号とキーボードレイアウト/入力
1つのリスト、別のリストを入力するときに、UTF8数学記号を使用したいと思います。 ComposeKeyと呼ばれるものを見つけました。残念ながら、オメガ、シータ、右矢印などはカバーしていません。 KDEを使用していますが、グローバルショートカットを試しましたが、動作しないようです。 キーボードの組み合わせ(Meta + Sなど)でutf8記号(例:Θ、Ω、∃、∀、⇒、→)を入力する設定方法

3
ユーザー名の文字「ä」はLinuxシステムにバグを引き起こしますか?
ユーザー名として自分の名を使用したいのですが、文字「ä」が含まれています。このスレッドを見つけました。 いくつかの文字が無効になっている理由を理解しましたが、「ä」はどうですか?このキャラクターは問題を引き起こす可能性がありますか? 一部のユニコード文字(ü、õ、ö、ä)をフルネームで使用すると、なぜ無効になるのですか?
11 users  unicode 

2
TTFファイルで定義されているUnicodeコードポイントを確認するにはどうすればよいですか?
True Type Fontファイルで定義されている実際のグリフがどのUnicode文字にあるかを確認するプロセスを自動化する必要があります。どうやってそれを回避するのですか?テキストエディターで.ttfファイルを開いたときに表示される数値を理解する方法に関する情報が見つからないようです。
11 fonts  unicode  ttf 

4
奇妙なキャラクターを特定するにはどうすればよいですか?
私が作業しているファイルで見つけた奇妙な文字を識別しようとしています: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 ファイルはISO-8859エンコーディングを使用しており、UTF-8に変換できません。 $ iconv -f ISO-8859 -t UTF-8 file iconv: conversion from `ISO-8859' is not supported Try `iconv --help' or `iconv --usage' for more information. …

3
UTF-8 txtファイルをbashですべて大文字に変換する方法は?
すべて大文字に変換したいUTF-8 .txtファイルがあります。ASCIIだけの場合、次のように使用できます。 tr [:lower:] [:upper:] しかし、私は発音区別符号などを扱っているので、うまくいかないようです。適切なロケールを設定すればうまくいくと思いますが、このスクリプトを移植可能にする必要があります。
10 locale  unicode  text  tr 

1
Emacs:スキームモードで「ラムダ」の代わりに「λ」を挿入する方法は?
ずっと前に、「lambda」という単語を「λ」という文字に置き換えるテキストエディタ機能に出くわしました。これをemacsで実行したいと思います。私の好み: 特定のモードでのみこの機能をアクティブにしたい(たとえば、Schemeモードの場合はアクティブにしますが、Cモードの場合はオフにします)。 職場ではまだ古いバージョンのemacsを使用しているため、このソリューションはemacs22とemacs23で機能するはずです。 どうすればいいですか?
10 emacs  unicode 

2
「uniq」または「sort -u」行がどこにあるのか、いくつかのユニコード文字がある
次のコードスニペットで何が起こっていますか?期待どおりの出力が得られません。 バグだと思いますが、2つの異なるプログラム(uniqとsort)で発生するので、何か関係があるのではないかと思います。 最初の3つ(4つのうち)の例は機能しますが、4番目の例は失敗します。 すべてのキャラクターで同じ動作が期待されます。 すなわち。(入力の3行から)2行を出力するには... 4番目のケースでは、1行しか表示されません(sort -uおよびの両方uniq)。2つの同一のリンが消えるだけです! 表示をコンパクトにするために、出力「\ n」をスペースに変換しました。 私が使用していますUNIQをしてソート(GNUのcoreutilsの)7.4から... Ubuntuの10.04.3 LTSデスクトップ上で実行されています。 スクリプト: { locale -k LC_COLLATE echo for c1 in x 〼 ;do for c2 in z 〇 ;do echo -n "asis : "; echo -e "$c1\n$c2\n$c2" |tr '\n' ' ';echo echo -n "uniq : "; echo -e "$c1\n$c2\n$c2" …

2
libreoffice --convert-to csvでエンコーディングを指定する
Excelファイルは、次を使用してCSVに変換できます。 $ libreoffice --convert-to csv --headless --outdir dir file.xlsx すべてがうまく機能しているようです。ただし、エンコーディングは不安定なものに設定されています。LibreOffice Calcから「名前を付けて保存」を手動で行うと、UTF-8 mdash(—)の代わりに、\ 227( )が得られます。CSVでファイルを使用すると、「非ISO拡張ASCIIテキスト、非常に長い行」が表示されます。したがって、2つの質問: ここで一体何が起こっているのですか? libreofficeにUTF-8に変換するように指示するにはどうすればよいですか? 私が変換しようとしている特定のファイルはここにあります。

3
画面でも、端末がサポートするUnicodeの量を検出します
ここに問題があります:私の端末がまともなユニコードに対応しているかどうかを確認できるようにしたいです。 どんな種類の仮想端末でもまともなフォントが得られるので動機が生まれますが、基本的なLinuxコンソールには256または512の同時記号の文字セットがあるため、完全なフォントサポートは期待できません。 最初は$TERM、またはttyを使用できると思っていましたが、ここが落とし穴です。私はbyobuも使用しているため$TERM、常に「screen.linux」を使用します。ttyの出力もあまりわかりません/dev/pts/<some number>。「実際の」用語と仮想の用語の両方で。 $BYOBU_TTYたとえば、それが可能で/dev/tty1あり、セッションがCtrl+ Alt+で開かれF1たときに文字が表示されないが、一部のX用語から同じセッションにアタッチすると、正しく表示され、$BYOBU_TTY変更されないためです。その上、屏風があるかどうかを推定せずにこれを検出できるようにしたいと思います。 また、ロケールはすべての場合にen_US.UTF-8を示します それでも、byobuの内部であっても、どういうわけか(私がこれを検出した特定のツールの名前を示すために)一見すると、byobuセッションに接続している端末に応じて異なる出力が使用されます。 端末とttyがあまりにも一般的な検索語のように見えるため、Googleで問題が発生しています。せいぜい$TERMttyを推奨するソリューションにたどり着きます。
10 linux  terminal  tty  unicode 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.