タグ付けされた質問 「unicode」

Unicodeは、プレーンテキストのコンピューター表現の標準です。これは、あらゆる言語の人間の書記体系で使用されるすべての文字を明確に表すことを目的としたユニバーサル文字セット、Unicode変換フォーマット(UTF)、Unicodeテキストの保存と送信のための標準化されたフォーマット、およびテキストの処理と操作の標準を定義します。

3
Vim:複数(2つ以上)の言語のテキストを含むUnicodeファイルを処理する方法は?
多くの言語のテキストを持つUnicodeテキストファイルを表示できるようにするには、Vim / gVimでどの設定を行う必要がありますか? あなたはこれらの仮定をするかもしれません: 言語の数は2つ以上です。 一部の言語は中国語、日本語、韓国語です。 これらのファイルをgVim(必ずしもVimではない)で表示できれば十分です。 Windowsで動作するgVim 7.0。 これは、Unicodeで保存するとメモ帳で正常に開きますが、gVimでは意味不明なテキストとして表示されるテキストサンプルです。 This is English. 这是中文。 これは日本です。 한국입니다. ಇದು ಕನ್ನಡ.
9 vim  unicode 

1
名前は何ですか?この奇妙なRTLキャラクターはどこにありますか?
ほら、感動したと同時に混乱させたものを見つけたところです。デフォルトですべてを逆に入力できるこの奇妙な文字があります。たとえば、次のように入力した場合: "Something like this" その後、次のようになります。 ‮"Something like this" (私が意味することを理解できれば、私は自分で文を逆にする必要はなかったということです)。 私はあなたをトローリングしているように見えますが、私はそうではありません。あなたが私が言おうとしていることを確実に得られるように、特別な文字をすぐ下の別の(コード)行に貼り付けます。 ‮ それをコピーして、テキストボックスの別の場所に貼り付けて、入力を開始してください。あなたは何かを参照してくださいよ非常に奇妙な出来事を。 問題は、すべてを右から左に書く言語を強制する、このクレイジーな目に見えないキャラクターの名前は何ですか? 私が何を言おうとしているのか理解してほしい。

2
いくつかのユニコード文字が多くの大きなサイトで表示されません(このように:⁠)
私がちょうど箱として見ているいくつかのユニコード文字があります。これはChromeでのみ発生します。文字エンコーディングはUTF-8に設定されていますが、自動検出は役に立ちません。 例: [⁠] 角括弧は2つしか表示されませんが、実際にはその間にUnicode Character Worldジョイナーがあります。幅がゼロの改行しないスペースです。 また、小さなjsfiddleデモもまとめました。ワールドジョイナーのキャラクターは見えませんが、ヘアスペースは見えます。(そして、それを見るということは、実際には私がそれを見ないことを意味します。分かりますか?) これは、新しいスタイルの絵文字などを投稿した場合にも発生します。 どうすれば修正できますか? 更新: これはどこでも起こります(Twitter、Facebook、あなたはそれに名前を付けます)。特別なフォントを使用していないか、システムでフォント関連の何かを変更しました(Windows 7、64ビット)。これがうまくいくはずだと私は間違っていますか? アップデート2: これは私を狂気にさせます。まだ表示されていない非常に多くの文字があります。 例(ラッピングギフト):🎁 ご覧のとおり、デフォルトではChromeはキャラクターを表示していません。フォントをSegoe UI Symbolに明示的に設定した場合にのみ、そうします。Chromeがフォントを自動的に代替として使用しないのはなぜですか? ChromeにSegoe UI Symbolフォントを認識させるにはどうすればよいですか?

2
VIMがUTF-8コード値ではなくUnicodeコードポイントを表示するのはなぜですか?
私がPHPブログで見つけたこの想定されたコード行を考えてみてください。引用符に注意してください。 throw new Exception(“That's not a server name!”); それらの引用は 正しい二重引用符 (Unicodeコードポイント: U+201D; UTF-8の16進エンコード値 0xE2 0x80 0x9D )押す g ある VIMでは、ステータスバーに次のように表示されます。 <”> 8221, Hex 201d, Octal 20035 UTF-8コード値ではなく、Unicodeコードポイントが表示されるのはなぜですか? ファイルがUTF-8として保存されていることを考えると、 ターミナル バイトをグリフに変換すると、VIMはファイルの生の値(UTF-8コード値)を表示するので、Unicodeコードポイントに変換するのではないと思います。

2
メモ帳で表示するフォントヘブライ語、Lucida Consoleの使用を主張しているのにLucida Consoleにそれらの文字がない場合
Courier Newのキャラクターはヘブライ語の手紙aleph \ u05D0です MiriamやDavidのような他のフォントもそうします。 メモ帳に貼り付けることができます Lucida Consoleはキャラクターを持っていません。キャラクターマップは、Lucida Consoleがキャラクターを持っていないことを示しています。 Lucida Consoleフォントが設定されていてもメモ帳に表示される それでは、メモ帳で使用しているフォントは何ですか?


1
大きなテキストファイルをUTF-8から「Windows Unicode」(UTF-16)に変換するWindowsツール
Windows 7で大きなUnicodeテキストファイル(現在のバージョンは2,379,415,348バイト)を表示する必要があります。 通常、UTF-8を好みますが、SuperUserを調べた後、Windowsの最適な大規模ファイルビューアはUTF-8を処理できないようです。そのため、これらのファイルをUTF-16-LEに1回限り変換することは気にしませんより良い視聴者が登場します。 そのため、当面はエンコーディングを変換できるツールが必要です。これにはエディターを使用できないか、そのエディターでファイルを表示することに注意してください。コマンドラインまたはGUIツールのどちらでも構いません。 (ネットブックは2G RAMに制限されており、gVimでこれらのファイルを表示できることもありますが、多くのブラウザーウィンドウを開いていると、メモリを何度も使い果たすことがよくあります。すべてをRAMに入れます)

3
自分のPCにギリシャ文字を保存する
この長い語彙表(ギリシャ語の1列、それから英語の1列)をに変換する方法 このドキュメント ギリシャ文字が保存されている1つの優れたスプレッドシートに?私がコピー&ペーストしようとするときはいつでも、私はこのような結果を得ます: ajgaqov "、ajgaqhv、ajgaqovn


1
このPDFが括弧を正しくエンコードしているように見えるのに、pdftotextを使用したり、コピーアンドペーストしたりできないのはなぜですか?
いくつかの雑誌記事へのリンクは次のとおりです。 https://doi.org/10.1149/1.2183927 https://doi.org/10.1149/1.2988135 https://doi.org/10.1149/1.3021012 https://doi.org/10.1149/1.2159298 それらはすべて、括弧(および括弧などの他の文字)を誤ってエンコードします。ただし、これはテキストをテキストに変換するか、コピーして貼り付けようとする場合にのみ明らかです。たとえば、最初の記事の本文の最初の行は次のようになります。 Proton exchange membrane fuel cells (PEMFCs) have received 代わりに、Acrobat Readerからコピーして貼り付けると、 Proton exchange membrane fuel cells PEMFCs have received 「テキストとして保存」を使用すると、 Proton exchange membrane fuel cells ^CPEMFCs� have received 開き括弧がである^C場合、03 ASCII制御シーケンス、閉じ括弧はUnicode 65533、置換文字、それに続く改行です。同様に、次のようにpdf2txtエンコードします Proton exchange membrane fuel cells 共PEMFCs兲 have received (Unicode 20849および20850)およびpdftotextそれを次のようにエンコードします Proton exchange membrane fuel …

0
キーの「本名」ビットでUnicodeを使用する方法
GPGはUnicodeをサポートしているようですが、実際には動作しません % gpg --utf8-strings --display-charset utf-8 --edit-key king@example.com gpg (GnuPG) 1.4.15; Copyright (C) 2013 Free Software Foundation, Inc. This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent permitted by law. gpg: key xxxxxxxx: duplicated user ID detected - merged Secret …
4 unicode  gnupg 


1
zipアーカイブ内の破損したUnicodeファイル名を修正
同僚から私が分析する必要のあるデータのzipアーカイブを私にくれましたが、残念ながら、アーカイブの作成時または自分のマシンでの抽出時に、ファイル名が途中で破損していました。 アーカイブには、ファイル名に日本語の文字が含まれている3000個のファイルが含まれています。彼はそれをWindowsマシンで圧縮し、私はMacを使っています。アーカイブをダブルクリックすると、ファイル名は次のようになります。 0001_rt_ñºéå-ïÅí ñºéå-àÍî _ÉAÅ[ÉãÉeÉBÅ[.dat 一方、コマンドラインで 'unzip'を使用すると、同じファイルが次のようになります。 0001_rt_%FB+%C4%EE-%F2%FC%C6-%FB+%C4%EE-%EA%DB%F6-_%E2A%FC[%E2%EF%E2e%E2B%FC[.dat ファイルの内容は問題ありません(日本語の文字は含まれておらず、数字だけが含まれています)が、元のファイル名を入手する必要があります。 別の都市の別のコンピュータにある元のファイルにアクセスせずに正しいファイル名を復元する方法はありますか?それが可能であれば、私は簡単なPythonスクリプトを書くつもりですが、私は文字エンコーディングについてはあまり知りませんので、どうすればよいかわかりません。
3 macos  zip  unicode 


3
AutoHotKeyを使用してUnicode文字を簡単に入力しますか?
たとえば、→AutoHotKeyのテキスト置換機能を使用して(右矢印)入力できるようにしたいのですが、これは私のスクリプトのようです。 ::|rarr::{ASC 2192} したがって|rarr、テキストエディタで入力してヒットする, . <SPACE> <ENTER>ときなどは、テキストを→。しかし、何らかの理由で、私はこれを取得しますÉ。 通常、ASCIIおよびANSI文字に対して機能します。Unicodeでは別の方法で行う必要がありますか?もしそうなら、どのように?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.