タグ付けされた質問 「unicode」

Unicodeは、すべての書記体系、技術記号、句読点を組み込んだテキストに必要なすべての文字をサポートすることを目的とした、テキストのエンコード、表現、処理の標準です。

6
Python3でUnicode文字列を作成する方法
私はこれを使いました: u = unicode(text, 'utf-8') しかし、Python 3でエラーが発生する(または...何かを含めるのを忘れた可能性があります): NameError: global name 'unicode' is not defined ありがとうございました。

11
PythonでUnicode文字列をアルファベット順に並べ替える方法を教えてください。
Pythonはデフォルトでバイト値でソートします。これは、éがzおよびその他の同様に面白いものの後に来ることを意味します。Pythonでアルファベット順に並べ替える最良の方法は何ですか? このためのライブラリはありますか?何も見つかりませんでした。スウェーデン語ではåäöをzの後にソートする必要があるが、üはuなどでソートする必要があることを理解できるように、ソートには言語サポートが必要です。そのため、Unicodeサポートはほとんど要件です。 そのためのライブラリがない場合、これを行うための最良の方法は何ですか?文字から整数値へのマッピングを作成し、それを使って文字列を整数リストにマッピングしますか?



10
「似ている」Unicode文字を比較する方法は?
私は意外な問題に陥ります。 アプリケーションにテキストファイルをロードし、µの値を比較するロジックがあります。 そして、テキストが同じでも比較値がfalseであることに気付きました。 Console.WriteLine("μ".Equals("µ")); // returns false Console.WriteLine("µ".Equals("µ")); // return true 後の行で、文字µがコピーペーストされます。 ただし、このような文字はこれらだけではない可能性があります。 同じように見えても実際には異なる文字をC#で比較する方法はありますか?


3
テキストビューでユニコードで絵文字を設定する方法は?
こんにちは私は次のことをしたいと思います: ??? unicode = U+1F60A String emoji = getEmojiByUnicode(unicode) String text = "So happy " textview.setText(text + emoji); これを私のテキストビューで取得するには: とても幸せです😊 どのように実装できgetEmojiByUnicode(unicode)ますか? unicode変数はどの型にする必要がありますか?(文字列、文字、整数?) ドローアブルは使いたくないので注意してください!



13
同一の出力を生成するJavaScriptのencodeURIComponentと同等のJava?
引用符、スペース、「エキゾチック」なUnicode文字を含む文字列をエンコードし、JavaScriptのencodeURIComponent関数と同じ出力を生成するものを考え出すために、Javaコードのさまざまなビットを試してきました。 私の拷問テスト文字列は「A」B±「 Firebugに次のJavaScriptステートメントを入力すると: encodeURIComponent('"A" B ± "'); -それから私は得る: "%22A%22%20B%20%C2%B1%20%22" これが私の小さなテストJavaプログラムです: import java.io.UnsupportedEncodingException; import java.net.URLEncoder; public class EncodingTest { public static void main(String[] args) throws UnsupportedEncodingException { String s = "\"A\" B ± \""; System.out.println("URLEncoder.encode returns " + URLEncoder.encode(s, "UTF-8")); System.out.println("getBytes returns " + new String(s.getBytes("UTF-8"), "ISO-8859-1")); } } -このプログラムは以下を出力します。 URLEncoder.encodeは%22A%22 …

4
これらのUnicode結合文字はどうなっているのですか、またどのようにフィルタリングできますか?
กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ これらは最近、Facebookのコメントセクションに表示されました。 どうすればこれを消毒できますか?


5
sqlite3.ProgrammingError:8ビットのバイト文字列を解釈できるtext_factoryを使用しない限り、8ビットのバイト文字列を使用しないでください
PythonでSQLite3を使用して、UTF-8 HTMLコードのスニペットの圧縮バージョンを保存しようとしています。 コードは次のようになります。 ... c = connection.cursor() c.execute('create table blah (cid integer primary key,html blob)') ... c.execute('insert or ignore into blah values (?, ?)',(cid, zlib.compress(html))) その時点でエラーが発生します: sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly …
90 python  unicode  sqlite  zlib 

5
HTMLでのUnicode記号の表示
HTMLページにティック(✔)とクロス(✘)の記号を表示したいのですが、ボックスまたはグープとして表示されます。これは明らかにエンコーディングと関係があります。 メタタグをutf-8を表示するように設定しましたが、明らかに何かが足りません。 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 編集/解決策:行われたコメントから、FireBugを使用して、ページから渡されるヘッダーが実際には「Content-Type:text / html」であり、UTF-8ではないことがわかりました。Notepad ++を使用してファイル形式を見ると、私のファイルは「BOMなしのUTF-8」としてフォーマットされていることがわかりました。これをUTF-8だけに変更すると、シンボルが正しく表示されるようになりました...しかし、firebugは同じコンテンツタイプを示しているようです。
89 html  unicode 

6
JSON文字エンコード-UTF-8はブラウザで十分にサポートされていますか、それとも数値エスケープシーケンスを使用する必要がありますか?
私はjsonを使用してそのリソースを表すWebサービスを作成していますが、jsonをエンコードするための最良の方法について考えるのに少し行き詰まっています。json rfc(http://www.ietf.org/rfc/rfc4627.txt)を読むと、推奨されるエンコーディングがutf-8であることが明らかです。ただし、rfcは、文字を指定するための文字列エスケープメカニズムについても説明しています。これは通常、非ASCII文字をエスケープするために使用され、それによって結果のutf-8が有効なASCIIになると思います。 したがって、ASCII以外のUnicode文字(コードポイント)を含むjson文字列があるとします。私のWebサービスはそれをutf-8エンコードして返す必要がありますか、それともすべての非ASCII文字をエスケープして純粋なASCIIを返す必要がありますか? ブラウザでjsonpまたはevalを使用して結果を実行できるようにしたいと思います。それは決定に影響しますか?utf-8に対するさまざまなブラウザのjavascriptサポートに関する私の知識が不足しています。 編集:結果をエンコードする方法に関する私の主な関心事は、実際には結果のブラウザー処理に関するものであることを明確にしたいと思いました。私が読んだことは、特にJSONPを使用する場合、ブラウザーがエンコードに敏感である可能性があることを示しています。この件に関して本当に良い情報が見つからなかったので、何が起こるかを確認するためにいくつかのテストを開始する必要があります。理想的には、必要ないくつかの文字のみをエスケープし、utf-8だけで結果をエンコードしたいと思います。

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.