タグ付けされた質問 「encoding」

エンコーディングは、特定の表現の情報を完全に異なる表現に可逆的に変換するための一連の事前定義されたルールです。もう1つの方法はデコードと呼ばれます。このタグはかなり一般的ですが、主に、base 64や16進数などのバイナリエンコード方式に使用されます。

6
正規表現の「\ d」は数字を意味しますか?
私はそれを123と\d一致しましたが、一致1し3ませんでした2。\dどのような要件を満たす数字と一致するか疑問に思っていましたか?私はPythonスタイルの正規表現について話している。 Geditの正規表現プラグインは、Pythonスタイルの正規表現を使用しています。私はその内容が含まれているテキストファイルを作成しました 123 正規表現のみ1と3一致し\dます。2ではありません。 一般に、間に他の文字がない数字のシーケンスの場合、奇数桁のみが一致し、偶数桁は一致しません。たとえばでは12345、マッチがある1、3と5。
147 python  regex  encoding  gedit 

6
C#で文字列をUTF-8に変換するにはどうすればよいですか?
サードパーティのアプリから受け取った文字列があり、Windows SurfaceでC#を使用して任意の言語で正しく表示したいのですが。 エンコーディングが正しくないため、私の文字列の一部はスペイン語では次のようになります。 Acción これは次のようになります。 アクシオン この質問の回答によると: C#で文字列エンコーディングを知る方法、受け取っているエンコーディングはすでにUTF-8で提供されているはずですが、Encoding.Default(おそらくANSI?)で読み取られます。 この文字列を実際のUTF-8に変換しようとしていますが、問題の1つは、Encodingクラスのサブセットしか表示できない(UTF8およびUnicodeプロパティのみ)ことです。これは、おそらくWindowsサーフェスAPIに制限されているためです。 私はインターネットで見つけたスニペットをいくつか試しましたが、東部の言語(つまり、韓国語)でこれまでに成功したと証明されたものはありません。一例は次のとおりです。 var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); また、文字列をバイト配列に抽出してから、UTF8.GetStringを使用してみました。 byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString = Encoding.UTF8.GetString(myByteArray, …

11
Pythonのデフォルトのエンコーディングを変更しますか?
コンソールからアプリケーションを実行すると、Pythonで多くの「エンコードできない」および「デコードできない」問題が発生します。しかし、Eclipse PyDev IDEでは、デフォルトの文字エンコーディングはUTF-8に設定されています。 デフォルトのエンコーディングの設定を探してみたところ、Python sys.setdefaultencodingは起動時に関数を削除してしまい、使用できないと言われています。 それで、それに対する最善の解決策は何ですか?

15
Java:ストリームの正しい文字セットエンコーディングを判別する方法
次のスレッドを参照してください: Javaアプリ:iso-8859-1でエンコードされたファイルを正しく読み取ることができません 入力ストリーム/ファイルの正しい文字セットエンコーディングをプログラムで決定する最良の方法は何ですか? 私は以下を使ってみました: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); しかし、ISO8859_1でエンコードされていることがわかっているファイルでは、上記のコードはASCIIを生成しますが、これは正しくなく、ファイルのコンテンツをコンソールに正しくレンダリングできません。


6
デフォルトのエンコーディングがASCIIの場合、なぜPythonはUnicode文字を出力するのですか?
Python 2.6シェルから: >>> import sys >>> print sys.getdefaultencoding() ascii >>> print u'\xe9' é >>> 「é」文字はASCIIの一部ではなく、エンコーディングも指定していないため、printステートメントの後に意味不明またはエラーが発生するはずです。デフォルトのエンコーディングであるASCIIが何を意味するのか理解できません。 編集 編集を[ 回答]セクションに移動し、提案どおりに承認しました。

4
これはどこから来るのですか:-*-コーディング:utf-8-*-
Pythonは以下をファイルのエンコーディングを定義する命令として認識します: # -*- coding: utf-8 -*- 私は確かにこの種の指示を見ました(-*- var: value -*-)。それはどこから来たのですか?完全な仕様は何ですか?たとえば、値にスペース、特殊記号、改行、それ-*-自体を含めることができますか? 私のプログラムはプレーンテキストファイルを書き込みますが、この形式を使用してそれらにメタデータを含めたいと思います。
135 python  file  text  encoding  emacs 

7
C#にはJavaScriptのencodeURIComponent()と同等のものはありますか?
JavaScriptの場合: encodeURIComponent("©√") == "%C2%A9%E2%88%9A" C#アプリケーションに相当するものはありますか?私が使用したHTML文字をエスケープするために: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"&#" + ((int)m.Value[0]).ToString() + ";"); しかし、JSが使用する正しい16進形式に一致を変換する方法がわかりません。たとえば、次のコード: txtOut.Text = Regex.Replace(txtIn.Text, @"[\u0080-\uFFFF]", m => @"%" + String.Format("{0:x}", ((int)m.Value[0]))); 戻り値" %a9%221a"について"©√"代わりにを"%C2%A9%E2%88%9A"。文字列をバイトなどに分割する必要があるようです。 編集:これは、Windowsのアプリ、アイテムのみ利用可能であるためにSystem.Web:あるAspNetHostingPermission、AspNetHostingPermissionAttributeとAspNetHostingPermissionLevel。

11
「’」が「 '」ではなくページに表示される
’の代わりに私のページに表示されています'。 私が持っているContent-TypeにセットをUTF-8私の両方に<head>タグと私のHTTPヘッダ: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> さらに、私のブラウザは次のように設定されていUnicode (UTF-8)ます。 では、何が問題なのか、そしてどうすれば修正できるのか?
133 encoding  utf-8  mojibake 

10
URLにスペースを含めることはできますか?
URI(具体的にはHTTP URL)に1つ以上のスペース文字を含めることはできますか?URL がエンコードするがある+単に一般的な慣習に従っているか、それとも正当な代替案ですか? 特に、スペースのあるURLはエンコードする必要があることを示すRFCを誰かが指摘できますか? 質問の動機: Webサイトのベータテスト中に、一部のURLにスペースが含まれていることに気付きました。Firefoxは正しいことをしているようだったので、驚いた!しかし、開発者がRFCを参照できるようにして、開発者がそれらのURLを修正する必要性を感じられるようにしたいと思いました。
132 html  http  url  encoding 

6
Java FileReaderエンコーディングの問題
java.io.FileReaderを使用していくつかのテキストファイルを読み取って文字列に変換しようとしましたが、結果が正しくエンコードされておらず、まったく読み取れません。 これが私の環境です: Windows 2003、OSエンコーディング:CP1252 Java 5.0 私のファイルはUTF-8エンコードまたはCP1252エンコードされており、一部のファイル(UTF-8エンコードファイル)には中国語(非ラテン)文字が含まれている場合があります。 次のコードを使用して作業を行います。 private static String readFileAsString(String filePath) throws java.io.IOException{ StringBuffer fileData = new StringBuffer(1000); FileReader reader = new FileReader(filePath); //System.out.println(reader.getEncoding()); BufferedReader reader = new BufferedReader(reader); char[] buf = new char[1024]; int numRead=0; while((numRead=reader.read(buf)) != -1){ String readData = String.valueOf(buf, 0, numRead); fileData.append(readData); buf = …
130 java  file  unicode  encoding 

9
C#で文字列のエンコードを決定する
C#で文字列のエンコーディングを決定する方法はありますか? たとえば、ファイル名の文字列がありますが、それがUnicode UTF-16でエンコードされているのか、システムのデフォルトのエンコードでエンコードされているのかわかりません。どうすれば確認できますか?
127 c#  string  encoding 


9
SQL Server 2005 T-SQLでのBase64エンコーディング
文字列をBase64文字列としてエンコードするT-SQLクエリを記述したいと思います。驚いたことに、Base64エンコーディングを実行するためのネイティブT-SQL関数が見つかりません。ネイティブ関数はありますか?そうでない場合、T-SQLでBase64エンコーディングを行うための最良の方法は何ですか?

5
Pythonで文字列によってUnicodeを宣言する理由
私はまだpythonを勉強していて、疑問があります: Python 2.6.xでは、通常、このようなファイルヘッダーでエンコードを宣言します(PEP 0263の場合と同様) # -*- coding: utf-8 -*- その後、私の文字列はいつものように書かれています: a = "A normal string without declared Unicode" しかし、Pythonプロジェクトコードを見るたびに、エンコーディングがヘッダーで宣言されていません。代わりに、次のようにすべての文字列で宣言されます。 a = u"A string with declared Unicode" 違いは何ですか?これの目的は何ですか?Python 2.6.xはデフォルトでASCIIエンコーディングを設定することを知っていますが、ヘッダー宣言によってオーバーライドできるので、文字列ごとの宣言のポイントは何ですか? 補遺:ファイルのエンコーディングと文字列のエンコーディングを混同しているようです。説明してくれてありがとう:)
122 python  encoding  utf-8 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.