タグ付けされた質問 「character-encoding」

文字エンコードとは、文字が一連のバイトとして表される方法を指します。Webの文字エンコーディングは、Encoding Standardで定義されています。

6
C#で文字列をUTF-8に変換するにはどうすればよいですか?
サードパーティのアプリから受け取った文字列があり、Windows SurfaceでC#を使用して任意の言語で正しく表示したいのですが。 エンコーディングが正しくないため、私の文字列の一部はスペイン語では次のようになります。 Acción これは次のようになります。 アクシオン この質問の回答によると: C#で文字列エンコーディングを知る方法、受け取っているエンコーディングはすでにUTF-8で提供されているはずですが、Encoding.Default(おそらくANSI?)で読み取られます。 この文字列を実際のUTF-8に変換しようとしていますが、問題の1つは、Encodingクラスのサブセットしか表示できない(UTF8およびUnicodeプロパティのみ)ことです。これは、おそらくWindowsサーフェスAPIに制限されているためです。 私はインターネットで見つけたスニペットをいくつか試しましたが、東部の言語(つまり、韓国語)でこれまでに成功したと証明されたものはありません。一例は次のとおりです。 var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); また、文字列をバイト配列に抽出してから、UTF8.GetStringを使用してみました。 byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString = Encoding.UTF8.GetString(myByteArray, …

22
ファイルの先頭からを削除するにはどうすればよいですか?
geditを使用してそれを開くと問題なく見えるCSSファイルがありますが、それがPHPによって読み込まれると(すべてのCSSファイルを1つにマージするため)、このCSSには次の文字が付加されます::»¿ PHPはすべての空白を削除するため、コードの中央にあるランダムなが全体を混乱させます。既に述べたように、geditでファイルを開いたときにこれらの文字を実際に表示できないため、簡単に削除できません。 私は問題をググりました、そしてファイルエンコーディングに明らかに何か問題があります。それは私がftpとrsyncを介してさまざまなLinux / Windowsサーバーにファイルをシフトし、さまざまなテキストエディターを使用しているので理にかなっています。私は文字エンコーディングについてあまり知らないので、助けていただければ幸いです。 問題がなければ、ファイルはUTF-8形式で保存されており、geditではISO-8859-15形式で保存できません(ドキュメントには、指定された文字エンコードを使用してエンコードできない1つ以上の文字が含まれています)。WindowsとLinuxの行末で保存しようとしましたが、どちらも役に立ちませんでした。

8
gitにUTF-16ファイルをテキストとして認識させることはできますか?
Virtual PC仮想マシンファイル(* .vmc)をgitで追跡していますが、変更を加えた後、gitはファイルをバイナリとして識別し、差分を表示しません。ファイルがUTF-16でエンコードされていることを発見しました。 このファイルがテキストであることを認識し、適切に処理するようにgitを教えることができますか? Cygwinでgitを使用していますが、core.autocrlfをfalseに設定しています。必要に応じて、UNIXでmSysGitまたはgitを使用できます。

15
Java:ストリームの正しい文字セットエンコーディングを判別する方法
次のスレッドを参照してください: Javaアプリ:iso-8859-1でエンコードされたファイルを正しく読み取ることができません 入力ストリーム/ファイルの正しい文字セットエンコーディングをプログラムで決定する最良の方法は何ですか? 私は以下を使ってみました: File in = new File(args[0]); InputStreamReader r = new InputStreamReader(new FileInputStream(in)); System.out.println(r.getEncoding()); しかし、ISO8859_1でエンコードされていることがわかっているファイルでは、上記のコードはASCIIを生成しますが、これは正しくなく、ファイルのコンテンツをコンソールに正しくレンダリングできません。

12
ApacheのデフォルトのエンコーディングをUTF-8に変更するにはどうすればよいですか?
私はホスティング会社を使用しています。ファイルindex.htmlがそこにない場合、ディレクトリにファイルがリストされます。デフォルトのエンコードとしてiso-8859-1が使用されます。 サーバーがApacheの場合、代わりにUTF-8をデフォルトとして設定する方法はありますか? 更新:さらに、実際にはHTML 3.2のDOCTYPEを使用しているため、文字セットがまったくないことがわかりました。そのため、エンコーディングは設定されていません。しかし、UTF-8を使用するように変更する方法はありますか?


16
Spring MVC(@ResponseBody)で応答コンテンツタイプを設定する人
私は注釈付きのSpring MVC Java Webアプリケーションを突堤Webサーバー(現在はMaven Jetty Plugin)で実行しています。 文字列ヘルプテキストだけを返す1つのコントローラーメソッドでAJAXサポートを実行しようとしています。リソースはUTF-8エンコーディングであり、文字列もそうですが、サーバーからの応答には content-encoding: text/plain;charset=ISO-8859-1 ブラウザが送信したときでも Accept-Charset windows-1250,utf-8;q=0.7,*;q=0.7 どういうわけか春のデフォルト構成を使用しています このBeanを構成に追加するためのヒントを見つけましたが、エンコーディングをサポートしておらず、代わりにデフォルトのBeanが使用されているため、使用されていないと思います。 <bean class="org.springframework.http.converter.StringHttpMessageConverter"> <property name="supportedMediaTypes" value="text/plain;charset=UTF-8" /> </bean> 私のコントローラーコードは(この応答タイプの変更は私には機能しないことに注意してください): @RequestMapping(value = "ajax/gethelp") public @ResponseBody String handleGetHelp(Locale loc, String code, HttpServletResponse response) { log.debug("Getting help for code: " + code); response.setContentType("text/plain;charset=UTF-8"); String help = messageSource.getMessage(code, null, loc); log.debug("Help …




3
UTF-8の「可変幅エンコーディング」はどのように機能しますか?
ユニコード標準には、それらをすべて格納するために4バイトが必要となる十分なコードポイントが含まれています。これは、UTF-32エンコーディングが行うことです。しかし、UTF-8エンコーディングは、「可変幅エンコーディング」と呼ばれるものを使用して、これらを何らかの方法ではるかに小さなスペースに圧縮します。 実際、US-ASCIIの最初の127文字を実際のASCIIのように見えるちょうど1バイトで表すことができるので、何もしなくても多くのASCIIテキストをUTF-8であるかのように解釈できます。きちんとしたトリック。それはどのように機能するのでしょうか? 私はここで自分の質問をし、それに答えるつもりです。なぜなら、それを理解するために少し読んだだけで、誰かが時間を節約できると思ったからです。それに、もし私がそれのいくつかを間違っているなら、誰かが私を訂正してくれるかもしれません。

2
PowerShellのデフォルトの出力エンコーディングをUTF-8に変更する
既定では、コマンドの出力をファイルにリダイレクトするか、PowerShellの他の場所にパイプ処理する場合、エンコードはUTF-16であり、これは役に立ちません。UTF-8に変更したいと思っています。 >foo.txt構文をに置き換えることでケースバイケースで実行できますが| out-file foo.txt -encoding utf8、毎回繰り返す必要があるのは厄介です。 PowerShellで設定する永続的な方法は、それらを\Users\me\Documents\WindowsPowerShell\profile.ps1;に配置することです。このファイルが実際に起動時に実行されることを確認しました。 出力エンコーディングはで設定できると言われています$PSDefaultParameterValues = @{'Out-File:Encoding' = 'utf8'}が、試してみましたが効果がありませんでした。 https://blogs.msdn.microsoft.com/powershell/2006/12/11/outputencoding-to-the-rescue/について語った$OutputEncodingことは、関連するべきであるかのように一見見えますが、それは出力がエンコードされている語りますASCIIで、これは実際に起こっていることではありません。 UTF-8を使用するようにPowerShellをどのように設定しますか?

5
Unicode文字をURLエンコードする適切な方法は何ですか?
非標準の%uxxxxスキームを知っていますが、このスキームはW3Cによって拒否されているため、賢明な選択とは思えません。 いくつかの興味深い例: ハートのキャラクター。これをブラウザに入力すると: http://www.google.com/search?q=♥ 次に、コピーして貼り付けます。このURLが表示されます http://www.google.com/search?q=%E2%99%A5 これにより、Firefox(またはSafari)がこれを実行しているように見えます。 urllib.quote_plus(x.encode("latin-1")) '%E2%99%A5' トリプルドット文字のように、Latin-1でエンコードできないものを除いて、これは理にかなっています。 … URLを入力すると http://www.google.com/search?q=… ブラウザにコピーして貼り付けます http://www.google.com/search?q=%E2%80%A6 バック。それはやっての結果のようです urllib.quote_plus(x.encode("utf-8")) …Latin-1でエンコードできないため、これは理にかなっています。 しかし、ブラウザがUTF-8とLatin-1のどちらでデコードするかをどのように判断するかは、はっきりしていません。 これはあいまいなようですので: In [67]: u"…".encode('utf-8').decode('latin-1') Out[67]: u'\xc3\xa2\xc2\x80\xc2\xa6' 動作するので、ブラウザがUTF-8またはLatin-1のいずれでデコードするかをブラウザがどのように判断するのかわかりません。 処理する必要がある特殊文字をどのように処理すればよいですか?

11
java.sql.SQLException:不正な文字列値: '\ xF0 \ x9F \ x91 \ xBD \ xF0 \ x9F…'
次の文字列値があります: "walmart obama👽💔" MySQLとJavaを使用しています。 次の例外が発生します: `java.sql.SQLException:Incorrect string value: '\ xF0 \ x9F \ x91 \ xBD \ xF0 \ x9F ...' ここに私が挿入しようとしている変数があります: var1 varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL` 「ウォルマートオバマ👽💔」を挿入しようとしている私のJavaコードは、preparedStatementです。だから私はsetString()メソッドを使用しています。 問題は値のエンコードですis。どうすれば修正できますか?以前はDerby SQLを使用していて、値👽💔が2平方フィートになった(これはnull文字の表現だと思う) すべての助けに大歓迎です!

6
の意味-<?xml version =“ 1.0” encoding =“ utf-8”?>
私はXMLを初めて使用し、基本を理解しようとしています。以下の「XMLの学習」の行を読みましたが、それでもはっきりしません。これらの基本を明確に説明している本やウェブサイトを誰かに教えてもらえますか? 学習XMLから: XML宣言は、ドキュメントの最も一般的なプロパティのいくつかを説明し、このドキュメントを解釈するにはXMLパーサーが必要であることをXMLプロセッサに伝えます。 これは何を意味するのでしょうか? 私はそのxml version部分を理解しています-docとdocのユーザーの両方が同じバージョンのXMLで「話す」必要があります。しかし、そのencoding部分はどうですか?なぜそれが必要なのですか?

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.