タグ付けされた質問 「utf-8」

UTF-8は、1〜4バイトのバイトシーケンスを使用して各Unicodeコードポイントを記述する文字エンコーディングです。すべてのUnicodeコードポイントの表現をサポートしながら、ASCIIとの下位互換性があります。

7
URLのUnicode文字
2010年に、大規模なWebポータルでUTF-8文字を含むURLを提供しますか? URLのRFCに従って、Unicode文字は禁止されています(こちらを参照)。標準に準拠するには、パーセントエンコードする必要があります。 ただし、私の主なポイントは、見栄えの良いURLを提供することのみを目的として、エンコードされていない文字を提供することです。 RFCの内容に関係なく、すべての主要なブラウザがこれらのURLを解析しているようです。しかし、私の一般的な印象は、Webブラウザーのドメインを離れると非常に不安定になるということです。 テキストファイル、電子メール、さらにはエンコードが異なるWebサイトにコピー+貼り付けされたURL HTTPクライアントライブラリ エキゾチックなブラウザ、RSSリーダー 私の印象はここでトラブルが予想されるということで正しいので、技術者以外のユーザーにサービスを提供していて、引用されて伝えられた場合でもすべてのリンクが適切に機能することが重要である場合、(まだ)現実的な解決策ではありませんか? HTMLで見栄えの良いURLを提供する魔法の方法はありますか http://www.example.com/düsseldorf?neighbourhood=Lörick 特殊文字はそのままコピー+貼り付けできますが、古いクライアントで再利用すると正しく機能しますか?
135 html  url  unicode  utf-8 

11
「’」が「 '」ではなくページに表示される
’の代わりに私のページに表示されています'。 私が持っているContent-TypeにセットをUTF-8私の両方に<head>タグと私のHTTPヘッダ: <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> さらに、私のブラウザは次のように設定されていUnicode (UTF-8)ます。 では、何が問題なのか、そしてどうすれば修正できるのか?
133 encoding  utf-8  mojibake 



5
Pythonで文字列によってUnicodeを宣言する理由
私はまだpythonを勉強していて、疑問があります: Python 2.6.xでは、通常、このようなファイルヘッダーでエンコードを宣言します(PEP 0263の場合と同様) # -*- coding: utf-8 -*- その後、私の文字列はいつものように書かれています: a = "A normal string without declared Unicode" しかし、Pythonプロジェクトコードを見るたびに、エンコーディングがヘッダーで宣言されていません。代わりに、次のようにすべての文字列で宣言されます。 a = u"A string with declared Unicode" 違いは何ですか?これの目的は何ですか?Python 2.6.xはデフォルトでASCIIエンコーディングを設定することを知っていますが、ヘッダー宣言によってオーバーライドできるので、文字列ごとの宣言のポイントは何ですか? 補遺:ファイルのエンコーディングと文字列のエンコーディングを混同しているようです。説明してくれてありがとう:)
122 python  encoding  utf-8 

11
Outlookで改行が自動クリーンアップされ、メール形式が台無しになる
dotnetフレームワークを使用してメールを送信しています。メッセージの作成に使用しているテンプレートは次のとおりです。 Date of Hire: %HireDate% Annual Salary: %AnnualIncome% Reason for Request: %ReasonForRequest% Name of Voluntary Employee: %FirstName% %LastName% Total Coverage Applied For: %EECoverageAmount% Guaranteed Coverage Portion: %GICoveragePortion% Amount Subject to Medical Evident: %GIOverage% Outlookでメッセージを受信すると、「このメッセージの余分な改行が削除されました」とOutlookに通知されます。そして、メッセージは次のように表示されます。 Date of Hire: 9/28/2001 Annual Salary: $100,000 Reason for Request: New Hire Name of Voluntary Employee: …
119 .net  utf-8  outlook  smtp 



4
.NETでオブジェクトをUTF-8 XMLとしてシリアル化する
適切なオブジェクトの破棄は簡潔にするために削除されましたが、これがオブジェクトをメモリ内でUTF-8としてエンコードする最も簡単な方法であるとは驚きです。より簡単な方法がなければなりませんか? var serializer = new XmlSerializer(typeof(SomeSerializableObject)); var memoryStream = new MemoryStream(); var streamWriter = new StreamWriter(memoryStream, System.Text.Encoding.UTF8); serializer.Serialize(streamWriter, entry); memoryStream.Seek(0, SeekOrigin.Begin); var streamReader = new StreamReader(memoryStream, System.Text.Encoding.UTF8); var utf8EncodedXml = streamReader.ReadToEnd();

12
Javaでの「エンコーディング用のマップできない文字」警告
私は現在、コンパイル時に次の警告を出すJavaプロジェクトに取り組んでいます。 /src/com/myco/apps/AppDBCore.java:439: warning: unmappable character for encoding UTF8 [javac] String copyright = "� 2003-2008 My Company. All rights reserved."; SOが日付の前に文字をどのようにレンダリングするかはわかりませんが、それは著作権記号である必要があり、警告の中にひし形の疑問符として表示されます。 文字が出力アーティファクトに正しく表示されることは注目に値しますが、警告は煩わしいものであり、このクラスを含むファイルは、エンコーディングを誤って保存するテキストエディターによっていつか操作される可能性があります... この文字を「著作権」文字列に挿入して、コンパイラーを満足させ、再エンコードの問題が発生することなくシンボルをファイルに保存するにはどうすればよいですか?
112 java  encoding  utf-8  ascii 

8
MySQLで名前を設定utf8?
MySQLを使用するPHPスクリプトで、以下のようなものがよく見られます query("SET NAMES utf8"); どのプロジェクトでもこれを行う必要がなかったので、いくつか基本的な質問があります。 これはPDOのみで実行されるものですか? PDO固有のものではない場合、それを行う目的は何ですか?mysqlのエンコーディングを設定していることに気づきましたが、私はそれを使用したことがなかったので、なぜそれを使用したいのですか?
110 php  mysql  utf-8 

6
PerlからUTF-8を出力するにはどうすればよいですか?
「utf8」プラグマを使用してPerlスクリプトを記述しようとしていますが、予期しない結果が発生しています。Mac OS X 10.5(Leopard)を使用しており、TextMateで編集しています。エディターとオペレーティングシステムの両方の設定はすべて、デフォルトでutf-8形式でファイルを書き込むようになっています。 しかし、以下をテキストファイルに入力し、「。pl」として保存して実行すると、ASCII以外の文字の代わりにわかりやすい「疑問符の付いたひし形」が表示されます。 #!/usr/bin/env perl -w use strict; use utf8; my $str = 'Çirçös'; print( "$str\n" ); 私が間違っていることは何か考えていますか?出力に「Çirçös」が表示されることを期待していますが、代わりに「 ir s」が表示されます。
110 perl  unicode  utf-8 

3
UTF-8の「可変幅エンコーディング」はどのように機能しますか?
ユニコード標準には、それらをすべて格納するために4バイトが必要となる十分なコードポイントが含まれています。これは、UTF-32エンコーディングが行うことです。しかし、UTF-8エンコーディングは、「可変幅エンコーディング」と呼ばれるものを使用して、これらを何らかの方法ではるかに小さなスペースに圧縮します。 実際、US-ASCIIの最初の127文字を実際のASCIIのように見えるちょうど1バイトで表すことができるので、何もしなくても多くのASCIIテキストをUTF-8であるかのように解釈できます。きちんとしたトリック。それはどのように機能するのでしょうか? 私はここで自分の質問をし、それに答えるつもりです。なぜなら、それを理解するために少し読んだだけで、誰かが時間を節約できると思ったからです。それに、もし私がそれのいくつかを間違っているなら、誰かが私を訂正してくれるかもしれません。

2
PowerShellのデフォルトの出力エンコーディングをUTF-8に変更する
既定では、コマンドの出力をファイルにリダイレクトするか、PowerShellの他の場所にパイプ処理する場合、エンコードはUTF-16であり、これは役に立ちません。UTF-8に変更したいと思っています。 >foo.txt構文をに置き換えることでケースバイケースで実行できますが| out-file foo.txt -encoding utf8、毎回繰り返す必要があるのは厄介です。 PowerShellで設定する永続的な方法は、それらを\Users\me\Documents\WindowsPowerShell\profile.ps1;に配置することです。このファイルが実際に起動時に実行されることを確認しました。 出力エンコーディングはで設定できると言われています$PSDefaultParameterValues = @{'Out-File:Encoding' = 'utf8'}が、試してみましたが効果がありませんでした。 https://blogs.msdn.microsoft.com/powershell/2006/12/11/outputencoding-to-the-rescue/について語った$OutputEncodingことは、関連するべきであるかのように一見見えますが、それは出力がエンコードされている語りますASCIIで、これは実際に起こっていることではありません。 UTF-8を使用するようにPowerShellをどのように設定しますか?

11
ruby 1.9:UTF-8の無効なバイトシーケンス
私はRuby(1.9)でクローラーを書いています。このクローラーは、多くのランダムサイトから大量のHTMLを消費します。 リンクを抽出するとき.scan(/href="(.*?)"/i)に、nokogiri / hpricot(大幅なスピードアップ)の代わりに使用することにしました。問題は、多くの " invalid byte sequence in UTF-8"エラーが発生することです。 私が理解したことから、net/httpライブラリにはエンコーディング固有のオプションがなく、入ってくるものは基本的に適切にタグ付けされていません。 その着信データを実際に処理する最良の方法は何でしょうか?.encode置換と無効なオプションを設定して試しましたが、今のところ成功していません...
109 ruby  encoding  utf-8 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.