タグ付けされた質問 「utf-8」

UTF-8は、1〜4バイトのバイトシーケンスを使用して各Unicodeコードポイントを記述する文字エンコーディングです。すべてのUnicodeコードポイントの表現をサポートしながら、ASCIIとの下位互換性があります。

11
文字列をUTF-8にエンコード
「ñ」文字の文字列があり、いくつか問題があります。この文字列をUTF-8エンコーディングにエンコードする必要があります。私はこの方法で試しましたが、うまくいきません: byte ptext[] = myString.getBytes(); String value = new String(ptext, "UTF-8"); その文字列をどのようにutf-8にエンコードしますか?
190 java  utf-8 

9
JavaでUTF-8ファイルを書く方法は?
現在のコードがいくつかあり、問題はそれが1252コードページファイルを作成することです。強制的にUTF-8ファイルを作成します 私はそれが現在うまくいくと言っているように、誰かがこのコードを手伝ってくれますか...しかし、私はutfに強制的に保存する必要があります。 これは私が持っているもので、どんな助けも本当に感謝しています var out = new java.io.FileWriter( new java.io.File( path )), text = new java.lang.String( src || "" ); out.write( text, 0, text.length() ); out.flush(); out.close();
180 java  file-io  utf-8 

11
PythonでエラーなしにUnicodeをASCIIに変換する
私のコードはWebページを削って、それをUnicodeに変換するだけです。 html = urllib.urlopen(link).read() html.encode("utf8","ignore") self.response.out.write(html) しかし、私はUnicodeDecodeError: Traceback (most recent call last): File "/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appengine/ext/webapp/__init__.py", line 507, in __call__ handler.get(*groups) File "/Users/greg/clounce/main.py", line 55, in get html.encode("utf8","ignore") UnicodeDecodeError: 'ascii' codec can't decode byte 0xa0 in position 2818: ordinal not in range(128) 私はそれがHTMLがどこかに間違った形式のUnicodeの試みを含んでいることを意味すると思います。エラーが発生する代わりに、問題の原因となっているコードバイトを削除できますか?

15
OS Xでファイルエンコーディングを確認するにはどうすればよいですか?
TextMateの LaTeXファイルにUTF-8文字を入力しようとしています(デフォルトのエンコードはUTF-8と表示されています)が、LaTeXはそれらを理解していないようです。 実行cat my_file.texすると、ターミナルで文字が正しく表示されます。実行ls -alすると、今まで見たことのないものが表示されます。ファイルリストの「@」: -rw-r--r--@ 1 me users 2021 Feb 11 18:05 my_file.tex (そして、はい、私は\usepackage[utf8]{inputenc}LaTeXで使用しています。) 私は見つけましたがiconv、それはエンコーディングが何であるかを私に伝えることができないようです-それは私がそれを理解するまで変換されません。
170 macos  encoding  latex  utf-8 


14
エラーUnicodeDecodeError: 'utf-8'コーデックは位置0のバイト0xffをデコードできません:無効な開始バイト
https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools 上記サイトで「process.py」のコンパイル時にエラーが発生しました。 python tools/process.py --input_dir data -- operation resize --outp ut_dir data2/resize data/0.jpg -> data2/resize/0.png トレースバック(最新の呼び出しが最後): File "tools/process.py", line 235, in <module> main() File "tools/process.py", line 167, in main src = load(src_path) File "tools/process.py", line 113, in load contents = open(path).read() File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode (result, consumed) = self._buffer_decode(data, …
162 python  python-3.x  utf-8 


9
Djangoでユニコード文字列を保存すると、MySQLの「不正な文字列値」エラー
first_name、last_nameをDjangoのauth_userモデルに保存しようとすると、奇妙なエラーメッセージが表示されました。 失敗した例 user = User.object.create_user(username, email, password) user.first_name = u'Rytis' user.last_name = u'Slatkevičius' user.save() >>> Incorrect string value: '\xC4\x8Dius' for column 'last_name' at row 104 user.first_name = u'Валерий' user.last_name = u'Богданов' user.save() >>> Incorrect string value: '\xD0\x92\xD0\xB0\xD0\xBB...' for column 'first_name' at row 104 user.first_name = u'Krzysztof' user.last_name = u'Szukiełojć' user.save() …
158 python  mysql  django  unicode  utf-8 

6
Python文字列のu '\ ufeff'
次のパターンでエラーが発生します。 UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) 何なのかわからないu'\ufeff'、私がWebをこするときに表示されます。どうすれば状況を改善できますか?.replace()文字列のメソッドは機能しません。
152 python  unicode  utf-8 

5
OS X Lionでは、LANGがUTF-8に設定されていません。それを修正するにはどうすればよいですか?
OS X Lionでpostgressをセットアップしようとしましたが、それがLOCALE環境変数を正しくセットアップしていません。 これが設定されています: LANG= LC_COLLATE="C" LC_CTYPE="C" LC_MESSAGES="C" LC_MONETARY="C" LC_NUMERIC="C" LC_TIME="C" LC_ALL= UTF-8で何かを期待します。これは、スペイン語でのクリーンなOS X Lionセットアップです。何も動かしません。 UTF-8に設定する方法がわかりません。 端末設定で、UTF-8を確認し、機能しないにもかかわらず、LOCALEをオープンに設定します。

11
PHP:元の文字セットを認識せずに任意の文字列をUTF-8に変換するか、少なくとも試してください
私は世界中のクライアントを扱うアプリケーションを持っており、当然、データベースに送られるすべてのものをUTF-8でエンコードしたいと思っています。 私にとっての主な問題は、文字列のソースがどのエンコーディングになるかわからないということです-テキストボックスからのものである可能性があります(これ<form accept-charset="utf-8">は、ユーザーが実際にフォームを送信した場合にのみ役立ちます)。アップロードされたテキストファイルからなので、実際には入力を制御できません。 私が必要としているのは、データベースに入るものが可能な限りUTF-8でエンコードされていることを確認する関数またはクラスです。私は試しましたiconv(mb_detect_encoding($text), "UTF-8", $text); が、問題があります(入力が「fiancée」の場合、「fianc」を返します)。私はたくさんのことを試しました= / ファイルのアップロードについては、エンドユーザーに使用するエンコードを指定して、出力がどのようになるかをプレビュー表示するように依頼するのが好きですが、これは厄介なハッカーには役立ちません(実際、ハッカーに命を吹き込む可能性があります)少し簡単です)。 この件に関して他のSOの質問を読みましたが、「RSSフィードを解析する必要がある」または「Webサイトからデータをスクレイピングする」などの微妙な違いがあるようです(または、実際には「できません」)。 しかし、少なくとも良い試みがあるはずです!

6
C#で文字列をUTF-8に変換するにはどうすればよいですか?
サードパーティのアプリから受け取った文字列があり、Windows SurfaceでC#を使用して任意の言語で正しく表示したいのですが。 エンコーディングが正しくないため、私の文字列の一部はスペイン語では次のようになります。 Acción これは次のようになります。 アクシオン この質問の回答によると: C#で文字列エンコーディングを知る方法、受け取っているエンコーディングはすでにUTF-8で提供されているはずですが、Encoding.Default(おそらくANSI?)で読み取られます。 この文字列を実際のUTF-8に変換しようとしていますが、問題の1つは、Encodingクラスのサブセットしか表示できない(UTF8およびUnicodeプロパティのみ)ことです。これは、おそらくWindowsサーフェスAPIに制限されているためです。 私はインターネットで見つけたスニペットをいくつか試しましたが、東部の言語(つまり、韓国語)でこれまでに成功したと証明されたものはありません。一例は次のとおりです。 var utf8 = Encoding.UTF8; byte[] utfBytes = utf8.GetBytes(myString); myString= utf8.GetString(utfBytes, 0, utfBytes.Length); また、文字列をバイト配列に抽出してから、UTF8.GetStringを使用してみました。 byte[] myByteArray = new byte[myString.Length]; for (int ix = 0; ix < myString.Length; ++ix) { char ch = myString[ix]; myByteArray[ix] = (byte) ch; } myString = Encoding.UTF8.GetString(myByteArray, …

22
ファイルの先頭からを削除するにはどうすればよいですか?
geditを使用してそれを開くと問題なく見えるCSSファイルがありますが、それがPHPによって読み込まれると(すべてのCSSファイルを1つにマージするため)、このCSSには次の文字が付加されます::»¿ PHPはすべての空白を削除するため、コードの中央にあるランダムなが全体を混乱させます。既に述べたように、geditでファイルを開いたときにこれらの文字を実際に表示できないため、簡単に削除できません。 私は問題をググりました、そしてファイルエンコーディングに明らかに何か問題があります。それは私がftpとrsyncを介してさまざまなLinux / Windowsサーバーにファイルをシフトし、さまざまなテキストエディターを使用しているので理にかなっています。私は文字エンコーディングについてあまり知らないので、助けていただければ幸いです。 問題がなければ、ファイルはUTF-8形式で保存されており、geditではISO-8859-15形式で保存できません(ドキュメントには、指定された文字エンコードを使用してエンコードできない1つ以上の文字が含まれています)。WindowsとLinuxの行末で保存しようとしましたが、どちらも役に立ちませんでした。

11
Pythonのデフォルトのエンコーディングを変更しますか?
コンソールからアプリケーションを実行すると、Pythonで多くの「エンコードできない」および「デコードできない」問題が発生します。しかし、Eclipse PyDev IDEでは、デフォルトの文字エンコーディングはUTF-8に設定されています。 デフォルトのエンコーディングの設定を探してみたところ、Python sys.setdefaultencodingは起動時に関数を削除してしまい、使用できないと言われています。 それで、それに対する最善の解決策は何ですか?

5
UTF-8とUTF-16の違いは?
UTF-8とUTF-16の違いは?なぜこれらが必要なのですか? MessageDigest md = MessageDigest.getInstance("SHA-256"); String text = "This is some text"; md.update(text.getBytes("UTF-8")); // Change this to "UTF-16" if needed byte[] digest = md.digest();
137 java  unicode  utf-8  utf-16  utf 

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.