PHP json_encode関数がUTF-8文字列を16進エンティティに変換するのはなぜですか?


148

多種多様な言語を扱うPHPスクリプトがあります。残念ながら、を使用しようとするjson_encodeと、Unicode出力は16進数のエンティティに変換されます。これは予想される動作ですか?出力をUTF-8文字に変換する方法はありますか?

ここに私が見ているものの例があります:

入力

echo $text;

出力

База данни грешка.

入力

json_encode($text);

出力

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

回答:


355

PHP / 5.4.0以降、というオプションがあります"JSON_UNESCAPED_UNICODE"。見てみな:

http://se2.php.net/json_encode

したがって、次のことを試してください。

json_encode( $text, JSON_UNESCAPED_UNICODE );

3
あは。ありがとう!ドキュメントをもっと注意深く読むべきだった。ありがとう。
David Jones

3
JSON_UNESCAPED_UNICODEはPHP 5.4.0で導入され、以前のバージョンでは使用できません。これを以前のバージョンで使用すると、「警告:json_encode()はパラメーター2が長いことを予期し、文字列は...で与えられます」というエラーが発生します。5.3の解決策については、以下のCertaiNの回答を参照してください。
Octavian Naicu 2014年

これはデンマーク語の文字with、æ、Ø、ø、Å、åでも機能しますありがとうございます!
ymerdrengene

素晴らしい、これが私が探していた答えでした!
ランダマイザー

2
あなたは私の命を救った。ありがとう。
Jon Zangitu 2018年

57

JSON_UNESCAPED_UNICODEは、PHPバージョン5.4以降で使用できます。
次のコードはバージョン5.3用です。

更新しました

  • html_entity_decodepack+ よりも少し効率的ですmb_convert_encoding
  • (*SKIP)(*FAIL)JSON_HEX_*フラグによってバックスラッシュ自体と指定された文字をスキップします。

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

1
\ uは\ U、つまり大文字にすべきではありませんか?
Malhal 2014年

4
PHP <5.4の素晴らしい解決策;)
qdev

ホストが5.4にアップグレードされなかったため、バージョン5.3のこのソリューションを見つけるために3日間探していました。私にとってあなたは命の恩人であり、完全であるために、これを受け入れられた回答としてマークしたいと思います!
Laci

文字列にが含まれて\\ いる場合のバグを修正しました。新しいバージョンは\\ 、よりも優先度が高くなり\uます。
mpyw 2016

これは、phpライブラリに追加する必要があります。よくやった。
ベラキ

7

あなたは文字セットとエスケープされていないユニコードを設定したい

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

4

1つの解決策は、最初にデータをエンコードしてから、同じファイルでデコードすることです。

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

1

これが、さまざまなバージョンのPHPを組み合わせた私のソリューションです。

私の会社では、さまざまなバージョンのPHPを備えたさまざまなサーバーを使用しているため、すべてのユーザーに役立つソリューションを見つける必要がありました。

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

クレジットはに行くべきマルコGasiアブ。PHP> = 5.4のソリューションは、json_encodeドキュメントで提供されています。


0

raw_json_encode()関数私の問題を解決していない(何らかの理由で、コールバック関数は、私のPHP 5.2.5サーバ上でエラーが発生しました)。

しかし、この他のソリューションは実際に機能しました。

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

クレジットはMarco Gasiに送られます。私はjson_encode()を呼び出す代わりに彼の関数を呼び出すだけです:

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}


-2

あなたが尋ねたので:

出力をUTF-8文字に変換する方法はありますか?

別の解決策は、utf8_encodeを使用することです

これは文字列をにエンコードしますUTF-8

例えば

foreach ($rows as $key => $row) {
  $rows[$key]["keyword"] = utf8_encode($row["keyword"]);
}

echo json_encode($rows);

2
これは使わないでください。PHPのドキュメントページに記載されているように、utf8_encodeは、元の文字列がISO-8859-1(Latin1)でエンコードされている場合にのみ適切です。「この文字列がutf-8でエンコードされていることを確認する」という汎用的な機能ではありません。
テロメア

-5

これは予想される動作ですか?

json_encode()唯一のUTF-8エンコードされたデータで動作します。

多分あなたはここでそれを変換するための答えを得ることができます:cyrillic-characters-in-phps-json-encode

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.