JSONで改行を処理するにはどうすればよいですか?


289

私はいくつかのJSONを生成し、それをJavaScriptのオブジェクトにプルしようとしています。エラーが発生し続けます。ここに私が持っているものがあります:

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = eval('('+data+')');

これは私にエラーを与えます:

unterminated string literal

を使用するとJSON.parse(data)、同様のエラーメッセージが表示されます:Unexpected token ↵Chromeでは「unterminated string literal」、FirefoxとIEでは「」。

取り出した\nsometextはどちらの場合もエラーはなくなります。私は理由を把握することができないよう\nになりをevalしてJSON.parse失敗します。


19
evalの代わりに実際のjsonパーサーを使用してみてください。
Eric

回答:


368

これはあなたが望むものだと思います:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}';

(文字列の「\」をエスケープする必要があります(それを二重の「\」に変換します)。そうしないと、JSONデータではなく、JSONソースの改行になります。)


101
これはもちろん正しいですが、これを行う必要がある理由を追加したいと思います。ietf.org/ rfc / rfc4627.txtのJSON仕様には、セクション2.5にこの文が含まれています。「すべてのUnicode文字は、エスケープする必要がある文字を除く引用符:引用符、逆ソリダス、および制御文字(U + 0000からU + 001F)。」改行は制御文字であるため、エスケープする必要があります。
ダニエル・カルマン2013

1
www.json.orgによると、JSONは文字列の制御シーケンス "\ n"を受け入れます-JSON.parse(['"a \\ na"'])[1] .charCodeAt();を試した場合 それは10を示します-私が最後にチェックしたのは「ラインフィード」でした。---ところで:悲鳴を止める!
BlaM 2015

+ 1. JSONエンコーディングを理解するのに苦労していましたが、「JSONデータではなく、JSONソースの改行になります」とわかりました。
amucunguzi

44

あなたは置き換え機能持っている必要があります\n\\nする場合にはdata、文字列リテラルではありませんが。

function jsonEscape(str)  {
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
}

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = JSON.parse(jsonEscape(data));

結果dataObj

Object {count: 1, stack: "sometext\n\n"}

3
エスケープ文字(つまり.replace("\\n", "\\\\n"))をエスケープする必要があります。また、正規表現を使用して複数のインスタンス(つまり.replace(/\n/g, "\\\\n"))を置換できるようにすることもお勧めします
musefan

2
なぜエスケープ文字をエスケープする必要があるのですか?というようなもの.replace("\n", "\\n")でうまくいくはずです!! たとえば、次のvar test = [{"description":"Some description about the product. This can be multi-line text."}]; console.log(JSON.parse(test.replace(/\n/g, "\\n")));ようにオブジェクトをブラウザコンソールに完全に正常に出力します[{"description":"Some description about the product.\nThis can be multi-line text."}]
Fr0zenFyr

ところで、上記のコメントでは、元のJSON文字列に改行が含まれています。この行は、stackoverflowのコメントフォーマッタによって削除されます。置換後の最終出力\nでは、値に改行文字が挿入されることがわかります。
Fr0zenFyr 2015年

1
-1この回答は、最初に無効なJSONの文字列を作成し(改行は制御文字であるため)、一連の不完全な置換(3つ以上の制御文字がある)でそれを修正しようとします。そして、それを補うために、eval関数を使用することもできます。17票???
フィル

1
エスケープする必要がある引用符についてはどうですか?
スタンドアロン

8

仕様によると、http : //www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf

文字列は、引用符(U+0022)で囲まれた一連のUnicodeコードポイントです。すべての文字をエスケープする必要がある文字以外の引用符内に配置することができる:引用符(U+0022)、逆斜線(U+005C)、および制御文字U+0000U+001F。一部の文字には2文字のエスケープシーケンス表現があります。

そのため、直接渡すこと0x0A0x0Cコードを書くこともできません。禁止です!仕様では、明確に定義されたいくつかのコードにU+0000toからU+001F

  • \fフォームフィード文字(U+000C)を表します。
  • \n改行文字(U+000A)を表します。

ほとんどのプログラミング言語は\引用に使用するため、エスケープ構文をエスケープする必要があります(ダブルエスケープ-言語/プラットフォーム用に1回、JSON自体用に1回)。

jsonStr = "{ \"name\": \"Multi\\nline.\" }";

3

たとえば、JSONフィールドの値を書き込むときにサーバーで文字列をエスケープし、クライアントブラウザーで値を取得するときにエスケープを解除することができます。

すべての主要ブラウザのJavaScript実装には、unescapeコマンドがあります。

例:

サーバー上:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}"

ブラウザで:

document.getElementById("text1").value = unescape(jsonObject.field1)

2

このC#関数を調べて文字列をエスケープしたい場合があります。

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
{ 
    if (s == null || s.Length == 0)  
    { 
        return "\"\""; 
    } 
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
    { 
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
        { 
            sb.Append('\\'); 
            sb.Append(c); 
        } 
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
        { 
            if (c < ' ')  
            { 
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
            }  
            else  
            { 
                sb.Append(c); 
            } 
        } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
} 

3
なぜこれが脱出するの>ですか?
2015年

0

この関数を使用して、データ内の改行やその他の文字を取り除き、JSONデータを解析しました。

function normalize_str($str) {

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "{" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);
}

echo normalize_str($lst['address']);

9
ほとんどの言語では、独自のマッピング関数を書き留めるよりも、Unicode文字列からアクセントを取り除くより良い方法があります。pythonで例えば、この質問を参照してください:stackoverflow.com/questions/517923/...
MiniQuark

差分言語で特殊文字を制御する方法はたくさんあります。
ShivarajRH 2013

2
それは一般的にそれらを取り除くのはちょっと悪いことです。それらをXML数値文字参照としてエンコードし、受信側でデコードすることをお勧めします。
Annarfych 2016年

0

JSON.stringify

JSON.stringify(`{ 
  a:"a"
}`)

上記の文字列をに変換します

"{ \n      a:\"a\"\n    }"

ここで述べたように

json stringify

この関数は、入力文字列の最初と最後に二重引用符を追加し、特別なJSON文字をエスケープします。特に、改行は\ n文字に置き換えられ、タブは\ t文字に置き換えられ、円記号は2つの円記号\に置き換えられ、円記号は各引用符の前に置かれます。


4
これは、他の8つの既存の回答を持つ11年前の質問に対するコードのみの回答です。コードを説明したり、質問の新しい側面に答えたり、時間の経過や新しいバージョンのリリースが回答に影響を与えるかどうかを説明したりすると便利です。
Jason Aller

-1

PHP 4でjson_encode(PHP 5で利用可能)をエミュレートするクラスを作成しているときに、この問題が発生しました。これが私が思いついたものです:

class jsonResponse {
    var $response;

    function jsonResponse() {
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    }

    function set($isOK, $msg) {
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    }

    function setData($data=null) {
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    }

    function send() {
        header('Content-type: application/json');
        echo '{"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '}';
    }

    function parseData($data) {
        if(is_array($data)) {
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '{' . implode(',', $parsed) . '}';
        }
        else
            return $this->parseString($data);
    }

    function parseString($string) {
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    }
}

私はここで述べられたルールに従いました。私は必要なものだけを使用しましたが、使用している言語でそれをニーズに適合させることができると思います。私の場合の問題は、私が最初に思ったような改行ではなく、/がエスケープされていないことでした。これにより、他の誰かが私が何を間違えたのかを理解していたちょっとした頭痛の種を防ぐことができます。


2
json.orgで指定された制御文字の6つの省略形は、すべての制御文字の完全なリストではありません。その結果、この関数は無効なJSONを生成する可能性があります。
Phil

-5

私はあなたの質問を理解しているように、それはあなたがあなたのコードにあなたのJSONをコピー&ペーストすることができますので、直接JSONを解析に関するものではありません-これはその後、ちょうどあなたのJSONはに直接コピーする場合であるので、場合dataObj、単一引用符とそれを包むことなく、変数(ヒント:eval==evil

var dataObj = {"count" : 1, "stack" : "sometext\n\n"};

console.log(dataObj);

弊社のサイトを使用することにより、あなたは弊社のクッキーポリシーおよびプライバシーポリシーを読み、理解したものとみなされます。
Licensed under cc by-sa 3.0 with attribution required.