Pythonツールを使用してTwitterデータを取得し、これらをJSON形式でディスクにダンプしています。ツイートのデータ文字列全体が二重引用符で囲まれているため、意図せずにエスケープされていることに気付きました。さらに、実際のJSONフォーマットのすべての二重引用符はバックスラッシュでエスケープされます。
彼らはこのように見えます:
"{\" created_at \ ":\" Fri Aug 08 11:04:40 +0000 2014 \ "、\" id \ ":497699913925292032、
どうすればそれを回避できますか?そのはず:
{"created_at": "Fri Aug 08 11:04:40 +0000 2014"....。
私のファイル出力コードは次のようになります。
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
意図しないエスケープは、後の処理ステップでJSONファイルを読み込むときに問題を引き起こします。