Python:文字列から\ xa0を削除しますか?
現在、Beautiful Soupを使用してHTMLファイルを解析し、を呼び出していますが、get_text()スペースを表す多くの\ xa0 Unicodeが残っているようです。Python 2.7でそれらすべてを削除し、スペースに変更する効率的な方法はありますか?より一般的な質問になると思いますが、Unicode形式を削除する方法はありますか? line = line.replace(u'\xa0',' ')別のスレッドで提案されているように、を使用してみましたが、\ xa0がuに変更されたため、代わりに "u"がどこにでもあります。): 編集:問題はによって解決されたようですがstr.replace(u'\xa0', ' ').encode('utf-8')、.encode('utf-8')何もせずに実行するreplace()と、たとえば\ xc2などの奇妙な文字が吐き出されます。誰かがこれを説明できますか?