ゼロ幅のスペースが散在する非常に大きなファイルがあります。を使用して開いて編集するには時間がかかりすぎるvi
ため、を使用してキャラクターのすべてのインスタンスを削除したいと思いますsed
。問題は、キャラクターのマッチング方法がわからないことです!私が使って試してみました\u200B
、\x{200b}
。何か案は?
CentOS 5を実行している場合は、それがまったく役立つ場合。
sedのコピーは、ファイルがエンコードされるUnicodeエンコードをサポートしていますか?...そこのsedでそれを正しく行うには良い方法はおそらくありません、あなたがより良いPythonスクリプトまたはそのようなものを使用したいない場合
—
JanC
@JanC-確かに、私はPythonを使いました。ファイルはutf8でエンコードされており、何でも処理できるほど十分に標準的なようです。誰にとっても便利なように、Pythonスクリプトを以下に追加しました。
—
thetaiko