以下と同じ形式で、分離文字のない非常に長い一連のURLがあります。
http://example.comhttp://example.nethttp://example.orghttp://etc...
各URLを新しい行に配置します。sedを使用して「http://」のすべてのインスタンスを「\ nhttp://」に置き換えることでこれを試みました
sed 's_http://_\nhttp://_g' urls.txt
しかし、セグメンテーション違反が発生します(メモリ違反)。ファイルのサイズ(100 GBを超える)が原因で、sedが何らかの制限を超えていることが推測できます。
ファイルをいくつかの小さなファイルに分割して処理することもできますが、 "http://"のインスタンスはすべてそのままにしておく必要があります。
これを行うより良い方法はありますか?