「test1.csv」があります
200,400,600,800
100,300,500,700
50,25,125,310
およびtest2.csvとそれが含まれています
100,4,2,1,7
200,400,600,800
21,22,23,24,25
50,25,125,310
50,25,700,5
今
diff test2.csv test1.csv > result.csv
とは異なります
diff test1.csv test2.csv > result.csv
どちらが正しい順序かわかりませんが、何か他のものが必要です。上記のコマンドは両方とも次のようなものを出力します
2 > 100,4,2,1,7
3 2,3c3,5
4 < 100,300,500,700
5 < 50,25,125,310
6 \ No newline at end of file
7 ---
8 > 21,22,23,24,25
9 > 50,25,125,310
差のみを出力したいので、results.csvは次のようになります。
100,300,500,700
100,4,2,1,7
21,22,23,24,25
50,25,700,5
私が試したdiff -q
し、diff -s
彼らはトリックをしませんでした。順序は関係ありません。重要なのは、違いだけを見たいということです。
grep -FvF
大きなファイルではなく小さなファイルでトリックを行いました
最初のファイルには500万行以上が含まれ、2番目のファイルには1300行が含まれています。
そのため、results.csvは〜4,998,700行になるはずです。
私も試してみましたgrep -F -x -v -f
が、うまくいきませんでした。
50,25,125,310
両方のファイルに共通です。目的の出力から削除する必要があります。