ファイルのサブセットをサンプリングするために使用できるLinuxコマンドはありますか?たとえば、ファイルには100万行が含まれており、そのファイルから1,000行のみをランダムにサンプリングしたいとします。
ランダムの場合、すべての行が同じ確率で選択され、選択された行はどれも繰り返されないことを意味します。
head
そして、tail
ではなく、ランダムにファイルのサブセットを選ぶことができます。私はいつでもそうするためにPythonスクリプトを書くことができることを知っていますが、この使用法のためのコマンドがあるのではないかと思っています。