約百万行のファイルが含まれています。行には、transactionid
繰り返し値を持つというフィールドがあります。私がする必要があるのは、それらを明確に数えることです。
値が何度繰り返されても、1回だけカウントされます。
ファイルのフォーマットを垣間見ることができれば、もっと簡単になります。必ずしもデータではありません。
—
ニキルマレー
ところで、あなたはそれが何回存在するかに関係なく値を1としてカウントしたいのですか、それとも発生/繰り返しの数のカウントが欲しいのですか?一度だけカウントしたい場合、異なる値はどのようにカウントされますか?あなたの質問の編集内容を確認し、通訳が正しいかどうかを確認してください。
—
ニキルマレー
@Nikhilこれは質問から明らかです
... No matter of how many times a value is repeated, it should be counted as 1. ...
OK、それから@hesseからの答えはあなたの必要をするでしょう。
—
ニキルマレー
レイテンシーでごめんなさい。インターネットに接続できませんでした。セパレータは2 | 'です フィールドはフィールド28です。使用しました。
—
Olgun Kaya
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
if句は、明らかなように日付の別のチェック用でした:)