ファイルの最も長い行の長さを見つける簡単な方法を探しています。理想的には、スクリプトではなく、単純なbashシェルコマンドになります。
ファイルの最も長い行の長さを見つける簡単な方法を探しています。理想的には、スクリプトではなく、単純なbashシェルコマンドになります。
回答:
wc(GNU coreutils)7.4の使用:
wc -L filename
与える:
101 filename
-L
ロケールに依存することにも注意してください。一部の文字(バイトおよびマルチバイトの両方の意味で)は、まったくカウントされない場合もあります。
wc: illegal option -- L usage: wc [-clmw] [file ...]
gwc
はcoreutils
式に含まれ、すべてのGNU coreutilsをg
プレフィックス付きでインストールします。
awk '{print length, $0}' Input_file |sort -nr|head -1
END{}
ブロックから印刷することを検討してください。
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE
awk '{ if (length($0) > max) max = length($0) } END { print max }' YOURFILE
awk 'length>max{max=length}END{print max}' file
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }' YOURFILE | wc -c
楽しさと教育を目的とした純粋なPOSIXシェルソリューション。猫を無用に使用せず、外部コマンドに分岐しません。ファイル名を最初の引数とします:
#!/bin/sh
MAX=0 IFS=
while read -r line; do
if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
< "$1"
これがないとstdinから簡単に読み取ることができます。$#
引数の数によっては、それをテストすることで両方を実行することもできます。この世界では、役に立たない猫は必要ありません。初心者は最初からそれに応じて教えられるべきです。
longest < /usr/share/dict/words
perl -ne 'print length()." line $. $_"' myfile | sort -nr | head -n 1
最長の行の長さ、行番号、内容を出力します
perl -ne 'print length()." line $. $_"' myfile | sort -n
行番号と長さを含むすべての行のソートされたリストを印刷します
.
連結演算子である-それは(長さの後にここで使用される)
$.
現在の行番号は
$_
現在のラインであります
wc -L
これまでに見た中で最善の解決策です。
wc -L
かかりましたが、3秒かかりました
wc -L
数のレコードを数えるだけです-このQは最長の行を見つけようとしていました-まったく同じではないため、これは正確な比較ではありません。
上記の例で重要な見落とし点。
次の2つの例は、展開されたタブを数えます
wc -L <"${SourceFile}"
# or
expand --tabs=8 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'
次の2つは、展開されていないタブをカウントします。
expand --tabs=1 "${SourceFile}" | wc -L
# or
awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"
そう
Expanded nonexpanded
$'nn\tnn' 10 5
すべての回答が最も長い行の行番号を与えていないように見えます。次のコマンドは行番号とおおよその長さを与えることができます:
$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
awk '{print length}' test.txt | sort -rn | head -1
。実際の行のコンテンツも必要な場合 awk '{print length,$0}' test.txt | sort -k1 -rn| head -1
これはanwserのリファレンスです
cat filename | awk '{print length, $0}'|sort -nr|head -1
楽しみのために、Powershellのバージョンを以下に示します。
cat filename.txt | sort length | select -last 1
そして、ちょうど長さを取得するには:
(cat filename.txt | sort length | select -last 1).Length
sort
filename.txtを引数として取ることができますか?その場合、sort length filename.txt | select -last 1
パイプとデータをコピーするだけのプロセスを回避するため、猫は役に立たない。
私はUnix環境で、数GBのgzip圧縮されたファイルを使用しています。レコード長2052の2 GB gzip圧縮ファイルを使用して、次のコマンドをテストしました。
zcat <gzipped file> | wc -L
そして
zcat <gzipped file> | awk '{print length}' | sort -u
時代は平均していた
117秒
109秒
約10回実行した後のスクリプトを次に示します。
START=$(date +%s) ## time of start
zcat $1 | wc -L
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
START=$(date +%s) ## time of start
zcat $1 | awk '{print length}' | sort -u
END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
awk
が、wc
バージョンが最初に実行されているバージョンのディスクブロックキャッシュのメリットを享受している(そしてディスクキャッシュをシードする)と心配になります。この引数を固定するには、10回の実行で最初に呼び出される人の順序をランダム化する必要があります。
テーマのバリエーション。
これは、ファイルで見つかった最も長い行の長さを持つすべての行を表示し、ソースに表示される順序を維持します。
FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE
だからmyfile
x
mn
xyz
123
abc
あげる
xyz
123
abc
MacOSを使用していてこのエラーが発生している場合:
wc: illegal option -- L
GNU sipmlyをインストールする必要はありません。
ファイルの最長行の文字数を取得するだけで、OS X runを使用している場合:
awk '{print length}' "$file_name" | sort -rn | head -1
このようなもの;
echo "The longest line in the file $file_name has $(awk '{print length}' "$file_name" | sort -rn | head -1) characters"
出力:
The longest line in the file my_file has 117 characters
-c -l -m -w
オプションのみがPOSIXであることに注意してください。-L
GNUismです。