次のようなファイルがあります。
ID101 G T freq=.5 nonetype ANC=.1 addinfor
ID102 A T freq=.3 ANC=.01 addinfor
ID102 A T freq=.01 type=1 ALT=0.022 ANC=.02 addinfor
ご覧のように、各行にはわずかに異なる数の列があります。具体的には、列1、列2、列3、列4、および次で始まる列が必要です。ANC=
望ましい出力:
ID101 G T freq=.5 ANC=.1
ID102 A T freq=.3 ANC=.01
ID102 A T freq=.01 ANC=.02
私は通常、awkコマンドを使用してファイルを解析します。
awk 'BEGIN {OFS = "\t"} {print $1, $2, $3, $4}'
このような状況で機能するようにこのコマンドを変更する簡単な方法はありますか?
私はこのようなものがうまくいくと思います:
awk '{for(j=1;j<=NF;j++){if($j~/^ANC=/){print $j}}}'
ただし、これを編集して最初の列も印刷するにはどうすればよいですか?
i=5
ますか?