あるファイルにリストされているパターンを見つけ、別のファイルで見つけたい。2番目のファイルには、コンマで区切られたこれらのパターンがあります。
たとえば、最初のファイルF1には遺伝子があります
ENSG00000187546
ENSG00000113492
ENSG00000166971
2番目のファイルF2には、これらの遺伝子といくつかの列(5列)が必要です。
region gene chromosome start end
intronic ENSG00000135870 1 173921301 173921301
intergenic ENSG00000166971(dist=56181),ENSG00000103494(dist=37091) 16 53594504 53594504
ncRNA_intronic ENSG00000215231 5 5039185 5039185
intronic ENSG00000157890 15 66353740 66353740
したがって、2番目のファイルにあるENSG00000166971遺伝子は、コンマで区切られた別の遺伝子を持っているため、grepには表示されません。
私のコードは:
grep -f "F1.txt" "F2.txt" >output.txt
それらの値の1つが存在しても、それらの値とそれに関連付けられたデータが必要です。これを行う方法はありますか?
この記事を参照してください:バッシュで別の大きなファイルからファイルの行を見つけるための最速の方法
—
codeforester
grep
デフォルトでアンカーの実装がそのパターンを固定することは可能ですか?grep -f <(echo a) <(echo 'a,b')
出力は生成されますか?