情報を含む列をいくつかの列に分割する必要があります。
私は使用しますtstrsplit
が、同じ種類の情報は行間で同じ順序ではなく、変数内の新しい列の名前を抽出する必要があります。知っておくべき重要事項:多くの情報(フィールドが新しい変数になる)があり、それらすべてを知っているわけではないため、「フィールドごとの」ソリューションは必要ありません。
以下は私が持っているものの例です:
library(data.table)
myDT <- structure(list(chr = c("chr1", "chr2", "chr4"), pos = c(123L,
435L, 120L), info = c("type=3;end=4", "end=6", "end=5;pos=TRUE;type=2"
)), class = c("data.table", "data.frame"), row.names = c(NA,-3L))
# chr pos info
#1: chr1 123 type=3;end=4
#2: chr2 435 end=6
#3: chr4 120 end=5;pos=TRUE;type=2
そして、私は入手したいと思います:
# chr pos end pos type
#1: chr1 123 4 <NA> 3
#2: chr2 435 6 <NA> <NA>
#3: chr4 120 5 TRUE 2
それを取得する最も簡単な方法は大歓迎です!(注:dplyr / tidyrの方法を使用するつもりはありません)