R-2つのデータフレームを連結しますか？

129

2つのデータフレームaとb：

> a
           a           b           c
1 -0.2246894 -1.48167912 -1.65099363
2  0.5559320 -0.87898575 -0.15634590
3  1.8469466 -0.01487524 -0.53098215
4 -0.6875051  0.23880967  0.01824621
5 -0.6735163  0.75485292  0.44154092


> b
           a          c
1  0.4287284 -0.3295925
2  0.5201492  0.3341251
3 -2.6355570  1.7916780
4 -1.3645337  1.3642276
5 -0.4954542 -0.6660001

以下の形式の新しいデータフレームを返すようにこれらを連結する簡単な方法はありますか？

> new
           a                   b           c
1  -0.2246894   -1.48167912106676 -1.65099363
2   0.5559320  -0.878985746842256 -0.15634590
3   1.8469466 -0.0148752354840942 -0.53098215
4  -0.6875051   0.238809666690982  0.01824621
5  -0.6735163   0.754852923524198  0.44154092
6   0.4287284                  NA -0.32959248
7   0.5201492                  NA  0.33412510
8  -2.6355570                  NA  1.79167801
9  -1.3645337                  NA  1.36422764
10 -0.4954542                  NA -0.66600006

データフレームをマージし、ヘッダーを一致NAさせbて、ヘッダーが欠落しているデータフレームの位置に挿入したいと思います。

r dataframe concatenation

— ダレン・フィッツパトリック
ソース

3

あなたはすでに試したことがあると思いますmerge()か？なぜそれはうまくいかないのですか？

— Andrie、

2

私はアンドリーではありませんでした-そうすれば、私をドウさせてくれたあなたを+1します！

— ダレンJ.フィッツパトリック

16

よくわかりません。ダレンの操作は結合ではなく、「デカルト積」はありません。むしろ、それはまっすぐな連結です。では、結合はどのように役立ちますか？

— dfrankow 2011

225

「rbind」が欲しい。

b$b <- NA
new <- rbind(a, b)

rbindでは、データフレームに同じ列が必要です。

1行目は、列bをデータフレームbに追加します。

結果

> a <- data.frame(a=c(0,1,2), b=c(3,4,5), c=c(6,7,8))
> a
  a b c
1 0 3 6
2 1 4 7
3 2 5 8
> b <- data.frame(a=c(9,10,11), c=c(12,13,14))
> b
   a  c
1  9 12
2 10 13
3 11 14
> b$b <- NA
> b
   a  c  b
1  9 12 NA
2 10 13 NA
3 11 14 NA
> new <- rbind(a,b)
> new
   a  b  c
1  0  3  6
2  1  4  7
3  2  5  8
4  9 NA 12
5 10 NA 13
6 11 NA 14

— dfrankow
ソース

9

2つを超えるデータフレームの結合を取得している場合は、Reduce(rbind, list_of_data_frames)それらを使用してすべてをまとめることができます。

— Yourpalal

1

rbindなんらかの奇妙な理由で基地から来ている場合：私が使用したrbind.data.frame

— Boern

34

plyrパッケージを試してください：

rbind.fill(a,b,c)

— Rnoob
ソース

9

単純なタスクには外部パッケージを使用しないでください。

— フェルナンド

23

rbindを喜ばせるために追加の列をハッキングするよりも明確で簡単です。これは正しい方法です。plyr仕事に適したツールを提供するような非常に一般的なパッケージを回避することは賢明ではありません。

— Jack Aidley

2

この関数は自動的に因子の併合を行います。受け入れられた答えよりもはるかに優れています。plyrひどい一般的なパッケージです。

— HelloWorld 2017年

23

あなたは関数を使うことができます

bind_rows(a,b)

dplyrライブラリから

— アダム・リー・ペレルマン
ソース

2

cbind （rbind）とは異なりfactor、文字のベクトルが存在する場合、この関数はすべての列（行）のタイプを変更しません。

— Azim

11

これは、どの列が欠落しているかを自動検出してすべてNAのsに追加した後、2つのデータセットを一緒にrbindする単純な小さな関数です。

何らかの理由で、これは返しMUCH使用してより大きなデータセットに速くmerge機能を。

fastmerge <- function(d1, d2) {
  d1.names <- names(d1)
  d2.names <- names(d2)

  # columns in d1 but not in d2
  d2.add <- setdiff(d1.names, d2.names)

  # columns in d2 but not in d1
  d1.add <- setdiff(d2.names, d1.names)

  # add blank columns to d2
  if(length(d2.add) > 0) {
    for(i in 1:length(d2.add)) {
      d2[d2.add[i]] <- NA
    }
  }

  # add blank columns to d1
  if(length(d1.add) > 0) {
    for(i in 1:length(d1.add)) {
      d1[d1.add[i]] <- NA
    }
  }

  return(rbind(d1, d2))
}

— マイク・モンテイロ
ソース

1

この小さな機能はダイナマイトです。

— Dirk

いいね。私は同じ答えを投稿したかっただけです:-)。1つの改善点：@Anton は彼の答えでNAto doubleをキャストしました。新しい列のタイプが、他のデータフレームの既存の列と同じタイプであると便利です。多分mode(d2[d2.add[i]]) <- mode(d1[d2.add[i]])。しかし、これが適切な方法かどうかはわかりません。

— daniel.heydebreck 2017

3

使用することもできますrbindが、この場合は両方のテーブルで同じ数の列を使用する必要があるため、以下を試してください。

b$b<-as.double(NA) #keeping numeric format is essential for further calculations
new<-rbind(a,b)

— アントン
ソース